Есть два основных фактора.
Во-первых, вы совершенно правы, что оперативная память самая большая. Поскольку графический процессор должен разделять пропускную способность ОЗУ с процессором, он просто не может использовать почти столько же ОЗУ. Хуже того, он использует оперативную память, которая не оптимизирована для использования графического процессора, поэтому центральный процессор, графический процессор и RAMDAC борются за одинаковую пропускную способность, а путь между графическим процессором и оперативной памятью гораздо менее прямой.
Во-вторых, выделенный графический процессор может иметь больше вычислительных блоков. На одном кристалле можно разместить только столько транзисторов, а выделенный графический процессор может выделить больше места для вычислительных блоков графического процессора.
Я не уверен, что вы имеете в виду под "меньшей задержкой". Если вы думаете, что это означает, что связь между процессором и графическим процессором более эффективна, то в принципе это не так. Современные графические карты имеют отличный путь, который позволяет процессору записывать данные непосредственно в графический процессор (и его оперативную память) через быстрые буферы. Выделенный графический процессор имеет больше места для таких буферов, потому что он не разделяет пространство памяти с процессором и его кэшами.
При отсутствии ОЗУ графического процессора для интегрированных решений обычно требуется "массовая" связь между процессором и графическим процессором, чтобы проходить через обычное ОЗУ, что является менее эффективным. Процессор не может передавать объемные данные напрямую в графический процессор. Это потребовало бы от них работы в режиме ожидания, что привело бы к бесполезному расходу ресурсов, потому что они никогда не имели бы одинаковую скорость. И что GPU может делать с такими объемными данными, кроме записи их в RAM? Это не значит, что у него есть какое-то другое место, чтобы хранить его, пока он обрабатывает его.
Обмен данными между процессором и графическим процессором в основном включает в себя написание информации для передачи в каком-то месте, где оба компонента могут ее получить, а затем указание графическому процессору обработать информацию. С интегрированным решением, это должна быть обычная оперативная память, которая уже является ограничивающим фактором. С выделенным решением, это может быть ОЗУ графического процессора, что гораздо более эффективно.