2

Я читал, что издержки передачи между процессором и графическим процессором являются большим препятствием в достижении высокой производительности в приложениях для графического процессора или процессора. Почему это так?

Согласно программе тестирования пропускной способности Nvidia, моя пропускная способность CPU/GPU составляет от 4 до 5 Гбит / с. Это пиковая производительность, а реальная производительность, вероятно, намного ниже? Мое приложение может достигать ~ 17 Гбит / с, когда передача данных включена в измерение производительности, что значительно ниже скорости 100+ Гбит / с при измерении только вычислений на GPU без передачи данных.

1 ответ1

0

Поскольку это пропускная способность PCI-e, см. Http://en.wikipedia.org/wiki/PCI_Express.

5 Гбайт / с кажется разумным, учитывая, что в реальной системе вы не можете делать полностью параллельные передачи все время, вы должны время от времени отпускать шину для других периферийных устройств.

Пропускная способность на GPU направляется только на DRAM, а может быть, и не так (попадание в кэш внутри GPU), и поэтому намного выше.

Ответ на ваш следующий вопрос «почему не хватает пропускной способности в PCIe» в основном сводится к компромиссам цена / мощность / размер / задержка. Линия PCIe медленнее, чем 10G Ethernet, но шинные транзиверы дешевле; Система с более высокой пропускной способностью повысила бы стоимость всех плат расширения.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .