Я читал, что издержки передачи между процессором и графическим процессором являются большим препятствием в достижении высокой производительности в приложениях для графического процессора или процессора. Почему это так?
Согласно программе тестирования пропускной способности Nvidia, моя пропускная способность CPU/GPU составляет от 4 до 5 Гбит / с. Это пиковая производительность, а реальная производительность, вероятно, намного ниже? Мое приложение может достигать ~ 17 Гбит / с, когда передача данных включена в измерение производительности, что значительно ниже скорости 100+ Гбит / с при измерении только вычислений на GPU без передачи данных.