Что нужно для того, чтобы GPU полностью подпитывался процессором?
Сравнение их флопов / с достаточно?
Например, если бы мне удалось создать очень старый (Pentium-3) процессор с одним из графических процессоров Nvidia-Fermi, он не смог бы снабжать графический процессор данными в секунду. Каковы критерии для соответствия CPU с GPU, когда требуется OpenCL или аналогичная работа?
Конечно, RAM и BUS будут выбраны одинаково, но как именно?
Предположим, что каждое ядро GPU будет вычислять sqrt, деление и сложение 100 раз за каждую итерацию.
Благодарю.
Редактировать: После работы с opencl в течение многих лет, кажется, что это в основном зависит от алгоритма, а затем от оптимизаций связи (чтение / запись или отображение / отмена отображения) и значений пиковых вычислений gpus и его способности выполнять чтение + запись + вычисления в одном и том же отрезке времени. Аппаратное обеспечение просто умножает уровень производительности этих параметров (те, которые могут экспоненциально изменять производительность).