Что нужно для того, чтобы GPU полностью подпитывался процессором?

Сравнение их флопов / с достаточно?

Например, если бы мне удалось создать очень старый (Pentium-3) процессор с одним из графических процессоров Nvidia-Fermi, он не смог бы снабжать графический процессор данными в секунду. Каковы критерии для соответствия CPU с GPU, когда требуется OpenCL или аналогичная работа?

Конечно, RAM и BUS будут выбраны одинаково, но как именно?

Предположим, что каждое ядро GPU будет вычислять sqrt, деление и сложение 100 раз за каждую итерацию.

Благодарю.

Редактировать: После работы с opencl в течение многих лет, кажется, что это в основном зависит от алгоритма, а затем от оптимизаций связи (чтение / запись или отображение / отмена отображения) и значений пиковых вычислений gpus и его способности выполнять чтение + запись + вычисления в одном и том же отрезке времени. Аппаратное обеспечение просто умножает уровень производительности этих параметров (те, которые могут экспоненциально изменять производительность).

2 ответа2

2

Единственного ответа не существует, здесь задействовано гораздо больше факторов, так как простая подача информации также будет зависеть от того, что будет выполнять стоящая перед вами задача.

Короче говоря, желательно несколько ядер с высокой тактовой частотой.

2

Как отметил Лукас Кауфман, это зависит от вашей заявки.

Если вам нужно загружать с жесткого диска большие объемы данных графического процессора без какой-либо предварительной / последующей обработки на ЦП, то ЦП практически не имеет значения. Если до / после / во время обработки данных на GPU требуется интенсивная обработка на CPU, то CPU может стать ограничивающим фактором.

Несколько практических правил:

  • Ваш ЦП должен иметь как минимум N+1 ядер, где N - количество графических процессоров.

  • У вас должно быть как минимум столько же ОЗУ, сколько у всех ваших графических процессоров.

  • Ваша шина PCI-Express должна быть последней версией, поддерживаемой вашим графическим процессором (обратите внимание, что на некоторых материнских платах, например, с 2 слотами PCI-Express каждый может работать со скоростью x16 , но при совместном использовании каждый ограничен x8). В конце концов, PCI-Express является наиболее распространенным узким местом для графических процессоров.

  • Если вам нужен выходной видеосигнал из вашей коробки, подумайте о покупке дешевой карты для этой цели. Чтобы избежать каких-либо сложностей с драйверами, придерживайтесь того же поставщика, что и ваши карты с ограниченным числом.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .