4

В настоящее время я изучаю CUDA, и я продолжаю сталкиваться с такими фразами, как

«Графические процессоры имеют выделенную память, пропускная способность которой в 5–10 раз превышает пропускную способность памяти процессора»

Смотрите здесь для справки на втором слайде

Теперь, что на самом деле означает пропускная способность? В частности, что подразумевается под

  • пропускная способность процессора
  • пропускная способность графического процессора
  • Пропускная способность слота PCI-E, установленного на материнской плате.

Мои знания в области компьютерной архитектуры очень плохие, поэтому, если кто-то может дать очень простое объяснение этих терминов, это будет действительно полезно.

Мое очень ограниченное понимание пропускной способности - это максимально возможное количество гигабайт, которое может передаваться в секунду от ЦП к ГП. Но это не объясняет, почему нам нужно определить три типа пропускной способности.

3 ответа3

2

Аналогия:

Общая аналогия с пропускной способностью - шоссе. Чем больше полос движения, и чем быстрее едут машины, тем больше машин может ехать по шоссе за раз.

Используя грузовики вместо автомобилей, представьте, что вам нужно перевезти кучу товаров или почты из одного города в другой. Если у вас есть однополосная автомагистраль, то по ней может проехать только одна линия грузовых автомобилей, что позволит сократить количество пересылаемых товаров, и, следовательно, потребуется больше времени для их прохождения. И наоборот, если у вас 10-полосная дорога, но каждый грузовик движется с очень низкой скоростью, все равно требуется много времени, чтобы доставить все.

А теперь представьте, что вместо доставки в следующий город, вам нужно доставить отца. Чтобы доставить товар из этого города в другую страну, ему нужно проехать через несколько городов, и между каждым городом есть разные автомагистрали; некоторые узкие, некоторые широкие, некоторые в гору, некоторые в гору и т. д. Если дорога из города 1 в город 2 идеальна, как и дорога из города 3 в город 4 (пункт назначения), но дорога между городами 2 и 3 это ужасно, тогда это становится узким местом. Это приводит к тому, что дорога между 3 и 4 используется недостаточно и замедляет общее время доставки.

Заявка:

Вернувшись в компьютерную область, получение данных из одного места в другое - та же самая ситуация. У вас есть устройства, такие как процессор, графический процессор и оперативная память (города), а также кабели и шины (дороги, не путать с автобусами, хотя это все еще работает). Такое устройство, как ЦП, может обрабатывать и выводить данные с определенной скоростью, которую можно назвать пропускной способностью, хотя на самом деле никто не называет это так. Скорее, пропускная способность обычно относится к путям, по которым идут данные. Когда у вас есть одно устройство, выплевывающее данные, которые нужно отправлять куда-то еще. Пропускная способность - это количество (число полос) и скорость (скорость грузовых автомобилей), через которые могут передаваться данные.

Объяснение по конкретному вопросу:

В случае, если вы имеете в виду, то, что они имеют в виду под графическими процессорами, имеют выделенную память, в которой пропускная способность памяти ЦП в 5–10 раз больше, чем пропускная способность самого ЦП или ГП, а скорее пропускная способность, через которую данные передаются между ними и обратно. устройства и связанные с ними воспоминания. В частности, шина, по которой данные проходят между ЦП и ОЗУ основной системы, имеет меньшую пропускную способность, чем шина, по которой данные проходят между графическим процессором и ОЗУ на видеокарте. Это связано с двумя факторами: шириной и скоростью.

Сторона графического процессора:

Ширина шины между графическим процессором и видео-ОЗУ в наши дни часто составляет 128 бит, потому что видео-ОЗУ встроено в тот же адаптер, что и графический процессор. То, что оба компонента собраны одной и той же компанией, означает, что они могут тесно интегрировать GPU и видео-RAM таким образом, чтобы обеспечить чрезвычайно высокую передачу между ними. Кроме того, видео-ОЗУ в наши дни, как правило, является специализированной памятью GDDR3, что означает, что она может очень быстро получать (читать / записывать) данные. Наконец, GPU является специализированным процессором, который в силу характера графического программирования может выполнять все виды безумных арифметических операций на невероятно высоких скоростях.

Сторона процессора:

С другой стороны, шина между ЦП и ОЗУ системы обычно только 64-битная. Для этого есть множество причин, но совместимость, как правило, является основным ограничивающим фактором. Также помните, что системы обычно создаются с использованием компонентов из разных источников. Один производитель делает ЦП, а другой (или два, или три) - ОЗУ, а третий - материнскую плату, на которой лежит шина. Невозможно заранее узнать, какие компоненты будут присутствовать в системе (какой процессор? какие виды ОЗУ? какая из бесчисленных моделей mobo?) поэтому они должны соответствовать стандартам, которые часто сводятся к наименьшему общему знаменателю. Если один из модулей ОЗУ медленнее, чем другие, все они должны уменьшить свою скорость, чтобы приспособиться к медленному. Если материнская плата может обрабатывать только 400 МГц ОЗУ, то память 800 МГц должна работать с половинной скоростью, и так далее. Все эти факторы ограничивают общую пропускную способность между процессором и системным ОЗУ. ОЗУ само по себе, даже если DDR3 все равно будет работать медленнее, чем специализированное видео-ОЗУ. Наконец, процессор является процессором общего назначения по сравнению с графическим процессором, и поэтому в целом он будет работать медленнее.

Резюме:

Таким образом, слайд ссылается на тот факт, что процессор и память видеокарты как единое целое значительно превосходят процессор и память системы как единое целое.

0

Думайте о пропускной способности как диаметр водопровода. Чем шире водопроводная труба, тем больше воды может проходить через секцию за единицу времени. Таким образом, чем больше пропускная способность устройства, тем больше данных оно может передавать за единицу времени.

-1

Пропускная способность просто означает, сколько данных ваше устройство может передавать за раз.

Вам не нужно определять три разные полосы пропускания, это просто означает, что каждое соединение в вашей системе имеет полосу пропускания, и каждая из этих линий может быть узким местом для чего-либо.

Например:

242 МБ / с означает, что он может передавать 242 МБ в секунду. Теперь, если у вас есть приложение, которое требует много операций с памятью на нагрузках ОЗУ, вы испытываете узкое место из-за пропускной способности вашей памяти, даже если ваш ЦП, вероятно, может вычислить работу быстрее.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .