В последнее время я изучал вычислительные шейдеры в Unity3D, и я мог внезапно выполнять гораздо больше вычислений на графическом процессоре в секунду, чем на центральном процессоре, при условии, что я мог записать их в задачи, которые выполняются параллельно со многими потоками, выполняя одну и ту же операцию в параметризованном путь.

Тем не менее, графический процессор разделяет память с экраном, а не с процессором, что приводит к задержке при передаче большого количества данных между процессором и графическим процессором, а также разделяет пространство с вашим экраном, которое, как правило, намного меньше памяти процессора.

Мой рабочий стол здесь - это i7 INUC, который имеет 16 ГБ памяти и 1 ТБ SSD, в то время как графический процессор представляет собой интегрированный Intel 650 с гораздо меньшим объемом памяти, хотя он может совместно использовать некоторую память с процессором.

Если я захочу расширить графический процессор, мне придется купить внешний графический процессор Thunderbolt 3. Они довольно дорогие, я видел выпуск Sonnet для разработчиков, который стоит около 430 долларов США и включает RX 580 с около 8 ГБ оперативной памяти, которая, конечно, все еще должна делить память с экраном вместо основной памяти ЦП.

Поэтому меня интересует, могут ли существовать системы с отдельным математическим процессором для параллельных вычислений, например, с графическим процессором, который мог бы разделять память с основным процессором?

Возможно, есть системы, которые уже работают, или способы расширить мою нынешнюю систему?

Это по существу не оставило бы времени для переноса операций. Раньше они делали математические сопроцессоры в 386 и 486 дней, конечно, это не совсем то же самое.

Кстати, меня беспокоит не игра, я в какой-то момент был разработчиком хобби-игр, но затем я захотел понять квантовую физику, инженерию, дифференциальные уравнения и другие математические и научные занятия.

1 ответ1

0

Да, такие системы существуют, но не так, как вы, вероятно, думаете. Большинство суперкомпьютеров на самом деле работают таким образом, у них есть горстка того, что вы обычно называете процессорами, обычно называемыми процессорами ввода-вывода, и огромное количество того, что вы называете математическими процессорами, которые обычно называют процессорами приложений.

Примеры оборудования, используемого для этой цели в качестве процессоров приложений:

  • Платформа Intel MIC, также классически известная как Xeon Phi. Это устройства на базе x86 (большинство моделей представляют собой полноразмерные карты PCI-e двойной ширины, хотя некоторые модели были выпущены в виде микросхем с разъемами) с двести или более потоков исполнения. Многие крупные суперкомпьютеры в основном построены на них, хотя вы можете получить отдельные карты от старшего поколения за несколько тысяч долларов в некоторых местах онлайн.
  • Платформа NVIDIA Tesla. Они возникли как простые гиперспециализированные варианты их эквивалентных графических процессоров Quadro, модифицированные, чтобы не иметь видеовыходов, и оптимизированные для необработанной пропускной способности вычислений FP вместо рендеринга. В настоящее время они в основном являются полнофункциональными графическими процессорами, но все же сосредоточены на необработанной вычислительной мощности, а не на рендеринге. Они довольно легко доступны в продаже, но имеют такие же высокие цены.
  • Платформа AMD FireStream. Подобная история с NVIDIA Tesla, за исключением FireStream, по сути вымерла почти десять лет назад. Вы все еще можете найти карты в некоторых местах, часто за довольно дешевую, но они не очень мощные по сегодняшним меркам.

Различные другие компании имеют аналогичные предложения одного за другим. Например, платформа IBM Watson представляет собой законченную систему, построенную на этом принципе, за исключением того, что каждый отдельный процессор является функционально независимой системой.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .