Я планирую купить рабочую станцию для параллельных вычислений при обработке тяжелых изображений (для трехмерной электронной микроскопии) под Linux. Он будет иметь 64 ядра (4 процессора AMD по 16 ядер в каждом). Также будет 3 графических процессора (Nvidia Geforce GTX 780Ti). Я хочу установить 128 ГБ ОЗУ, но я не уверен, какая конфигурация является лучшей с точки зрения производительности (скорости). Запланированные вычисления предполагают довольно большой обмен данными между процессорами / графическими процессорами и оперативной памятью. Поставщик рабочей станции предоставляет три варианта:

1: 16 x 8 ГБ 240-контактная память DDR3 SDRAM 1866 Quad Channel для настольных ПК
2: 4 x 32 ГБ DDR3 SDRAM ECC Зарегистрированная серверная память DDR3 1866 Quad Channel
3: 16 x 8 ГБ DDR3 SDRAM ECC Зарегистрированная серверная память DDR3 1866 Quad Channel

Какой из них будет наиболее эффективным? Спасибо

2 ответа2

0

У вас есть 4 процессора, каждый с четырехканальным контроллером памяти. Поэтому было бы лучше иметь одинаковое количество памяти на каждом из 16 каналов. Кроме этого, нет информации о скорости для двух ваших вариантов, поэтому их сложно сравнить.

0

Как я уже говорил, я бы предпочел использовать полностью заполненные каналы для повышения производительности, хотя позднее это сделает обновление более дорогим. С точки зрения зарегистрированных и незарегистрированных, из Википедии:

Обычно за использование зарегистрированной памяти снижается производительность. Каждое чтение или запись буферизуется в течение одного цикла между шиной памяти и DRAM, поэтому зарегистрированное ОЗУ может рассматриваться как работающее на один такт за эквивалентной незарегистрированной DRAM.

Однако, как вы увидите (и как уже упоминалось в этой статье), на самом деле все не так просто. Бывают случаи, когда незарегистрированная память в многоканальной установке может видеть уменьшенную пропускную способность памяти.

Вы также должны учитывать причину, по которой в зарегистрированной памяти обычно (не всегда) есть ECC, поэтому из соображений точности это может быть полезно, особенно для большого количества вычислений. Без возможности тестирования я бы, вероятно, по умолчанию выбрал 16x DDR3 в качестве хорошего компромисса.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .