20
  • Материнская плата: GA-B85M-DS3H-A
  • Процессор: Core i5 4430
  • Оперативная память: PNY XLR8 DDR3 32 ГБ (4x8 ГБ) 1600 МГц (MD32768K4D3-1600-X9)
  • Блок питания: EVGA 500 W1 80+

Эта проблема

С установленными 32 ГБ ОЗУ система последовательно отказывает MemTest86+ 6.2. Ошибка всегда происходит во время первого прохода, и ошибки быстро увеличиваются до миллионов ошибок. Попытка запустить Windows приводит к случайным перезагрузкам и остановке ошибок (как и следовало ожидать с ошибками ОЗУ).

Что я пробовал

  • Проверьте одиночный модуль PNY 8 ГБ в разъеме DIMM1. Успешно завершает 4 прохода MemTest.
  • Проверьте один модуль PNY 8 ГБ в разъеме DIMM2. Успешно завершает 4 прохода MemTest.
  • Проверьте одиночный модуль PNY 8 ГБ в разъеме DIMM3. Успешно завершает 4 прохода MemTest.
  • Проверьте одиночный модуль PNY 8 ГБ в разъеме DIMM4. Успешно завершает 4 прохода MemTest.
  • Проверьте все четыре 8GB PNY DIMM отдельно, по отдельности, в разъеме DIMM1. Все модули успешно завершают 4 прохода MemTest.
  • Проверьте два модуля PNY 8 ГБ в разъемах DIMM1 и DIMM2. Успешно завершает 4 прохода MemTest.
  • Проверьте два модуля PNY 8 ГБ в разъемах DIMM3 и DIMM4. Успешно завершает 4 прохода MemTest.
  • Протестируйте материнскую плату с четырьмя известными исправными модулями DIMM по 2 ГБ во всех разъемах. Успешно завершает 4 прохода MemTest.
  • Поменяйте местами порядок модулей PNY DIMM в разъемах. Без изменений - ошибки MemTest по-прежнему возникают.
  • Увеличьте напряжение оперативной памяти материнской платы с 1,5 до 1,65 В. Без изменений - ошибки MemTest по-прежнему возникают.
  • Поиграйте с различными комбинациями ручных настроек ОЗУ в утилите настройки - включение / отключение профиля XMP, настройка предустановки "повышенной стабильности" и т.д. Без изменений, ошибки MemTest по-прежнему возникают.

Я думаю, что могу смело исключить плохую оперативную память и плохие гнезда оперативной памяти. Единственный случай, когда тесты MemTest не пройдены, - это если все четыре модуля по 8 ГБ установлены одновременно.

Я измерил напряжение, исходящее от блока питания, и все, что там, кажется стабильным даже при всех четырех установленных блоках.

Когда я писал это, я попробовал последний вариант ручного снижения скорости ОЗУ до 1066 МГц в BIOS. На данный момент MemTest завершил один проход и находится на втором без ошибок. (Все вышеперечисленные тесты были выполнены на собственной частоте оперативной памяти 1600 МГц.) Это может позволить мне использовать систему, хотя и с немного более медленными скоростями оперативной памяти, но это, похоже, не навсегда.

Когда бы ни возникали ошибки MemTest, они всегда возникают в одной и той же точной позиции на 64-битной адресной шине:

Bit Error Mask: 00000000FF000000

Кроме того, ошибки НИКОГДА не возникают ниже барьера 4 ГБ. Другими словами, все ошибки происходят в адресном пространстве между 4 ГБ и 32 ГБ.

Я полагаю, что это какая-то странная проблема взаимодействия или синхронизации с процессором, оперативной памятью и материнской платой, поскольку ошибки очень непротиворечивы, возникают только в одной конкретной конфигурации, кажется, что они уменьшаются за счет замедления работы ОЗУ, и встречаются только выше 4 ГБ барьера. Мой вопрос: более вероятно, что мой процессор или моя материнская плата является виновником?

Я намеревался обновить эту машину до Core i7-4790K, так что, если вероятным виновником является процессор (я знаю, что контроллер памяти находится на процессоре в этих новых моделях), то это работает хорошо, потому что я планирую обновить это все равно, но мне интересно, есть ли шанс, что сама материнская плата также может быть частью проблемы. то есть я бы не хотел тратить деньги на процессор i7 только для того, чтобы испытать точно такую же проблему и выяснить, что мне также нужно заменить материнскую плату ...

Совет?


РЕДАКТИРОВАТЬ: медленная скорость ОЗУ по-прежнему выдает ошибки, но только после того, как тест достиг третьего прохода. Я перезапустил тест с одним активным процессором, чтобы проверить взаимодействие с самим процессором.

4 ответа4

18

Не похоже, что какой-либо компонент неисправен, скорее вы используете несовместимую комбинацию.

Наличие нескольких сокетов на одной и той же шине памяти увеличивает емкость в каждой линии данных и замедляет время нарастания, что может привести к задержке переходов и неправильному определению. Это явление известно инженерам-электрикам как "раздувание".

Это еще более усложняется из-за разветвления внутри модуля памяти. Число и топология устройств DRAM в модуле, называемое "rank", будет влиять на количество модулей, которые вы можете успешно подключить параллельно.

Материнские платы сервера, поддерживающие много сокетов памяти, фактически требуют буферизованной памяти, которая использует каскадную сеть буферов для ограничения разветвления (и, следовательно, емкости), видимого каждым. Задержка вызвана самими буферами, но она увеличивается только логарифмически с количеством нагрузок, тогда как для небуферизованной памяти емкость увеличивается линейно.

Википедия обсуждает это: https://en.wikipedia.org/wiki/Memory_rank

Некоторые руководства по материнской плате на самом деле вызывают подобные вещи. Для других вы можете получить информацию из списков совместимости ОЗУ. Например, материнская плата ASUS Z170-A показывает, что двойной ранг (в руководстве называемый DS = двухсторонний) можно использовать только в двух слотах на этой плате, в отличие от возможности использовать четыре DIMM одного ранга одновременно. ,

9

Это звучит как проблема в встроенном контроллере памяти процессора.

В современных системах материнские платы на самом деле не играют роли в управлении памятью, а просто обеспечивают путь между модулями памяти и процессором. Память напрямую связана с процессором для минимизации задержки; « Северный мост », который соединяет память с процессором в старых системах, теперь является частью самого процессора. (Микропрограмма или PCH могут управлять тем, как процессор работает с ОЗУ, но не имеет смысла вызывать битовые ошибки того типа, который вы описываете, так как это в конечном счете является обязанностью процессора.) Следовательно, самое первое, что я подозреваю в такой ситуации, это неисправный IMC.

На самом деле, я был бы очень удивлен, если бы материнская плата или системная прошивка были виноваты в проблемах, с которыми вы столкнулись.

4

Я вижу некоторые плохие отзывы о BIOS на этой материнской плате. Я бы начал с проверки обновления BIOS. Никогда не экономьте на материнской плате.

1

Возможно, что ОЗУ также может быть неисправно, даже если это не так. У меня была недавняя проблема с моим домашним сервером, связанная с фатальным несчастным случаем с небольшим количеством чая со льдом ...

Я прошел весь процесс замены каждой части по отдельности (2 процессора, mobo, powersupply и 2 банка по 16 ГБ (2x8 ГБ) оперативной памяти), и все прошло нормально, когда я использовал только один банк ОЗУ с одним процессором (за исключением 1 процессор, который был тост).

Неважно, какую конфигурацию я использовал, она всегда работала, когда у меня был один ЦП и банк ОЗУ (будь то 16 ГБ или 32 ГБ ОЗУ), но когда я вставлял 2-й ЦП и разделял ОЗУ до 16 ГБ на банк не удалось загрузить сервер.

Только когда я полностью заменил один банк оперативной памяти, он, наконец, загрузился и работал правильно, и так было до сих пор.

tl; dr: Как сказал @moab в своем комментарии, вы никогда не сможете сказать наверняка, пока не протестируете каждый компонент в совместимой системе.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .