Надеюсь, что кто-то может дать мне представление о том, как решить эту проблему, за исключением замены всей машины.
Предпосылки / история
У меня ASUS P8Z68-M Pro MB / G620 CPU / 16 ГБ DDR3 1333 МГц CL 9-9-9-24 DRAM. Системе около 4 лет, и она имела ошибки памяти около 2 лет назад. Я купил новую оперативную память, а RMA оставил плохой набор для запасных.
На прошлой неделе я заметил некоторые странные ошибки во FreeNAS (которые происходили в течение некоторого времени), поэтому я снял машину и запустил Memtest86+ v4.2 и обнаружил легко воспроизводимую ошибку в одном из модулей DIMM по адресу 0019bd12878.
Первый раз при сбое памяти произошел сбой 1, бит ошибки теста 2 был 00010000 - ожидаемый бит был равен 0, но 1 был прочитан.
Ошибка второго раза была на проходе 1, тест 1 - бит ошибки был 00020000, снова ожидалось 0, одно чтение.
Проблему было очень легко воспроизвести - поместите неисправный модуль DIMM в другой слот для двух разных тестов - оба раза не получилось.
Эта проблема
Я заменил плохую оперативную память резервной оперативной памятью первого RMA. Новый Патриот VIPER DDR3 1600 МГц CL9-9-9-24, который я настроил для работы на частоте 1333 МГц в BIOS. (G620 не будет принимать более высокий множитель.) Сделал XMP в BIOS, а затем установил тактовую частоту на 1333.
У меня сейчас странная ситуация с заменой.
Это работало хорошо в течение чуть более 24 часов, затем я начал получать несколько ошибок в 0004d2fxxxx. (Диапазон адресов - программа показывает только несколько на экране, и у меня нет подключенного принтера или какого-либо другого способа получения дополнительной информации.)
Не снимая машину, я изменил настройки Memtest86+ для выборочного тестирования области, сообщающей об ошибках, и очень быстро получил около 4500 ошибок. Все ошибки, о которых сообщалось в тесте 8 "Случайные шаблоны"
Когда я попытался воспроизвести и локализовать проблему, потянув один из двух модулей DIMM, ошибки прекратились. Таким образом, цикл питания и / или повторная установка другого модуля DIMM устранили проблему.
Я вернулся к исходной конфигурации и до сих пор без ошибок работал более 37 часов. Что снижает вероятность возникновения простой тепловой проблемы.
Вопросы
- Любые предложения о том, как я могу локализовать эту проблему?
- Какие-нибудь другие тестовые программы, которые я должен запустить, могут помочь?
- Скорее всего, это проблема памяти, проблемы с материнской платой (или даже проблема с чипом процессора или блоком питания)?
Любые предложения или предложения будут наиболее цениться.
Благодарю.