4

Таким образом, после 3 лет использования новой версии Windows 7 x64 я должен перейти на Windows 10 по причинам, связанным с работой.

Я загрузил последний образ сборки Windows 10 Pro (1803) от Microsoft и использовал Rufus 3.1 для создания загрузочного флеш-диска.

Я сделал новую установку на моем SSD (отформатировал его ранее) и после нескольких дней использования компьютера я начал получать случайные BSOD. Около 1 или 2 в день.

Ошибка BSOD: MEMORY_MANAGEMENT или ATTEMPTED_WRITE_TO_READONLY_MEMORY.

Вещи, которые я пробовал:

  • Запустите 2 этапа диагностики памяти Windows. Нет ошибок
  • Запустите sfc /scannow . Нет ошибок
  • Обновлены драйверы графического процессора до последней версии (Nvidia Geforce GTX 970)
  • Обновлен BIOS до последней версии (с 0802 до 0803 на ASUS Z-97E)

Я мог иметь всего пару BSOD за 3 года Windows 7, так что я не думаю, что это проблема, связанная с оборудованием. BSOD начались сразу после новой установки Windows 10.

Как открыть MEMORY.DMP, сгенерированный Windows, и что я там смотрю, чтобы увидеть, что вызывает BSOD?

Что-нибудь еще я могу попробовать?

ОБНОВЛЕНИЕ Я открыл C:\MEMORY.DMP с WinDbg x64, и вот результат:https://pastebin.com/B2pS9VZt

ОБНОВЛЕНИЕ 2 У меня только что был другой BSOD. На этот раз это было SPECIAL_POOL_DETECTED_MEMORY_CORRUPTION .
Дамп здесь: https://pastebin.com/0hckXpqP

ОБНОВЛЕНИЕ 3 файла Minidumps

ОБНОВЛЕНИЕ 4
Я запускаю memtest всю ночь и у меня много ошибок. Я предполагаю, что у меня есть неисправная RAM. Мы уверены, что это неисправное ОЗУ? Это будет исправлено, как только я заменю это правильно? Нет способа узнать, какие палки / ы неисправны? Нужно удалить их и снова запустить memtest, чтобы узнать какой?
Вот результаты: http://ancient-name.surge.sh/

3 ответа3

10

Наиболее вероятная причина этого типа сбоя - дефектная память. Как предполагает harrymc, в первую очередь нужно запустить программу тестирования памяти, такую как Windows Memory Diagnostic (входит в Windows), оригинальный MemTest86 (поддерживаемый PassMark Software) или Memtest86+ с открытым исходным кодом. (Я добавил этот раздел для других читателей, которые могут столкнуться с подобными проблемами, но не пробовали тестирование памяти.)


Автор вопроса может пропустить этот раздел. Это сохраняется для справки другими читателями.

Если тест памяти пройден, возможно, у вас неисправный процессор.

Встроенный в процессор контроллер памяти (IMC) может иногда вызывать проблемы с памятью. Простые операции с памятью, такие как чтение данных из определенных областей памяти, могут работать нормально, но способность процессора выполнять основные операции по управлению памятью, включая виртуальную память, не тестируется программами тестирования памяти.

Другая возможность - неисправный кеш. Кэши - это небольшие объемы памяти внутри процессора, используемые для ускорения доступа к памяти. Хотя ваш процессор должен уметь обнаруживать ошибки в кеше (и генерировать исключение проверки компьютера, когда это происходит, вызывая WHEA_UNCORRECTABLE_ERROR BSOD), данные в кеше не могут быть повреждены и вызвать повреждение памяти, если сам процессор не заметит. Это также не будет обнаружено программным обеспечением для тестирования памяти.

Чтобы проверить IMC, загрузите программу диагностики процессора Intel и запустите тест IMC. Чтобы проверить кэши процессора, загрузите Prime95 и запустите небольшой тест пыток FFT (ваш процессор может сильно нагреваться или вентиляторы могут работать громко; это нормально). Если какой-либо тест не пройден, вам, вероятно, придется заменить процессор. (Я предполагаю, что процессор и память не разогнаны и не работают иным образом за пределами спецификаций.)


Поскольку вы запустили тест памяти и обнаружили ошибки, должно быть совершенно очевидно, что один или несколько модулей памяти необходимо заменить. Я могу почерпнуть больше информации из отчета, который вы опубликовали.

Ошибки возникают в одной конкретной области памяти, около 0x19BDD79F0, что ограничит проблему одним модулем. Адрес предполагает, но не подтверждает, что проблема в одном из модулей памяти Patriot.

Поскольку память в большинстве систем, в том числе и у вас, работает лучше всего в парах, попробуйте удалить оба модуля любого бренда и повторно запустить тест. Если это не сработает, переустановите удаленные модули и удалите другую пару. Если проблема не устранена, вы можете нормально пользоваться системой, пока не получите сменные модули памяти.


Следует отметить, что Windows 10 использует более продвинутые методы управления памятью, включая сжатие виртуальной памяти, чтобы максимизировать производительность в системах с ограниченной памятью. Хотя ваша система имеет 16 ГБ памяти, Windows по-прежнему будет сжимать данные в памяти по умолчанию (мой рабочий стол имеет 32 ГБ и здесь ничем не отличается). Ошибки памяти легко обнаруживаются во время сжатия и распаковки данных и немедленно приводят к сбою операции, вызывая сбой системы. Ошибки памяти, влияющие на несжатое приложение или другие данные, могут "просто" привести к сбоям приложения или поврежденным файлам (хотя это все же может привести к сбоям ОС). По этой причине Windows 10 более чувствительна к ошибкам памяти, чем предыдущие версии Windows.

3

В мини-дампах я вижу, что у вас также было условие сбоя SPECIAL_POOL_DETECTED_MEMORY_CORRUPTION. Я также отметил, что все ваши сбои происходят в ядре или внутри HAL, но не внутри какого-либо драйвера устройства, так что проблема не в конкретном неисправном устройстве.

Поэтому очень вероятно, что ваша память неисправна. Windows 10 может использовать дефектную часть оперативной памяти, которая раньше не использовалась.

Сначала посмотрите на Event Viewer, чтобы увидеть, содержит ли он какую-либо полезную информацию.

Тогда я предлагаю запустить MemTest86 :

MemTest86 - это оригинальное бесплатное программное обеспечение для тестирования памяти на компьютерах x86. MemTest86 загружается с флэш-накопителя USB или компакт-диска и проверяет оперативную память компьютера на наличие сбоев, используя серию комплексных алгоритмов и тестовых шаблонов.

Вы также можете попробовать загрузиться с подмножеством ваших флешек, соблюдая порядок, указанный для вашей материнской платы, чтобы найти плохую флешку.


Примечания о ваших результатах MemTest86 : У вас есть тысячи ошибок. Тесты адресации памяти пройдены, поэтому проблема не в контроллере памяти. Ошибки связаны с самой оперативной памятью, где сохраненные данные неверны при чтении. Это говорит о том, что, по крайней мере, одна из ваших флешек плоха, и проблема не в процессоре или материнской плате.

Что ты можешь сделать

Вы можете взять палочки и запустить MemTest86 на подмножестве. Ваша материнская плата - Asus Z97-E, которой нужны как минимум две флешки в DIMM_A1 и DIMM_B1. Следующая диаграмма со страницы 1-7 руководства:

образ

Вставка любых двух палочек одного и того же производителя и тестирование сузят поле до палочек Corsair или Patriot. Если вы знаете две палочки, из которых только одна (надеюсь) плохая, вы можете попробовать смешать палочки разных производителей. Их спецификации кажутся идентичными, так что это может сработать.

Также возможно, что для MemTest86 достаточно будет вставить только одну флешку в DIMM_A1. Диаграмма из руководства неясна и может указывать на то, что одна флешка может работать либо в DIMM_A1, либо в DIMM_B1. Даже если это не так, иногда не рекомендуемые конфигурации могут все еще работать, в зависимости от материнской платы.

3

По дампам ошибка исходит из двух источников: IRQ и инструкция int 3. IRQ означает, что какой-то драйвер был вызван прерыванием и он неисправен - это означает, что вам нужно проверить все драйверы, которые вы установили в этой системе, чтобы один из них был неисправен.

Int 3 - это прерывание отладчика, что означает, что есть некоторое программное обеспечение (также оно может быть драйвером), которое вызывает точку останова (int 3) там, где ее не должно быть. Это может произойти для отладочной версии программного обеспечения.

Чаще всего такие BSOD исходят из неправильно написанных драйверов, так что это источник, где я буду искать проблему. Удалите все драйверы (или заново установите операционную систему) и проверьте их один за другим. Между каждым драйвером увеличьте использование системы (например, сделайте 7-zip тест), и вы найдете неисправный.

Другим источником проблемы может быть разогнанный процессор или оперативная память, чтобы проверить это, настройте систему в BIOS на использование только номинальных значений предоставленного оборудования. Не больше.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .