3

У меня новый игровой ноутбук, который вылетает каждый раз, когда я запускаю Linux. Если я запускаю Linux изначально, он полностью зависает (включая курсор мыши) после, казалось бы, случайного периода. Если я запускаю Linux в VMWare Player под Windows 8.1, Linux в конечном итоге зависает точно так же, но Windows также аварийно завершает работу и отображает синий экран смерти (BSOD) после небольшой задержки. BSOD всегда говорит MACHINE_CHECK_EXCEPTION, а журнал BugCheck указывает код 0x9c.

Варианты Linux, которые я попробовал:

  • Ubuntu MATE 15.10 64-bit
  • Ubuntu 15.04 64-bit
  • Ubuntu MATE 15.04 64-bit
  • Ubuntu MATE 14.04.2 64-разрядная версия
  • Ubuntu MATE 14.04.2 32-разрядная версия

Кроме этих более или менее случайных зависаний, Linux работает нормально - и я могу использовать его в течение многих часов между сбоями.

Я предполагал, что это аппаратная проблема, но проблема в том, что я не могу заставить Windows аварийно завершить работу, если я также не использую Linux (в ВМ). Я пытался одновременно запускать все доступные приложения (около 30), одновременно проигрывая видео с YouTube, а также запускать приложения для стресс-тестирования, такие как Prime95. Я также сделал несколько игр с большим количеством графики.

Я запустил "Средство диагностики памяти Windows" и другие тесты памяти без видимых проблем.

Можно предположить, что Linux каким-то образом использует функции процессора, которые Windows не использует, но неясно, почему это может вызвать случайные сбои оборудования.

Как я могу окончательно доказать, что у меня неисправное оборудование (или нет)?


РЕДАКТИРОВАТЬ: Кажется, мне немного повезло, исправляя проблемы с Linux, отключив некоторые функции в BIOS. С тех пор я не видел сбоев. Изменения, которые я сделал изначально (только на основе догадок):

  • Технология виртуализации: отключена
  • Быстрая загрузка: отключено
  • SpeedStep: отключено
  • Таймер задержки PCI: 64 такта (было 32)

Основываясь на последующем тестировании их вариантов, очевидно, что и VT, и SS должны быть отключены, но наверняка, по крайней мере, SpeedStep. Это облегчает изоляцию сбоев как основанную на аппаратном дефекте? ...Или это может быть программная проблема в Ubuntu/Linux?


Чтобы сделать мой вопрос более четким: я на самом деле не спрашиваю пути решения проблемы, хотя это было бы здорово в теории. Что мне действительно нужно, так это способ изолировать и воспроизвести эту проблему под Windows без использования Linux. Я работаю с предположением, что у меня плохой юнит, и мне просто нужен способ доказать это. Помните, что когда я запускаю Linux, машина выходит из строя (исключая изменения BIOS, упомянутые выше), поэтому это не может быть решено простым обновлением драйверов Windows.

Короче говоря: зная, что Linux вызывает сбои, есть ли какой-нибудь другой стресс-тест, который я могу запустить в Windows, который может вызвать тот же тип сбоев? Или это известная ошибка в Linux?

Обратите внимание, что мой процессор - новый i7-5700HQ (микроархитектура Broadwell).

Также обратите внимание: я не верю, что это вызвано сильным перегревом. Машина оснащена дополнительным вентилятором, который можно включить вручную, и сбои, похоже, не связаны с большими нагрузками.


ОБНОВЛЕНИЕ: проблемы с естественным запуском Linux были решены путем установки обновления BIOS, которое стало доступно через несколько месяцев после того, как я опубликовал вопрос. Я также сейчас использую Ubuntu MATE 15.10, но я не думаю, что это имеет значение, так как это также не удалось до обновления BIOS. Я думаю, что в общем и целом, система не была совместима с Linux (или наоборот), как это было на момент выпуска.

Я не возвращался и не проверял проблему с виртуальной машиной, так как теперь мне это не нужно, поскольку я могу работать с Linux на родном языке, а также перешел с Windows 8.1 на Windows 10, так что это точно не яблоки. тест на яблоки в любом случае.

3 ответа3

1

добавьте libata.force = noncq в параметр загрузки grub. Работает как шарм. Моя проблема заключается в видеодрайверах, не работающих в виртуальной машине, а на самом деле двойной загрузки.

1

От service.msicomputer.com:

Почему я получаю BSOD MACHINE_CHECK_EXCEPTION?

Если при открытии любых приложений Office 2016, определенных игр и программного обеспечения виртуального рабочего стола вы видите синий экран, показывающий BSOD "MACHINE_CHECK_EXCEPTION" или "CLOCK_WATCHDOG_TIMEOUT". Это вызвано ошибкой в микрокоде, затрагивающей только процессоры Broadwell (5-го поколения), и она устраняется путем обновления микрокода с помощью обновления BIOS из версий, перечисленных ниже.

...

Последнее обновление: 30 сентября 2015 г.

1

Это аппаратная проблема, 9C параметры имеют разные значения в зависимости от типа вашего процессора. Чаще всего это происходит из-за перегрева, из-за неисправности аппаратного обеспечения - процессора, оперативной памяти, блока питания и т.д. Выдвижение аппаратного обеспечения сверх его возможностей, таких как разгон, также может привести к этой ошибке.

Проверьте настройки оборудования в вашем BIOS, начиная с оперативной памяти. Убедитесь, что нет перегрева или разгона.

Также попробуйте удалить / не устанавливать программы, поставляемые с вашей материнской платой.


Если это не решит проблему, попробуйте еще несколько шагов:

  1. Убедитесь, что машина достаточно охлаждена. Если есть какие-либо сомнения, откройте боковую часть корпуса ПК - если возможно - (помните о любых соответствующих условиях гарантии!) и направить вентилятор прямо на материнскую плату. Это исключит большинство (нехватка) проблем охлаждения.

  2. Обновите все драйверы, связанные с оборудованием: видео, звук, RAID (если есть), сетевую карту ... все, что взаимодействует с частью оборудования. В любом случае, рекомендуется запускать последние версии драйверов.

  3. Обновите BIOS материнской платы в соответствии с инструкциями производителя. На их веб-сайте должны быть представлены подробные инструкции относительно бренда и конкретной модели.

  4. Попытка (стресс) протестировать те аппаратные компоненты, которые могут быть искусственно пройдены. Наиболее очевидными примерами являются RAM и HDD. Для оперативной памяти используйте встроенную диагностику памяти (запустите MDSCHED) или стороннюю утилиту memtest86, чтобы выполнить многочасовое тестирование. Для жестких дисков проверьте, не обнаруживает ли CHKDSK /R какие-либо проблемы на диске (ах), особенно в "поврежденных секторах". Ненадежное ОЗУ, в частности, смертельно опасно для программного обеспечения, и все, кроме 100% чистых результатов теста памяти, является поводом для беспокойства. К сожалению, даже 100% ясный результат от диагностических утилит не гарантирует, что в ОЗУ нет дефектов - только то, что ни одна из них не была обнаружена во время тестовых прохождений.

  5. Очистите и аккуратно удалите пыль изнутри машины. Переустановите все разъемы и модули памяти. Используйте баллончик со сжатым воздухом для максимально возможной очистки разъемов RAM DIMM.

  6. Если ничего не помогает, начните удалять элементы оборудования один за другим в надежде, что виновником является нечто несущественное, и его можно удалить. Очевидно, что этот тип тестирования намного проще, если у вас есть доступ к эквивалентным компонентам для выполнения перестановок. В вашем случае, RAM и HDD, вероятно, можно поменять местами.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .