6

У меня есть перепрофилированный ПК, работающий в качестве сервера. Он был собран в начале 2014 года и содержит Intel Core i7-4770 на Gigabyte Z87-HD3. Он работал довольно надежно до начала 2017 года, когда начал периодически замерзать (каждые несколько недель или месяцев). Никакие журналы ядра, даже данные о сбоях pstore или netconsole не дали ничего значимого. Физический экран пуст, сеть не реагирует, показатели с точностью до 10 с не показывают корреляции с нагрузкой на ЦП, ОЗУ или диск. Все светодиоды и накопители все еще работают, но ввода-вывода, очевидно, больше нет. Оперативная память была проверена и проверена на исправность, никаких ложных ошибок или чего-либо, что указывало бы на неустойчивую аппаратную проблему. Просто сильно замерзает.

Теперь перейдем к очень интересной части: как только система переходит в это состояние, кнопка физического сброса перестает работать полностью. Как только я нажимаю на это, ничего не происходит. Он определенно работает физически, так как работает на 100%, когда система не находится в этом состоянии. Я проверил напряжения от блока питания с помощью мультиметра, и все они в порядке. Я все еще могу сбросить настройки сервера, нажав кнопку питания на 5 секунд, и после этого он нормально загружается.

Так что я в значительной степени в замешательстве, что здесь происходит, и какая часть оборудования виновата. У меня есть логические анализаторы, и я мог получить доступ к областям USB, но ничего, что сэмплирует выше 100MSPS, поэтому я не могу исследовать реальные шины. Я был бы очень благодарен за любые идеи о том, что может происходить.

2 ответа2

1

Таким образом, после большого количества стратегических замен (материнская плата, блоки питания, процессор) у меня есть дифференциальное подтверждение (тестовая система испытывает проблему, оригинальная больше не делает) на плохой процессор. Очень неожиданный результат, так как никакие MCE никогда не запускались, обычно вы получаете MCE задолго до жестких блокировок.

К сожалению, на этой плате нет разъема Trace Hub / JTAG, а встроенная отладка USB3 недоступна на платформе Haswell, поэтому я понятия не имею, что на самом деле происходит не так. Совершенно очевидно, что микросхема оказывается в состоянии, когда она не может быть освобождена от сброса (сбой самотестирования, шина питания не подходит, ...). Может быть связано с введением FIVR (полностью интегрированный регулятор напряжения) в Haswell, но это всего лишь предположение.

Если вы столкнулись с этой проблемой, это не обязательно должен быть процессор, он также может быть неисправной материнской платой или блоком питания (или чем-то другим). Я просто хотел опубликовать это для полноты и чтобы люди увидели, что это действительно может быть сбой процессора (хотя это все еще довольно маловероятно).

-1

Я уже видел это дважды, как на ноутбуках с архитектурой x86. Когда это происходит, экран зависает, светодиоды остаются включенными, но кнопки не работают. Единственная кнопка, которая работает, это кнопка питания, но при удержании в нажатом положении 5 секунд.

У ноутбуков обычно нет кнопки сброса, поэтому я не могу быть точно уверен в вашей проблеме, но доказательства указывают на аппаратную неисправность. Я увидел, что паяные соединения на плате стали трещинами, будь то дефект, время или механическое напряжение (достаточно горячих холодных циклов). Каждый плохой сустав будет вводить электрический шум. Получите достаточно или в нужных местах, и цифровые микросхемы заблокируются, что приведет к зависанию всей платы. Это не на уровне ОС или BIOS, это ниже аппаратного обеспечения. В этом состоянии будет работать только функция удержания кнопки питания, поскольку при этом используется аналоговая схема, которая не блокируется.

Решением является проведение платы через цикл разогрева (внутри машины), который быстро расплавляет припой, вызывая повторное сваривание и исчезновение трещин.

Я нашел фирму, которая специализируется на таком виде ремонта.

На сайте EBay перейдите в раздел "Специализированные услуги" -> "Услуги по восстановлению и ремонту" -> "Услуги по восстановлению и ремонту компьютеров". Продавец "NYClaptoptech". Я искал марку / модель, и у них был соответствующий "предмет для продажи". Я приобрел эту услугу так же, как купил бы компьютер, используя тот же процесс оформления заказа. (Было странно устанавливать вызов службы с помощью метода покупки.) Я отправил материнскую плату, вернул ее через 2 недели. Стоимость: 120 долларов США. Их обслуживание является общим, и вы можете просто позвонить им, чтобы договориться о ремонте.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .