У меня около 20 лет опыта построения систем (в основном для себя), но я никогда не видел ничего подобного:
Примерно с 3 лет у меня Xeon 1230V2 на Supermicro X9SCA-F rev 1.01 и 32 ГБ ECC RAM в качестве моей рабочей станции / игровой станции. В целом использование было относительно низким, иногда были более тяжелые периоды кодирования или игры. Это всегда было стабильно. Не самый маленький взлёт за всю историю.
На прошлой неделе я выполнил обновление && для моей установки Debian Jessie. Ничего особенного, но новый пакет ядра был частью этого обновления. При следующей перезагрузке я заметил, что перемещение окон в X довольно вялое, хотя я, должно быть, забыл снова скомпилировать fglrx для моего AMD GPU. Странно, модуль ядра уже был загружен. В любом случае я решил снова скомпилировать его и перезагрузить в режиме восстановления, чтобы сделать это на чистой земле. Я не получил спасательную консоль, init казался успешным, но для меня не было открыто ни одного терминала. В общем, после обновления до Jessie некоторые более мелкие детали не работают должным образом (возможно, из-за того, что я снова переключился на sysvinit).
В любом случае, я перезагрузил компьютер и изменил init на /bin /sh, чтобы попробовать это. Вдруг паника ядра, а через несколько секунд перезагрузка. Я не могу вспомнить, что говорила паника, это было слишком быстро. Монитор остается черным. Я нажимаю кнопку сброса, все еще пустой. Выключи, подожди, попробуй еще раз - черный. Короче говоря: после паники в ядре система больше не выполняет POST. Вентиляторы запускаются, IPMI доступен (я вижу, как система циклически перебирает некоторые коды POST - я не совсем уверен, что это значит, так как не могу найти надежную ссылку), но никакого звукового сигнала нет и никакого отображения. Я удалил все, включил ОЗУ, заменил блок питания, вынул плату из корпуса, очистил CMOS, очистил ее за ночь, CTRL-HOME, DEL /INSERT, ... ничего не помогает.
Что особенно странно, кроме того факта, что init =/bin/sh приводит к панике ядра, которая приводит к тому, что система не выполняет POST: если я удаляю всю память, плата все еще не издает звуковых сигналов . Поэтому я могу только подозревать, что существует серьезное повреждение оборудования, но я до сих пор не понимаю причинно-следственной связи.
Я заказал новую плату, а не у Supermicro, так как они отказывают в RMA (как это делает Amazon после более чем 2 года) и имеют гарантию всего 1 год.
Есть идеи, может ли плата или процессор быть тостом? Поскольку контроллер памяти находится на процессоре, я не совсем уверен, кто виноват в том, что не подал звуковой сигнал, если не подключено ОЗУ. Я надеюсь, что это не процессор, так как та же модель сегодня на 30% дороже, чем в конце 2012 года!
Любые идеи о том, что я мог бы попробовать?