Я работаю над системой на основе SUSE Linux, которая работает 24/7 и работает около 3 лет, хотя я не могу сказать, что она не была перезагружена за это время.
9 июня, по-видимому, произошло какое-то закрытие сайта, но я не знаю, как это происходило.
С тех пор произошли бесчисленные мгновенные перезагрузки.

Ошибка возникла практически при любой возможной тестовой ситуации, например, пользовательские приложения работают или нет, архивируют данные или нет, записывают новые данные или нет, запускают fsck после 20 или более сбоев или просто ничего не делают.

  • Оперативная память была заменена.

  • Вентилятор охлаждения на радиаторе процессора был заменен, так как он был довольно шумным (хотя через него дул более мощный вентилятор, всего в 20 мм).

  • Блок питания был заменен, а зеленый провод заземлен, чтобы предотвратить его отключение.

Похоже, что это приводит к тому, что перезагрузки происходят немного реже.

Видимо, хотя я этого не делал, на нем был запущен fsck [вероятно] [диск на 250 ГБ имеет раздел данных размером около 220 ГБ], но я не знаю, были ли проверены все разделы. Но он, по-видимому, работает непрерывно в течение 2 дней.

Кто-нибудь может подсказать, какие проблемы могут привести к тому, что Linux мгновенно умрет и перезагрузится?

1 ответ1

0

Это звучит как вопрос HW для меня. Может быть температура, блок питания или mobo.

Вы можете проверить logs /var/log/* или вывод команды dmesg наличие подсказок

Оперативная память была заменена. Усталый охлаждающий вентилятор на радиаторе ЦП заменен на довольно шумный, хотя через него дует более мощный вентилятор, находящийся всего на расстоянии около 20 мм. Блок питания заменен, а зеленый провод жестко заземлен, чтобы предотвратить его отключение, но это просто означало, что перезагрузки немного меньше задерживается.

Я бы проверил с помощью lm-сенсоров или в " /proc/acpi/thermal_zone " (если это применимо к вам) на предмет признаков перегрева.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .