ОС: Ubuntu Desktop 12.04
Как я могу убедиться, что даже если ядро имеет очень низкий уровень, серьезный сбой, система перезагрузится? Или, если это невозможно, что может быть лучше для восстановления покрытия при перезагрузке?
В любом случае можно ли использовать аппаратные таймеры или прерывания для принудительной перезагрузки?
Я бы предпочел решения, которые работают на универсальном и недорогом оборудовании.
Бонусный вопрос: Вы бы порекомендовали это как стандартное решение?
Дальнейшая иллюстрация:
Допустим, я испытываю то, что кажется очень низким уровнем замораживания. (Даже магические ключи SysRq не работают)
Я не могу ssh в машину, но кажется, что рукопожатие tcp прошло успешно. (Странно? Должен к отказу приборов, верно?)
Возможно, это может быть связано с плохой памятью или перегревом, но давайте на минутку скажем, что меня не очень волнует непосредственная причина, и вместо этого я больше озабочен максимизацией кратковременного времени безотказной работы. (Хотя я полностью признаю, что понимание причины - лучший способ предотвратить ее появление в долгосрочной перспективе)
Исследование:
В настоящее время я смотрю на это: http://www.cyberciti.biz/tips/reboot-linux-box-after-a-kernel-panic.html, однако я не уверен, что на самом деле я нахожусь в панике, поскольку есть нет визуальных индикаторов.
Похоже, это то, что я хочу: http://manpages.ubuntu.com/manpages/hardy/man8/watchdog.8.html Однако, похоже, он использует /dev/watchdog
которого, похоже, нет в моей системе. Я что-то пропустил?
Если я буду следовать проверкам здесь: http://pic.dhe.ibm.com/infocenter/lnxinfo/v3r0m0/index.jsp?topic=%2Fliaai.crashdump%2Fliaaicrashdumpnmiwatch.htm кажется, что NMI работает в моей системе, однако система не перезагружалась при сбое. Что мне здесь не хватает?
Спасибо