3

Мой выделенный сервер DELL R710 (CentOS 6.4) сам по себе перезагружается и выдает следующую ошибку.

Означает ли это, что окно не может загрузиться или ядро запаниковало во время загрузки Linux, и сервер каким-то образом знает?

Может ли кто-нибудь посоветовать диагностику, или это аппаратная проблема, и ее следует передать в центр обработки данных, у которого я арендую коробку? Работал нормально месяцами, а теперь последние два дня случайно перезагружается.

Обновление - Box продолжает перезагружаться в течение одной минуты, пока работает, затем в следующей строке отображается загрузка ядра без выключения или других сообщений об ошибках.

Jan 10 16:29:12 squirtle kernel: Firewall: *TCP_IN Blocked* IN=em1 OUT= MAC=84:2b:2b:54:84:58:00:04:96:82:74:3e:08:00 SRC=93.174.93.67 DST=13.129.118.21 LEN=40 TOS=0x00 PREC=0x00 TTL=245 ID=54321 PROTO=TCP SPT=35003 DPT=21320 WINDOW=65535 RES=0x00 SYN URGP=0
Jan 10 16:35:50 squirtle kernel: Firewall: *UDP_IN Blocked* IN=em1 OUT= MAC=84:2b:2b:54:84:58:00:04:96:82:74:3e:08:00 SRC=179.107.38.35 DST=13.129.118.21 LEN=443 TOS=0x00 PREC=0x00 TTL=53 ID=0 DF PROTO=UDP SPT=5067 DPT=5060 LEN=423
Jan 10 16:42:05 squirtle kernel: imklog 5.8.10, log source = /proc/kmsg started.
Jan 10 16:42:05 squirtle rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="1203" x-info="http://www.rsyslog.com"] start
Jan 10 16:42:05 squirtle kernel: Initializing cgroup subsys cpuset
Jan 10 16:42:05 squirtle kernel: Initializing cgroup subsys cpu
Jan 10 16:42:05 squirtle kernel: Linux version 2.6.32-431.3.1.el6.i686 (mockbuild@c6b10.bsys.dev.centos.org) (gcc version 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC) ) #1 SMP Fri Jan 3 18:53:30 UTC 2014
Jan 10 16:42:05 squirtle kernel: KERNEL supported cpus:
Jan 10 16:42:05 squirtle kernel:  Intel GenuineIntel
Jan 10 16:42:05 squirtle kernel:  AMD AuthenticAMD
Jan 10 16:42:05 squirtle kernel:  NSC Geode by NSC
Jan 10 16:42:05 squirtle kernel:  Cyrix CyrixInstead
Jan 10 16:42:05 squirtle kernel:  Centaur CentaurHauls
Jan 10 16:42:05 squirtle kernel:  Transmeta GenuineTMx86
Jan 10 16:42:05 squirtle kernel:  Transmeta TransmetaCPU
Jan 10 16:42:05 squirtle kernel:  UMC UMC UMC UMC

Обновление 2

Я запустить утилиту stress на сервер в течение последних 4 дней, сервер не перезагружается один раз. Максимальное использование всех ядер при 100% процессоре. Мне нужно проверить, используется ли нагрузка на память или запись на диск, но что касается процессоров, то они кажутся нормальными.

2 ответа2

2

Это сообщение приходит из BIOS с просьбой продолжить. Это означает, что материнская плата увидела то, что ей не понравилось на аппаратном уровне. Операционная система не сделала бы этого и не занесла бы что-либо в файл сообщений, если бы ей была предоставлена такая возможность. Я бы попросил запустить полный diag на сервере. приглашение F1/F2 обычно представляет собой ошибку в конфигурации BIOS или предупреждение о сбое оборудования.

2

Поскольку R710 датируется 2009/2010 гг., Отказ компонентов всегда возможен.

Документация Dell (хотя для R410) гласит:

Alert! System fatal error during previous boot.
An error caused the system to reboot.
Check other system messages for additional information for possible causes. 

Поскольку единственное другое сообщение, которое я вижу, касается скорости вращения вентилятора, я думаю, что вам следует внимательно изучить и записать температуру и ее изменение.

Смотрите, например, Как отслеживать и регистрировать температуру и нагрузку на оборудование сервера.

Также не мешало бы открыть сервер, почистить его и проверить все контакты.

Вы можете попробовать использовать инструменты, описанные в статье Как решать проблемы с оборудованием в Linux, и сообщать здесь их результаты.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .