2

На прошлой неделе на работе наш сервер linux (CentOS 5.5) не отвечал на попытки входа в систему, поэтому мне пришлось жестко его закрыть. После извлечения пары дисков при загрузке он сообщил об ухудшенном массиве raid и о том, что fsck -p не удалось запустить fsck вручную. Сервер имеет 5x 2 ТБ дисков в аппаратном массиве RAID 5. С точки зрения программного обеспечения, я считаю, что это просто организовано в один большой логический том, который включает /boot / и / home, и второй логический том для подкачки.

Я повторно импортировал конфигурации RAID на удаленных дисках, после чего массив RAID все еще показывал ухудшенное состояние, и машина все еще возвращает ошибку fsck при загрузке. Пятый диск начал автоматическое восстановление, но не смог, вероятно, из-за повреждения файловой системы. К счастью, мне удалось восстановить более 2 ТБ данных с сервера в режиме восстановления (вот так!). Затем я запустил fsck -yf на логическом томе, который внес некоторые изменения. Теперь fsck возвращает "чистый" при загрузке, но когда я попадаю на экран входа в Cent OS, меня приветствуют коробки, заменяющие весь шрифт. Появляется какая-то ошибка, которая не позволяет мне войти в систему, но я не могу прочитать ошибку, так как это также все окна. Я также не могу войти через текстовый терминал (постоянно повторяется с логином: нет возможности ввести пароль) или SSH (сервер отвечает, но сообщает неверный пароль).

На этом этапе я пытаюсь запустить fsck, но он говорит мне, что файловая система чистая. Я все еще могу войти в файловую систему в режиме восстановления с установочного DVD, и все файлы, которые я просматривал, кажутся в порядке. Я бы действительно предпочел избежать полной переустановки, так как для этого потребуется много переустановить и скопировать данные обратно, а файлы из режима восстановления выглядят неповрежденными. Полностью ли я справился с этим, запустив fsck на логическом томе или разрешив автоматическое восстановление RAID? Каковы ваши рекомендации о том, как действовать?

1 ответ1

1

Система RAID (MD) ничего не знает о файловой системе, поэтому, если она не сможет перестроиться, это происходит не из-за повреждения файловой системы, а скорее из-за аппаратной ошибки. Возможно, один из ваших дисков вышел из строя. Проверьте наличие SMART-ошибок с помощью smartmontools и запустите самопроверку.

Когда вы запускаете fsck -yf, он изо всех сил пытается исправить файловую систему и в процессе может удалить проблемные inode (файлы) (некоторые файлы могут быть перемещены в папку lost+found). Возможно, поля, которые вы видели при графическом входе, были вызваны необходимыми файлами, которые были удалены с помощью fsck. Невозможность войти через консоль или SSH также может указывать на отсутствующие файлы. Вы можете получить доступ к оболочке, если загрузитесь в режиме восстановления? Вы можете попытаться исправить ситуацию, восстановив OS-файлы из резервной копии, или принудительно переустановить программные пакеты.

Однако на данный момент, возможно, будет лучше заменить диски и выполнить чистую переустановку.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .