Вчера вечером я сменил жесткие диски со своего домашнего сервера на новый корпус (новый mobo/CPU/RAM) и перенес с ним его 3ware 9500 PCI-X SATA RAID карту. Машина имеет 4 диска, настроенных на 2 RAID1: корневой (500 ГБ) и носитель (1 ТБ). Он работает под управлением Debian 7 32-bit.
Машина загрузилась нормально, но только когда она работала и загрузились утилиты 3ware, я заметил, что в массиве отсутствует один из корневых дисков. Я выключил его и покачал диски (я знаю, что этот диск временный, мне нужно купить новый) и в итоге получил карту RAID, чтобы увидеть его. Это означало запуск перестройки RAID, поэтому я позволил машине перезагрузиться в Debian, чтобы я мог следить за ее ходом и начать перестройку.
Он достиг диапазона 90%, прежде чем мне пришлось заняться чем-то другим. Когда я вернулся, катастрофа - на карте RAID не было ни RAID, ни дисков. Debian все еще работает (как-то!) но я ничего не мог сделать. Громкость носителя исчезла, и корневая FS казалась полностью поврежденной - bash интерпретировал двоичные файлы системы как случайные строки чисел. Больше ничего не оставалось, кроме перезагрузки (и это должна была быть сложная перезагрузка, команда выключения не работала).
Карта RAID детализировала все 4 присутствующих диска, но этот проблемный диск все еще не использовался, что означало, что ручная перестройка RAID все еще была необходима. Когда появился Grub, он объявил, что не может распознать файловые системы ни на одном из моих RAID-массивов, поэтому дал мне оболочку восстановления - я понятия не имею, как использовать это (мой интернет тоже не работал вчера вечером), поэтому я понятия не имею в каком состоянии находятся мои диски Я удалил хороший корневой диск и попытался перевести систему в режим деградации на временном диске, чтобы увидеть, есть ли на нем какие-либо полезные данные, но карта RAID отказалась разрешить мне использовать ее в качестве загрузочного носителя.
При необходимости у меня есть адаптер USB-SATA, но на данном этапе мне интересно, каковы мои шансы на восстановление системы; Я знаю, что RAID не заменит резервное копирование, но на этих дисках есть много данных, на восстановление которых у меня уходит очень много времени (то есть они не незаменимы, но я не хочу стереть систему и начать заново) , Любые идеи, где я мог бы начать?
Изменить: достигнут некоторый прогресс. Похоже, что «хороший» диск из корневой пары перенес аппаратный сбой в середине восстановления! Я попытался перенести его на новый диск и получил ошибки ввода-вывода, и SpinRite не хочет его трогать. «Плохой» диск находится в каком-то подвешенном состоянии, но один из разделов на нем передал fsck и монтируется на живой диск, так что я перенес это на запасной диск. Это не объясняет, почему пропали два других медиа-диска, но спасение раздела /home - отличное начало.
Редактировать 2: здесь происходит что-то очень странное. Два медиа-диска не будут отображаться в BIOS на моем рабочем столе, и через USB на моем ноутбуке они оба будут отображаться без таблицы разделов. Я начинаю задаваться вопросом, умерли ли как-то три из этих четырех дисков одновременно, или они были убиты новым оборудованием - если так, я не могу понять, почему, единственное, о чем я могу думать, скачок напряжения но это должно было поджарить Мобо первым!
Правка 3: в дополнение к моему последнему комментарию проблема с необнаруженными дисками, по-видимому, связана с тем, как карта 3ware использует их; диски мультимедиа отображаются нормально с контроллером 3ware с неповрежденными таблицами разделов. fsck'ing их сейчас, скрестив пальцы, я могу получить данные ...
Редактировать 4: я смог спасти все с медиа-дисков, хотя мне пришлось выполнить обширный fsck на разделе перед монтированием. Было много ошибок с несовпадающими или недействительными индексами и подсчетом свободного места. Странно то, что на самом деле ничто не должно было использовать диски в то время. Хорошо, Plex Media Server был запущен, но поскольку я не касался какого-либо носителя на диске, я не думаю, что это могло повлиять на состояние файловой системы, когда RAID отключился. Я собираюсь попытаться войти в действительный корневой диск, посмотреть, что говорят логи. Пока я не определю, что привело к исчезновению RAID, я вернусь к программному RAID.