Я имею удовольствие ;-), когда мне было поручено попытаться получить данные с сервера, у которого была проблема с массивом RAID5 и неудачная попытка восстановить его.
Справочная информация: речь идет о каком-то сервере IBM с 6-портовой объединительной платой SATA2. Четыре идентичных жестких диска по 1 ТБ каждый подключены и настроены как RAID5 с 4 устройствами. Ранее сообщалось, что сервер терял "связь" с одним или несколькими дисками время от времени, и RAID5 падал. После перезагрузки сервера RAID5 будет синхронизироваться, и все будет хорошо. Парень, обслуживающий этот сервер, считает, что это аппаратная проблема.
Несколько дней назад произошла катастрофа. Сначала он, предположительно, выглядел так же, как и в прошлые разы, с отключением RAID5 из-за отключения некоторых дисков. Но перезагрузка не устранила проблему, вместо этого RAID5 был "сломан" (нет информации, что это значит). Сопровождающий попытался воссоздать RAID5, используя mdadm --create, и сказал, что он покажет RAID как "восстанавливающийся" (не повторную синхронизацию!). После 5-6 часов работы этот процесс был завершен, и RAID5 снова показался активным. Однако файловая система не была монтируемой (без суперблоков).
Используя инструменты восстановления данных, такие как testdisk, мы смогли восстановить файлы, однако они кажутся поврежденными (особенно это заметно в необработанных файлах WAV).
Это состояние, которое я принимаю. Я действительно не знаю, что пошло не так, но я предполагаю, что если он не сломался сразу после перезагрузки, восстановление привело к потере данных. Последовательность выданных команд также недоступна.
Я считаю, что восстанавливать нечего, но хотел бы проконсультироваться с экспертами здесь, прежде чем начинать все заново (и вводить реальную стратегию резервного копирования, кашель).