У меня есть машина RHEL версии 6 (устройство), сконфигурированная с массивом RAID 6, содержащим 12 дисков, настроенных для DRBD с идентичным устройством в том же физическом шасси. Этот массив разделен на 9 дисков, один из которых содержит загрузочный сектор; нет отдельного локального загрузочного диска. Устройство имеет аппаратный RAID-контроллер; Я не уверен в конкретной модели.
Мы попытались выполнить горячую замену диска, и система вошла в то, что, как я могу только предположить, было паникой ядра. Это заставило нас перезагрузить машину на голом металле. После небольшого переделывания (обширного, но не имеющего отношения к вопросу) мы можем смонтировать загрузочный раздел, раздел журнала, раздел восстановления и т. Д .; и все это прекрасно работает.
Однако самый большой раздел, раздел /store, который содержит данные, к которым мы пытаемся получить доступ, все еще частично поврежден. Диск будет монтироваться после xfs_repair -L, однако мы не можем получить значительный объем данных и не можем запустить устройство из-за того, что в PGSQL есть несколько поврежденных каталогов.
При запуске xfs_repair он работает примерно 1 час; Наиболее распространенные уведомления, записанные на экране, приведены ниже, в порядке от наиболее распространенных к наименее распространенным. Обратите внимание, что их достаточно, скорость прокрутки напоминает скрипт, выполняющий бесконечный цикл; Я не могу сосчитать, сколько у каждого. Кроме того, я совершенно уверен, что где-то пропустил.
Фаза 2:
block (##############) multiply claimed by bno space tree, state - 1
block (##############) multiply claimed by bno space tree, state - 2
block (##############) multiply claimed by cnt space tree, state - 2
block (##############) multiply claimed by cnt space tree, state - 1
inode chunk claims used block, inobt block - agno 24, bno #####, inopb 16
Этап 3:
found inodes not in the inode allocation tree
bad inode format in inode ################
bad magic number #x#### in inode #########, resetting magic number
bad (negative) size -##################### on inode #############
Где-то здесь, он выдает следующее, а затем выходит:
xfs_repair: dinode.c:768: process_bmbt_reclist_int: Assertion `i < *numrecs' failed.
Aborted (core dumped)
Кто-нибудь есть идеи, как я могу получить xfs_repair, чтобы продвинуться дальше этой точки?