За последние 8 часов мой процесс изменения формы mdadm застрял. Выход:

Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] 
md0 : active raid6 sdo[11] sdn[12] sdm[13] sdl[14] sdk[15] sdj[16] sdi[17] sdh[20](F) sdg[19] sdr1[1] sds1[2] sdt1[3] sdu1[4] sdp1[10] sdq1[6] sde1[0] sdd1[7] sdb1[9] sdc1[8] sdf1[5]
      17581607424 blocks super 0.91 level 6, 64k chunk, algorithm 2 [20/19] [UUUUUUUUUUUUUUUUUU_U]
      [====>................]  reshape = 23.2% (453532992/1953511936) finish=6484322.5min speed=3K/sec

Счетчик все время находился на 453532992 , скорость уменьшалась до 0 (не достигала его, поскольку это средняя скорость, и скорость была хорошей в течение длительного времени). Я вижу, что один из дисков помечен как неисправный, что меня немного беспокоит. Я могу перестроить этот диск (я знаю, что это не аппаратный сбой), как только будет выполнено переформирование, но с такой скоростью это не происходит.

У кого-нибудь есть предложения? Что я могу сделать, чтобы снова запустить mdadm ?

Изменить: Чтобы добавить к веселью, похоже, что-то еще пошло не так в системе. Я получаю ошибки ввода / вывода при попытке прочитать что-либо в корневой файловой системе. Файловая система RAIDed по-прежнему работает, но некоторые процессы застряли, что не позволит мне ее демонтировать. И ошибки в корневой файловой системе, кажется, препятствуют чистой перезагрузке.

Поэтому я полагаю , что это возможно , что все проблемы находятся в корневом устройстве , и ничего сделать с RAID, он просто не может продолжать повторно форму , потому что он не может читать что - то , что нужно? Я не уверен. Но если я не могу выполнить чистую перезагрузку, что произойдет с изменением формы, если мне придется принудительно перезагрузить коробку? Что, если корневой диск физически мертв, а мне нужно установить ОС на новый диск? Что будет с массивом тогда?

1 ответ1

0

Я думаю, что в конечном итоге проблема заключалась в том, что корневой диск (не являющийся частью RAID), который является твердотельным накопителем, был сильно перегружен с помощью файла резервной копии для переформирования.

Кроме того, я нашел пост, посвященный именно этому вопросу, который в основном рекомендует:

Так что учитесь на моей ошибке, никогда не помещайте файл -backup на «изменчивые» носители, такие как flash.

Ввод-вывод был по существу сломан на корневом диске, и его нельзя было использовать ни для чего, включая выполнение команд, необходимых для выполнения каких-либо удаленно полезных действий (таких как корректное завершение работы). Я жестко зациклил коробку и надеялся на лучшее.

Когда он вернулся, корневой диск работал нормально. По крайней мере, заметно. RAID не собирался правильно, потому что он только пытался использовать оригинальные 11 дисков, а не полные 20. Я сказал mdadm остановить массив, а затем собрать его из 20 известных мне устройств. Как только я это сделал, он набрал форму там, где остановился.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .