В системном журнале я вижу:

Jun  3 15:07:12 storage kernel: [36518.430143] md/raid1:md0: Disk failure on sdd1, disabling device.
Jun  3 15:07:12 storage kernel: [36518.430143] md/raid1:md0: Operation continuing on 1 devices.

Это был сбой диска в одном из 2 массивов raid1. На прошлой неделе у меня было 2 отказа диска одновременно, по одному на каждый массив. Я подозреваю, что это не может быть проблемой с дисками.

Я снова добавил диски, и теперь все швы работают нормально.

Как я могу узнать, почему Linux отключил мои устройства?

1 ответ1

1

Первым шагом к диагностике будет запуск SMART-тестов на диске - что-то вроде

sudo smartctl -A /dev/sdX

Чтобы увидеть, что он сам сообщает. Возможно, вы также захотите провести длинные дисковые тесты и посмотреть, что они говорят - хотя, вероятно, не так много.

Возможно, стоит посоветовать, какие диски вы используете. Некоторое время назад я использовал 2 обычных диска, у которых, похоже, были похожие проблемы - я не могу вспомнить точные симптомы или сообщения, но в конечном итоге объяснил это тем, что они несовместимы с RAID. Существуют различия между стандартными настольными дисками и дисками класса RAID/Enterprise в отношении обработки RAID - даже программного RAID MDADM.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .