Я установил небольшую серверную машину Ubuntu 11.04 на базе рейдов и только что получил от нее это письмо. Как я могу проверить или проверить это?

Ричард

Это автоматически сгенерированное почтовое сообщение от mdadm, запущенное на Godzilla

Событие Fail было обнаружено на устройстве md/dev/md/0.

Это может быть связано с компонентом устройства /dev/sda1.

С уважением и т.д.

PS Файл /proc /mdstat в настоящее время содержит следующее:

Личности: [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5 sda10 sdb1 [1] sdd1 [3] sdc1 [2] 2927135232 блоки супер 1.2 уровень 5, Блок 512 Кб, алгоритм 2 [4/3] [_UUU] [> ....................] проверка = 2,2% (21655188/975711744) финиш = скорость 4419,8 мин = 3597K /сек

&> cat /proc /mdstat Личности: [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5 sda10 sdb1 [1] sdd1 [3] sdc1 [2] 2927135232 блоки super 1.2 уровня 5, блок 512 Кб, алгоритм 2 [4/3] [_UUU]

неиспользуемые устройства:

cat /proc /mdstat Личности: [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5 sda1 [0] F sdb1 [1] sdd1 [3] sdc1 [ 2] 2927135232 блоки super 1.2 уровня 5, блок 512 Кб, алгоритм 2 [4/3] [_UUU]

неиспользуемые устройства:

Dmsg [775549.274966] md/raid: md0: сбой диска на sda1, отключение устройства. [775549.274967] md/raid: md0: работа продолжается на 3 устройствах. [775549.280021] md/raid: md0: ошибка чтения не исправлена (сектор 43310408 на sda1
). [775549.280028] md/raid: md0: ошибка чтения не исправлена (сектор 43310416 на sda1
). [775549.280031] md/raid: md0: ошибка чтения не исправлена (сектор 43310424 на sda1
). [775549.280035] md/raid: md0: ошибка чтения не исправлена (сектор 43310432 на sda1
). [775549.280039] md/raid: md0: ошибка чтения не исправлена (сектор 43310440 на sda1
). [775549.280043] md/raid: md0: ошибка чтения не исправлена (сектор 43310448 на sda1
). [775549.280047] md/raid: md0: ошибка чтения не исправлена (сектор 43310456 на sda1
). [775549.280051] md/raid: md0: ошибка чтения не исправлена (сектор 43310464 на sda1
). [775549.280055] md/raid: md0: ошибка чтения не исправлена (сектор 43310472 на sda1
). [775549.280226] ata7: EH завершено [775549.316567] ata7.00: исключение Emask 0x0 SAct 0x0 SErr 0x300000 действие 0x6 [775549.319133] ata7.00: BMDMA stat 0x45 [775549.321658] ata7: BadR7.7757 [775R]} 737R [77] 775R] 737R [775]: [775R]} 7375 [775]: [775] [7] 775R] [7] 037 [7] 775R] [775]: [775R] 7] 775: aR7 = 7.7575: a0: 7757 = [775]: [775]. [075]. [7755].} 7: 775: a. : ошибка команды: READ DMA EXT [775549.326754] ata7.00: cmd 25/00: f8: 28: ed: 94/00: 03: 02: 00: 00 /e0 tag 0 dma 52019
2 в [775549.326757] рез. 51/84: 48: 78: 7f: 2e /84: 00: 03: 00: 00 /e0 Emask 0x10 (ATA
ошибка шины) [775549.331806] ata7.00: статус: {DRDY ERR} [775549.334350] ata7.00: ошибка: {ICRC ABRT} [775549.336890] ata7: ссылка для жесткого сброса [775549.336895] ata7: nv: пропуск жесткого диска на занятом порту [ 775549.340260] md: md0: проверка данных завершена. [775549.804062] ata7: соединение SATA со скоростью до 3,0 Гбит /с (SStatus 123 SControl 300) [775549.844352] ata7.00: настроено для UDMA /33 [775549.844390] ata7: EH завершено [775549.936450] Распечатка RAID-уровня: [775549.93645] 5-е: 4 wd: 3 [775549.936460] диск 0, o: 0, dev: sda1 [775549.936463] диск 1, o: 1, dev: sdb1 [775549.936465] диск 2, o: 1, dev: sdc1 [775549.936507] диск 3, o: 1, dev: sdd1 [775549.936557] Распечатка конфигурации RAID: [775549.936559] --- уровень: 5 rd: 4 wd: 3 [775549.936562] диск 1, o: 1, dev: sdb1 [775549.936564] диск 2, o: 1, dev: sdc1 [775549.936567] диск 3, o: 1, dev: sdd1

sudo mdadm - подробности /dev /md0

/dev/md0: Версия: 1.2 Время создания: сб. 1 января 14:43:44 2005 Уровень рейда: raid5 Размер массива: 2927135232 (2791,53 ГиБ 2997,39 ГБ) Используется Размер разработчика: 975711744 (930,51 ГиБ 999,13 ГБ) Устройства рейда: 4 Всего Устройства: 4 Постоянство: Суперблок является стойким

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

1 ответ1

0

Я бы посмотрел на вывод 'dmesg', а также файл /var /log /syslog. Могут быть намеки на проблемы с /dev /sda1.

Жесткий диск мог сломаться, но это также мог быть кабель, который плохо подключен (кабели SATA просто ... не такие уж и крутые). Посмотрите, находится ли устройство в сети, возможно, оно доступно под другим именем, например /dev /sde1, или как другое свободное имя в вашей системе. Как уже упоминалось, я бы проверил dmesg /syslog, SMART, тоже. Возможно, кабель просто должен быть правильно подключен или должен быть заменен. В большинстве случаев вы можете повторно добавить диск в ваш RAID-массив - я использую эти команды только в том случае, если проблема действительно связана со сломанными кабелями или чем-то похожим, то есть без "реального" сбоя жесткого диска.

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

Отказ от ответственности: нет гарантии, у вас должны быть резервные копии, это восстановит ваш RAID-массив - на этот раз нет избыточности и т.д.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .