Недавно у меня было два жестких диска, которые разбились в массиве RAID 5, я не настроил никакого мониторинга, поэтому не заметил, что один из них был сбит некоторое время. Поэтому я решил все пересмотреть и начать с нуля.
Все оборудование такое же, как и раньше, за исключением того, что у меня в массиве меньше дисков, чем раньше, 3 больших вместо 8. Я также установил Arch Linux как UEFI вместо того, чтобы использовать устаревшую опцию загрузки, не уверенный, влияет ли это на что-нибудь.
Я переустановил Arch Linux с надлежащим мониторингом / уведомлениями mdadm и ежедневными короткими SMART-тестами (и еженедельными тестами).
Однако после переустановки Arch Linux я наблюдаю случайную панику ядра, как правило, после 48 часов безотказной работы.
Мне удалось сделать снимок паники ядра:
Теперь из того, что я вижу, похоже, это связано с mdadm.
Вот моя конфигурация mdadm:
Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid1 sda1[0] sdb1[1]
524224 blocks super 1.0 [2/2] [UU]
md1 : active raid1 sda3[0] sdb3[1]
1950761024 blocks super 1.2 [2/2] [UU]
bitmap: 5/15 pages [20KB], 65536KB chunk
md2 : active raid5 sde1[3] sdc1[0] sdd1[1]
5796265984 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
bitmap: 0/22 pages [0KB], 65536KB chunk
unused devices: <none>
Соответствующая строка в mkinitcpio.conf:
HOOKS="base udev autodetect modconf block mdadm_udev filesystems keyboard fsck"
В настоящее время я использую Linux akatosh 4.1.6-1-ARCH # 1 ПРЕДВАРИТЕЛЬНАЯ ПРОГРАММА ПУНКТОВ 17 августа, 08:52:28 CEST 2015 x86_64 GNU/Linux.
Я пытался переустановить свою оперативную память, но сомневаюсь, что это проблема с оперативной памятью, если ее не было до переустановки Arch Linux.
Большинство проблем с паникой ядра, связанных с mdadm, которые я обнаружил в своих исследованиях, возникали при загрузке. Кто-нибудь знает, в чем может быть проблема?
РЕДАКТИРОВАТЬ: похоже, это известная ошибка, представленная в 4.1.4 или 4.1.5: https://bugzilla.redhat.com/show_bug.cgi?id=1255509
Я попытаюсь обновить до 4.2.0 в тестировании, и я обновлю этот пост с дополнительной информацией.