Начиная с прошлой недели, у меня была проблема, когда различные процессы переходили в состояние непрерывного сна примерно на 5-10 минут, а затем разблокировали себя, как будто ничего не произошло. Это может происходить несколько раз в час или только несколько раз в день.
Я использую Arch с ядром 4.20.3-arch1-1-ARCH и имею два жестких диска в массиве RAID 1 с файловой системой, зашифрованной с помощью LUKS.
Запустив ps
, я вижу, что следующие процессы обычно находятся в непрерывном сне во время этих всплесков ввода-вывода:
md125_raid1
dmcrypt_write/2
jbd2/dm-1-8
kworker/u16:2+flush-253:1
Выход из iostat
во время пика:
Device r/s w/s rkB/s wkB/s rrqm/s wrqm/s %rrqm %wrqm r_await w_await aqu-sz rareq-sz wareq-sz svctm %util
sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdc 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdb 0.00 1.50 0.00 3.00 0.00 0.00 0.00 0.00 0.00 1.67 0.00 0.00 2.00 0.00 0.00
sdd 0.00 1.50 0.00 3.00 0.00 0.00 0.00 0.00 0.00 2.67 0.00 0.00 2.00 0.00 0.00
md127 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
md126 0.00 0.50 0.00 2.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 4.00 0.00 0.00
md125 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sde 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdf 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
md124 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-0 0.00 0.50 0.00 2.00 0.00 0.00 0.00 0.00 0.00 26.00 0.01 0.00 4.00 26.00 1.30
dm-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 51.00 0.00 0.00 0.00 100.00
dm-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
loop0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-1
всегда достигает 100% использования.- В журнале ядра нет соответствующей информации.
- Оба диска имеют возраст около 6 месяцев и проходят самотестирование SMART.
Я не совсем уверен, куда идти отсюда. Это не похоже на какую-то конкретную программу, которая вызывает это, а скорее на ядро или код RAID/LUKS. Могу ли я еще что-нибудь сделать для дальнейшей отладки причины этой проблемы?