1

Я считаю, что zfs плохо справляется с аппаратными сбоями, до такой степени, что он полностью зависает, и никакая утилита не может быть использована до перезагрузки системы. ZFS считается уровнем производства?

Я работаю над ошибками подключения между некоторыми внешними дисками SATA и серверным компьютером, подключенным через USB3 или eSATA в мультиплексном режиме. Эти проблемы остаются загадкой, но перед лицом проблем с подключением команды zpool навсегда блокируются в любом запущенном ими терминале.

В этом случае, я просто попытался ls смонтированной ZFS пула / бака и что терминал завис. Новый терминал (Alt+F2) позволил мне попробовать статус zpool, это тоже зависло. Еще один новый терминал (Alt+F3). Я запустил top и вижу txg_sync с 3% загрузкой ЦП и бесконечный список процессов z_rd_int_x , каждый с 0,3% загрузкой ЦП. Четвертый терминал (Alt+F4) - это попытка zpool iostat , он тоже завис.

Периодические сообщения:

[tttt.ttttt] INFO: task bash:xxxx blocked for more than 120 seconds.
[tttt.ttttt] INFO: task txg_sync:xxxx blocked for more than 120 seconds.
[tttt.ttttt] INFO: task zpool:xxxx blocked for more than 120 seconds.

появляются. Машина по-прежнему обслуживает файлы из других пулов через SAMBA.

Как якобы надежная реализация запоминающего устройства может быть настолько ограниченной? Как я могу изящно решить проблему без перезагрузки?

  • ОС: CentOS 7
  • Процессор: Intel Core i7 4770K 1150 RB, четырехъядерный, 3,5 ГГц
  • Память: 32 ГБ без ECC
  • Диски: 1 ТБ WD Red WD10EFRX SATA 3.5 "

Вывод dmesg огромен, вам может понадобиться рассказать мне, что вы ищете.

Пожалуйста, запросите дополнительную информацию по мере необходимости.

1 ответ1

0

Не очень failmode ответ, но, по-видимому, установка режима сбоя на continue для всех пулов. Любой сбой пула позволит интерпретатору команд продолжить работу. Похоже, что существует опасность того, что дальнейшие сбои могут нанести гораздо больший ущерб.

Ситуация немного странная. Почему командный интерпретатор и весь терминал зависли из-за зависания пула, которым он управляет? Разве не должно быть некоторого почтительного расстояния между инструментами администратора и тем, что они администрируют?

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .