3

У меня есть собственная система FreeNAS, которая использует 4 жестких диска в одном пуле ZFS исключительно для хранения, и 2 зеркальных USB-накопителя емкостью 16 ГБ в зеркале ZFS для загрузки с. Он стабилен и работает уже около 8 месяцев. Тем не менее, ночные электронные письма обычно выглядят так:

Проверка состояния пулов zfs: ИМЯ РАЗМЕР ALLOC FREE EXPANDSZ FRAG CAP DEDUP ЗДОРОВЬЕ ALTROOT 14.5G 1.67G 12.8G - - 11% 1.00x ONLINE - объем1 7.25T 457G 6.80T - 2% 6% 1.00x ONLINE /mnt

  pool: freenas-boot состояние: состояние ONLINE: на одном или нескольких устройствах возникла неисправимая ошибка. Была предпринята попытка исправить ошибку. Приложения не затрагиваются. Действие: Определите, нужно ли заменить устройство, и удалите ошибки с помощью «zpool clear» или замените устройство на «zpool replace». см .: http://illumos.org/msg/ZFS-8000-9P scan: скраб отремонтировал 232 КБ в 0h6m с ошибками 0 в воскресенье, 23 октября 03:51:22 2016 config:

   НАЗВАНИЕ СОСТОЯНИЕ ЧИТАТЬ ЗАПИСАТЬ CKSUM ОНЛАЙН freenas-boot 0 0 0 mirror-0 ОНЛАЙН 0 0 0 gptid /253f05a3-be26-11e5-8d9c-d05099c04470 ОНЛАЙН 0 0 1 gptid /879584e0-bfb0-11e5-ba20-d05099c044 070

ошибки: нет известных ошибок данных

Ошибки контрольной суммы будут иногда увеличиваться, а затем, когда я выполняю обычное обновление FreeNAS, все снова сбрасывается до 0, после чего процесс повторяется, и ошибки контрольной суммы снова и снова накапливаются.

Я не видел ничего, что указывало бы на то, что на самих жестких дисках были какие-либо неисправности, и я загружал конфигурацию FreeNAS во внешнее хранилище резервных копий, когда вносил изменения, поэтому я должен иметь возможность переустановить на новую флешку при необходимости.

Все это говорит, насколько я должен быть обеспокоен этими ошибками контрольной суммы?

1 ответ1

2

Возможные причины

Эти ошибки могут иметь разные источники, некоторые из них включают в себя:

  • Слабые соединения или поврежденные кабели
  • Внезапная потеря питания или принудительное удаление устройств
  • Ошибки памяти при использовании не ECC RAM, который неисправен

Вы можете удалить ошибки с помощью zpool clear , потому что ошибок было немного (вместо too many errors), и они не влияли на одни и те же блоки на каждом устройстве. Я подозреваю, что обновление FreeNAS также делает это, так что это приводит к ситуации, которую вы описали.

Возможные решения

Я бы сделал следующее:

  • Запустите memtest86+ на ночь, чтобы исключить ошибки в памяти
  • Отсоедините и снова подключите все кабели, проверьте, не потеряны ли соединения, при необходимости замените кабели (они дешевые, поэтому их простая замена выполняется быстрее, чем устранение неисправностей).
  • Попробуйте, если работа с ИБП имеет значение, если вы живете в районе с нестабильным энергоснабжением (в некоторых частях США, я читал, это отключение)
  • Проверьте, не поврежден ли порт / контроллер USB, используя другой или адаптер PCIe (довольно дешево)
  • Попробуйте использовать другой тип USB-флешек, у меня был хороший опыт работы с SLC-флешками USB3 (только ошибки контрольной суммы были при удалении или отключении)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .