Как игнорировать конкретную ошибку SMART

Question

Я получаю электронное письмо об одной и той же ошибке SMART каждый день. Я бы хотел настроить демон SMART таким образом, чтобы он игнорировал эту конкретную ошибку, но только эту, поскольку я все еще хочу сделать это сейчас, если что-то изменится или ухудшится.

This email was generated by the smartd daemon running on:

 host name: jon
DNS domain: [Unknown]
NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb [SAT], 11 Currently unreadable (pending) sectors


For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original email about this issue was sent at Sun Nov 25 02:30:45 2012 CET
Another email message will be sent in 24 hours if the problem persists.

Когда это произошло впервые, число нечитаемых секторов медленно увеличивалось, поэтому сделал резервную копию и перепробовал много вещей, описанных в этой теме:https://serverfault.com/questions/104417/how-do-i-easily-repair-a -Один-нечитаемый-блок-на-Linux-диск

Как видно из письма, это было 1,5 года назад, поэтому я точно не помню, что я пробовал, а что нет. Тем не менее, диск остается стабильным и работает с тех пор, поэтому я не вижу причин что-либо менять. (Да, я регулярно создаю резервные копии.)

Я могу только думать об обходном пути, который будет игнорировать все письма, содержащие этот точный текст, но это будет лечить только симптомы, а не причину.

Редактировать:

Я знаю, что многие или большинство из вас дадут мне совет "заменить диск", который в целом является наилучшим из возможных советов для вопроса типа «Я получаю эту ошибку, что мне делать?"

Но, пожалуйста, примите, пожалуйста, что я знаю о риске и задаю очень конкретный вопрос, касающийся демона SMART. В документах я не нашел ничего, что указывало бы на то, что можно делать то, что я хочу, но я хотел проверить здесь дважды, прежде чем перейти к моему решению.

Обновить:

Около недели назад счетчик снова опустился до 1. Я понятия не имею, что вызвало это, я не проводил никаких работ по техническому обслуживанию на этой машине. Через 2 с лишним года 11 секторов снова попали в норму. Это действительно странно.

score 3 · Answer 1 · 2011-03-09T19:38:42

вам нужно изменить конфигурацию /etc/smartd.conf

добавить аргументы к вам настройки:

-t -I 197

Игнорировать атрибут 197 - ожидающие сектора

вот так (пример):

/dev/ad0 -H -l error -l selftest -t -I 197

score 2 · Answer 2 · 2011-03-09T19:38:42

Самый простой способ остановить сообщение без замены диска - заставить диск пометить сектора как хорошие или плохие вместо «возможно, возможно, плохие», что означает "ожидание". Вы можете сделать это, принудительно прочитав диск:

sudo dd if=/dev/sdb of=/dev/null bs=64K conv=noerror

Это будет считывать каждый сектор диска и игнорировать ошибки, заставляя диск перепроверять каждый ожидающий сектор и сообщать вам, действительно ли сектора повреждены или нет.

Обратите внимание, что хотя это очистит текущие 11 ожидающих секторов, оно может обнаружить новые потенциально плохие сектора в процессе (что приведет к ненулевому числу ожидающих секторов). Запустите это снова, пока нет больше не ожидающих секторов.

score 1 · Answer 3 · 2011-03-09T19:38:42

Хм ... Я не знаю, как вы можете переконфигурировать smartd, но теперь я могу заставить OMD [1] игнорировать определенные ошибки SMART (я однажды сделал это со стабилизированным перераспределенным числом секторов). Может быть, это также вариант для вас, если вы хотите контролировать больше параметров вашей коробки, чем просто показания SMART.

Сейчас выбран русский

Как игнорировать конкретную ошибку SMART

3 ответа3

Всё ещё ищете ответ? Посмотрите другие вопросы с метками unix hard-drive smart.

Как игнорировать конкретную ошибку SMART

3 ответа3

Всё ещё ищете ответ? Посмотрите другие вопросы с метками unix hard-drive smart.

Похожие