Не зная ничего о жестких дисках, мне интересно, как поставщик облачных услуг контролирует свои жесткие диски на наличие проблем (повреждение данных, потеря данных, сбой жесткого диска и т.д.). Поиск в Google не раскрывает ничего, кроме как "скачать комплект для ремонта вашего жесткого диска и нажать кнопку ремонта". Я хотел бы знать, что происходит в этом процессе восстановления, а еще лучше, как поставщик облачных услуг регулярно контролирует качество своих жестких дисков. Я где-то читал, что BackBlaze ежедневно проводит анализ статистики SMART , чтобы увидеть, как работают их жесткие диски, но я не совсем уверен, что это значит.
Мы используем Smartmontools для захвата данных SMART.
Репо здесь, но я хотел бы знать, что делает этот Smartmontools. Не обязательно в деталях, но краткий обзор. Не могу сказать из репо, что он делает.
То, что я думаю, произойдет (для мониторинга жесткого диска), это. Создайте базу данных с MD5-хешами каждого файла. Периодически сканируйте весь жесткий диск и делайте контрольную сумму каждого файла с сохраненным хешем MD5. Но похоже, что это будет очень медленно, особенно на терабайтных жестких дисках. Я не совсем уверен, какие сбои вы можете иметь, и какие уведомления вы можете получить. Возможно, вы можете использовать события файловой системы, но я не уверен, как это будет работать на внешнем диске, а не на основном компьютере. Но даже если бы он работал на внешнем жестком диске, я не уверен, что он получит уведомление, когда данные будут повреждены из-за старения устройства. Таким образом, кажется, что единственный способ проверить правильность данных - это сравнить текущие данные со старыми. Но кроме контрольной суммы я не совсем уверен, какой эффективный способ можно сделать, чтобы сделать это.
Главное, что вы хотели бы видеть в процессе мониторинга, это знать, когда диск начинает работать не так хорошо, чтобы вы могли подготовиться к его замене. Ремонт диска - это совсем другое, и я не знаю, как он работает, но я не буду спрашивать об этом здесь. Я просто хотел бы знать, как вы обычно наблюдаете за внешним жестким диском и как вы знаете, когда он начинает работать некорректно (т.е. как вы знаете, были ли данные повреждены / потеряны эффективным способом, и тому подобное),
Это, кажется, предлагает некоторую информацию.
Вместо того, чтобы просто знать "просто применять технологию x", я хотел бы знать, как на самом деле реализовать ее как приложение или что-то еще, по крайней мере, основы для начала.