16

Фон

Моя персональная настольная система дома имеет 5 накопителей SATA, установленных внутри. Недавно моя система начала выходить из строя странными способами, такими как случайная паника ядра, и я в конечном итоге отследил ее до случайных падений в массиве RAID. Иногда я мог загрузиться, иногда я не мог и так далее. После некоторой погони за проблемами с программным обеспечением я, наконец, пошел тянуть диски и обнаружил настоящую причину их отказа: они были жарче, чем барбекю 4 июля! Вентилятор переднего корпуса заклинило, а на вентиляторе PS был ослаблен разъем питания, застрявший в решетке, поэтому внутренняя часть корпуса готовилась.

В ожидании я нашел вентилятор дома и охладил эту присоску. Это бежало отлично со всем хорошим и холодным. Примерно в это же время я узнал, как получить показания температуры привода от SMART.

for i in a b c d e; do
    sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done

Теперь я знаю, что с моим делом открыт вентилятор дома, постоянно вычищающий паутину, при которой диски работают под углом 31-32 °. Быстрый тест без вентиляции для репликации неисправного состояния показывает, что накопители довольно быстро разогнались до 40-х. Я не знаю, как это было плохо во время фактического сбоя или как долго это было так.

Помня об этом, я заменил неисправные вентиляторы, добавил еще пару, модернизировал передний, обдувая диски с 80 мм до 120 мм, и снова закрыл его. Когда он снова стоит в вертикальном положении, временной диапазон обычно находится на уровне 32 ° в нижней части набора и 37 ° в верхней части.

Вопрос

Каков общий безопасный диапазон рабочих температур для накопителей SATA? Должно ли 37 ° быть проблемой или повреждение диска не является проблемой до определенного момента?

Несмотря на то, что накопители, похоже, сейчас проходят испытания нормально, насколько вероятно, что в прошлом воздействие тепла могло привести к их выходу из строя сейчас?

4 ответа4

25

37 градусов не должны быть проблемой вообще. Естественно, жесткие диски отличаются по своим характеристикам, некоторые могут работать горячее, чем другие. Вы должны проверить опубликованные спецификации дисков, которые у вас есть. Например, рабочая температура WD Caviar Black 1 ТБ составляет от -0 ° C до 60 ° C. Конечно, вы не хотите, чтобы ваш привод работал на 60 °, так как это может сократить срок его службы.

Google опубликовал очень интересное исследование (PDF) о состоянии и сроке службы жесткого диска, основанное на данных, собранных с их систем (многие тысячи жестких дисков). Это исследование говорит, что:

В целом наши эксперименты могут подтвердить ранее сообщенные температурные эффекты только для верхнего предела нашего температурного диапазона и особенно для более старых приводов. В нижнем и среднем диапазонах температур более высокие температуры не связаны с более высокими показателями отказов. Это довольно неожиданный результат, который может указывать на то, что разработчики центров обработки данных или серверов имеют больше свободы, чем предполагалось ранее, при настройке рабочих температур для оборудования, содержащего дисковые накопители.

Их график показывает, что частота отказов не повышается, пока температура привода не превысит 45 градусов.

3

Это только мой ограниченный личный опыт, но я пробовал несколько дисков в верхних 40C без проблем в течение 2-3 лет, так как я использовал бесшумный корпус (охлаждаемый небольшим вентилятором, чтобы избежать 50C). При таких временах я бы предположил более короткую продолжительность жизни и быструю смерть, а не случайное повреждение данных, но я могу ошибаться. В любом случае, под 40C-42C все в порядке.

Но не стоит недооценивать другие факторы, которые могут играть роль в повреждении данных:

1) Южный мост, в котором находится чипсет контроллера IDE/RAID, часто охлаждается только небольшим радиатором. Они имеют тенденцию нагреваться в нормальных условиях, поэтому повышение температуры окружающей среды из-за отсутствия воздушного потока в корпусе и большого количества жестких дисков может привести к повреждению данных.

2) Перегрев ОЗУ или ЦП является распространенной причиной ошибок памяти CRC, что приводит к повреждению данных. Мониторинг температуры процессора и выполнение тестов памяти очень важны в случае повреждения данных.

Если ваши текущие показатели SMART в порядке и не показывают некорректное число секторов, я считаю диски безопасными для использования.

0

Я прочитал упомянутый выше отчет и проверил диапазоны рабочих температур для жестких дисков Samsung, WD и Hitachi. Основываясь на исследованиях, я пришел к выводу, что приводы, работающие в диапазоне от 30 до 45 градусов, обеспечивают наименьшую вероятность сбоя; УМНАЯ высокая температура до 55 градусов не является причиной для беспокойства; и что температура Peek выше 60 градусов будет указывать на снижение ожидаемого срока службы привода.

Мои собственные тесты показывают, что в периоды интенсивного доступа следует ожидать повышения до 10 градусов.

Кажется, существует какой-то неизвестный фактор в работе, который вызывает ненормальную частоту отказов на внешних дисках. Хотя тепло, кажется, является частью проблемы, это не полный ответ. Я бы посоветовал всем пользователям внешних накопителей внимательно следить за температурой, когда происходит изменение характера использования накопителей или окружающей среды. Это, кажется, некоторая "неизвестная" (не обычная) проблема, которая приводит к перегреву этих приводов.

В настоящее время я отклоняю объяснение компьютерного вируса, невежества пользователей, плохих протоколов USB и размещения дисков в неподходящем месте.

0

В первоначальном сообщении говорилось, что пользователь не знает, насколько сильно нагрелись его накопители - некоторые диски записывают этот параметр, и он доступен через информацию SMART. Жесткий диск Sentinal - это одна часть программного обеспечения, которая сообщает о максимальной температуре за весь срок службы.

Я видел результаты для приводов Maxstor, WD & Seagate

Пара моих внешних USB-накопителей, которые я использую для резервного копирования, показывают максимальные температуры 63 и 64 С соответственно! Я сейчас построил кулер для внешнего накопителя

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .