Начиная с пары дней, мой Seagate Momentus 7200.4 все больше и больше выходил из строя, возможно, из-за отключения электроэнергии. После «ПРЕДУПРЕЖДЕНИЕ: ваш жесткий диск выходит из строя» (я использую fedora), основным симптомом была медлительность: постоянное 100% -ое ожидание ЦП в течение нескольких часов, практически невозможно что-либо сделать. Я сделал резервную копию, затем перезапустил и мне пришлось выполнить e2fsck -y (много выходных данных), который я должен был повторить позже (даже не загрузился в какой-то момент, паника ядра), я долго делал некоторые тесты smartctl и Короче говоря, я оставил его в покое на ночь, чтобы исправить его сектор или что-то еще.
Теперь количество накопленных ошибок кажется меньшим, и компьютер в основном пригоден для использования, но что я должен сделать: есть ли какая-нибудь команда fsck с лучшими эффектами или какой-то другой способ заставить ее пропускать поврежденные сектора и продолжать функционировать, кроме исправления секторов один за другим с hdparm? Или диск обязательно будет уничтожен?
Выдержки из smartctl -x /dev /sda:
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate POSR-- 085 074 006 - 243348742
5 Reallocated_Sector_Ct PO--CK 100 100 036 - 0
7 Seek_Error_Rate POSR-- 084 060 030 - 238612361
9 Power_On_Hours -O--CK 087 087 000 - 11535
198 Offline_Uncorrectable ----C- 100 100 000 - 8
199 UDMA_CRC_Error_Count -OSRCK 200 200 000 - 0
240 Head_Flying_Hours ------ 100 253 000 - 132680129719553
241 Total_LBAs_Written ------ 100 253 000 - 2525013242
242 Total_LBAs_Read ------ 100 253 000 - 2162196433
Error 3759 [18] occurred at disk power-on lifetime: 11535 hours (480 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER -- ST COUNT LBA_48 LH LM LL DV DC
-- -- -- == -- == == == -- -- -- -- --
40 -- 51 00 00 00 22 7e 00 3d 2a 00 00 Error: UNC at LBA = 0x227e003d2a = 148142832938
Commands leading to the command that caused the error were:
CR FEATR COUNT LBA_48 LH LM LL DV DC Powered_Up_Time Command/Feature_Name
-- == -- == -- == == == -- -- -- -- -- --------------- --------------------
60 00 00 00 08 00 22 7e 00 3d 28 40 00 18:38:24.892 READ FPDMA QUEUED
27 00 00 00 00 00 00 00 00 00 00 e0 00 18:38:24.891 READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
ec 00 00 00 00 00 00 00 00 00 00 a0 00 18:38:24.889 IDENTIFY DEVICE
ef 00 03 00 46 00 00 00 00 00 00 a0 00 18:38:24.889 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 00 00 00 00 00 e0 00 18:38:24.889 READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
SMART Extended Self-test Log Version: 1 (1 sectors)
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 11528 574443398
Дополнительная информация:http://p.defau.lt/?DTSGCmr7mb_anDD3IQ9Bgg http://p.defau.lt/?hNM7_BusGyz4DYLi9XX0Kg http://p.defau.lt/?wQArANAXPLnpyD87xUY6CA http://p.defau.lthhhwh
Обновление: как вы сказали, диск должен быть уничтожен, я сделал dmesg | grep -oE "сектор.+$" | sort -u и я sudo hdparm --write-sector --yes-i-знаю-что-я-делаю 'да дюжина секторов. Теперь запустим еще один тест, посмотрим, что из этого получится.
Обновление 2: мне пришлось исправлять еще несколько поврежденных секторов с помощью hdparm вручную, но ночью позже все ошибки, которые я нахожу в системном журнале, похоже, были успешно исправлены автоматически, как и обычно. В то же время я столкнулся с некоторыми забавными ошибками, такими как искаженный звук в стиле техно-музыки и сумасшедший grep, но для их исправления может быть достаточно yum-обновления. Последний smartctl -a /dev /sda выполнен без ошибок; Теперь у меня есть «Количество ошибок ATA: 5004», 2 для 197 Current_Pending_Sector и 198 Offline_Unc корректируемый.
Обновление 3: система в основном работоспособна, но проблемы остаются: «Число ошибок ATA: 9484». Мне иногда приходится использовать трюк hdparm, но я думаю, что он не работает должным образом, потому что проблема позже появляется в следующем секторе. Offline_Unc корректируемый не растет, поэтому я подозреваю, что диск не может деактивировать поврежденные сектора. Я думаю, я должен сдаться и купить новый ...