1

Я должен исследовать недавнее увеличение количества сбойных массивов RAID-1 (зеркал), с которыми мы сталкиваемся в нашем установленном ПК-парке (10K+ ПК).

Проблема двоякая: одна часть пилотного этапа, который мы начали с твердотельных накопителей (SSD). Мы выпустили около 80 ПК с двумя SSD-накопителями Kingston V300 60 ГБ в RAID-1. На этих установках мы видим 10-15% отказов в течение периода макс. 3 месяца, что с курса недопустимо. Это на платформе ПК со встроенным RAID-контроллером Intel ICH7R SATA

Во-вторых, мы также наблюдаем тревожное увеличение количества сбоев на существующей платформе с недавними жесткими дисками Seagate Barracuda. Эти системы основаны на старых платформах P4 и используют RAID-контроллер Promise FastTrak TX2300 SATA. Мы используем эти системы с одними и теми же RAID-контроллерами уже более 7 лет, но только с недавно использованными жесткими дисками Seagate мы наблюдаем увеличение частоты отказов.

Теперь о проблеме: в обоих случаях я не могу определить причину сбоя этого RAID-массива. Я получил примеры неисправных систем для обоих случаев. Проблема заключается в том, что при исследовании дисков оба диска работают нормально, не сообщают об ошибках SMART и имеют все свои файлы для чтения (кроме файлов, созданных после сбоя массива).

При стирании дисков и воссоздании RAID-массива система отлично работает в лаборатории.

Могу ли я использовать какие-либо инструменты для дальнейшего анализа этих дисков? Я мог бы полагать, что они работают нормально большую часть времени, но из-за короткого взлома RAID-контроллером помечены как «плохие». Это также может быть RAID-контроллер, который неисправен, я полагаю? Как это проверить?

Обе упомянутые системы работают на Windows POSReady 2009 (в основном Windows XP)

0