1

У меня есть две системы примерно одного возраста с похожими проблемами:

Первая система:

ASUS P8h67-m-le мама r3 версия i7 2600 (3,4 ГГц)
8 ГБ ОЗУ ddr 3 (2x4 ГБ, двухканальный) RAID 1 через Intel RST с 2 ГБ 1 ТБ WD Green Coolermaster 600 Вт, блок питания для Windows 7, 64-разрядная профессиональная версия (оригинальная лицензия). система защищена от скачков напряжения через ИБП 10 кВА

Симптомы:

Система работала нормально почти 3 года. В прошлом месяце RAID потерял работоспособность и перестраивался при плохом отключении питания из-за зависания приложения. После этого ухудшается и перестраивается несколько раз после выключения с использованием обычного выключения и включения. За последние две недели система начала зависать (зависает полностью, иногда указатель мыши также зависает, в то время как мыши других движутся). [по-видимому, это увеличение частоты замерзаний]
После этого мне пришлось перезагрузить систему. Каждый раз, когда он начал восстанавливать RAID 1 (для восстановления RAID требуется четыре часа), теперь он зависает примерно один раз в день.

Вещи, которые я проверил:

  • Новый баран и новый блок питания дают ту же проблему.
  • Видимо без RAID (удаление 1 жесткого диска), кажется, решить проблему.
  • С жестким диском все в порядке (тестируется в другой системе со стресс-тестом, коротким самотестированием и долгим самотестированием). Также просматривать смарт-журналы, кажется, в порядке.
  • Стресс-тест процессора пройден.
  • Проверенные температуры в порядке, система не перегревается.
  • Переместите один жесткий диск в другую систему с Intel RST и не можете получить к нему доступ (Bios видит диск, контроллер не показывает его, но диспетчер оборудования Windows показывает его), перемещает этот же диск в другую систему без Intel RST и МОЖЕТ ЛИ ДОСТУП К ЭТОМУ???
  • Перемещение серверного приложения в другую аналогичную систему решает проблему, поэтому проблема не в приложении, а в аппаратном обеспечении.

Проблема: когда система зависла, я ничего не получил из журнала событий Windows. Нет зависания приложения, нет проблем с RAID, ничего. Журнал RST в Windows не содержит подробностей о том, какой жесткий диск вышел из синхронизации, только что ухудшился статус (по крайней мере, в моей системе).

Странная вещь, которую я заметил: добавление еще одного внутреннего жесткого диска в систему (вне RAID-массива для резервного копирования), похоже, вызывает ухудшение RAID и начало регенерации RAID 1.

Я предполагаю, что MB терпит неудачу

Вторая система:

Процессор I5 не может вспомнить спецификации сейчас Asus MB h81m-k RAID через программное обеспечение Windows 7 64bit. 8 ГБ оперативной памяти 2x 1 ТБ HDD Caviar blue

Симптомы: Сервер работает нормально в течение 2 лет. Месяц назад: RAID сервера не синхронизирован, попытка повторной синхронизации не завершена (четыре дня ожидания)
Серверное приложение часто зависало (не требуется перезагрузка, просто снова открывало приложение) или закрывало терминальные соединения. Перемещение серверного приложения в другую аналогичную систему решило проблему, поэтому проблема не в приложении.

Тесты, которые я провел:

Отформатируйте один жесткий диск в systen (формат занял один день и никогда не заканчивался). Поэтому я удаляю hdd (тот, который не синхронизирован и пробует его в другой системе). Формат закончился в обычное время. Выглядело умным и, кажется, хорошо. Перенес этот жесткий диск в систему и попробуйте снова выполнить синхронизацию Soft RAID: никогда не завершалась повторная синхронизация дисков. Смена блока питания и оперативной памяти не решила проблему. Удаление жесткого диска, который не был синхронизирован, не решила проблему, так как приложение все равно зависало.


Что общего у обеих систем:

  • примерно два года использования
  • тяжелый HDD для чтения / записи
  • серверные приложения отличаются
  • той же марки HDD.
  • Жесткий диск, кажется, хорошо в других системах.
  • Та же ОС и легальная копия
  • память и бп не причина.
  • Никаких признаков визуального повреждения на MB
  • Никто не трогал внутренние системы.

Я предполагаю, что порты / контроллер sata не могут справиться с интенсивной активностью жесткого диска и со временем ухудшаются / ломаются, вызывая сбои, которые в обеих системах выглядят по-разному из-за характера различных типов рейдов.

1 ответ1

0

Не перестраивайте свой рейд снова и снова! Выясните, почему карта вышла из строя диска и (скорее всего) заменить диск. Вы можете использовать утилиту командной строки под названием smartctl для проверки диска - если что-либо содержит более 500-1000 ошибок или имеет ряд ошибок, которые продолжают увеличиваться, то, вероятно, пришло время заменить диск.

Если вам нужно перестроить диск, на который был произведен рейд, после того, как он подключен к чему-то другому, это связано с тем, что информация, относящаяся к рейду, была немного испорчена (у перк-карт Dell /LSI есть этот дополнительный фрагмент данных на диске, но я никогда не вызывал перестройку путем ручного монтажа привода). Наконец, всевозможные проблемы с оборудованием могут вызвать зависание системы. Плохая карта рейда может вызвать зависание, а также проблемы с электричеством на ваших жестких дисках или проблемы с контроллером на вашем жестком диске. Иногда проблемы с повреждением файловой системы вызывают сбой ядра, но это должно быть действительно заметно и очевидно, если это является причиной проблемы. Что-то странное, что я когда-то видел, было то, что тепло от изношенных подшипников на жестком диске вызывало температурные проблемы с компьютером (ноутбуки склонны к этому) - как изношенный жесткий диск мог вызвать температурные проблемы с вашей видеокартой, которая могла полностью заморозить все , Не мешало бы проверить сообщения ядра прямо перед тем, как ваша машина зависла, /var /log /kern в Debian /Ubuntu. Недостаточно мощный источник питания может привести к сбоям. В общем, попробуйте отключить ненужное оборудование, пока система не перестанет падать :).

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .