3

На прошлой неделе машина mini-ITX, которую я создал для обслуживания почты и общих папок Samba, дважды запаниковала ядром из-за файловой системы. Прошлой ночью я заметил ошибки целостности при потоковой передаче фильма на мой приставочный клиент (видео артефакты), поэтому я начал возиться.

И на внутреннем жестком диске, и на внешнем жестком диске используется программный RAID-массив linux и на любом зеркале, если я делаю md5sum для довольно большого файла, такого как видео, и повторяю это несколько раз, я каждый раз получаю разные контрольные суммы (я должен отметить, что один - ext4, другой - JFS). Я загрузил флешку в режим восстановления, тоже самое происходит. Я не пробовал считывать данные с внешнего зеркала на другом компьютере, но я смонтировал один из составляющих дисков, и он выглядел нормально, по крайней мере, он давал согласованные значения md5.

Итак, файловая система исключена (это происходит как на ext4, так и на JFS), жесткие диски, вероятно, отсутствуют (это было бы невероятным совпадением), контроллеры SATA, вероятно, не видят, как это происходит на двух полностью независимых контроллерах, поврежденном модуле ядра или что-то происходит, даже если оно загружается с аварийного диска.

Тот факт, что это происходит с двумя отдельными наборами дисков, управляемыми двумя отдельными контроллерами SATA, работающими с двумя разными файловыми системами, и поведение сохраняется при загрузке двух разных ядер, заставляет меня думать, что единственно вероятным вариантом является то, что что-то ужасно неправильно с материнская плата. Эта материнская плата уже была заменой RMA от компании, которой я не особо доверяю (Zotac), так что это было бы менее удивительно, чем обычно.

Это Ubuntu Server 10.04, кстати, 64-битный, на материнской плате Zotac IONITX-C (я думаю) с Atom N230.

У кого-нибудь есть другие идеи, диагностика, которую я должен выполнить, и т.д.?

РЕДАКТИРОВАТЬ: две вещи, которые я забыл упомянуть: когда я загрузился с USB-ключа, я запустил fsck на обоих md-устройствах.

Вот как выглядит паника:

Я попытался найти в Google некоторые из них, но без особого успеха, но, думаю, в любом случае, скорее всего, виноваты аппаратные средства; Я просто не знаю, какой именно аппарат .

РЕДАКТИРОВАТЬ 2: Просто запустил memtest86, и ни один тест не проходит. Наименее значимые 2 байта тестового шаблона, кажется, всегда читаются неправильно. Все еще не уверен, является ли это ОЗУ или чипсетом, и у меня нет дополнительной палки ОЗУ для тестирования.

1 ответ1

1

Мой голос - плохая память или что-то на чипсете. Можете ли вы заменить оперативную память заведомо исправной и посмотреть, как она работает? - (большинство современных Linux также имеют опцию "memtest" на установочном диске, которую вы можете попробовать, если не знаете, как работает хороший баран, хотя я бы посоветовал выбрать хороший RAM как лучший тест.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .