На прошлой неделе машина mini-ITX, которую я создал для обслуживания почты и общих папок Samba, дважды запаниковала ядром из-за файловой системы. Прошлой ночью я заметил ошибки целостности при потоковой передаче фильма на мой приставочный клиент (видео артефакты), поэтому я начал возиться.
И на внутреннем жестком диске, и на внешнем жестком диске используется программный RAID-массив linux и на любом зеркале, если я делаю md5sum для довольно большого файла, такого как видео, и повторяю это несколько раз, я каждый раз получаю разные контрольные суммы (я должен отметить, что один - ext4, другой - JFS). Я загрузил флешку в режим восстановления, тоже самое происходит. Я не пробовал считывать данные с внешнего зеркала на другом компьютере, но я смонтировал один из составляющих дисков, и он выглядел нормально, по крайней мере, он давал согласованные значения md5.
Итак, файловая система исключена (это происходит как на ext4, так и на JFS), жесткие диски, вероятно, отсутствуют (это было бы невероятным совпадением), контроллеры SATA, вероятно, не видят, как это происходит на двух полностью независимых контроллерах, поврежденном модуле ядра или что-то происходит, даже если оно загружается с аварийного диска.
Тот факт, что это происходит с двумя отдельными наборами дисков, управляемыми двумя отдельными контроллерами SATA, работающими с двумя разными файловыми системами, и поведение сохраняется при загрузке двух разных ядер, заставляет меня думать, что единственно вероятным вариантом является то, что что-то ужасно неправильно с материнская плата. Эта материнская плата уже была заменой RMA от компании, которой я не особо доверяю (Zotac), так что это было бы менее удивительно, чем обычно.
Это Ubuntu Server 10.04, кстати, 64-битный, на материнской плате Zotac IONITX-C (я думаю) с Atom N230.
У кого-нибудь есть другие идеи, диагностика, которую я должен выполнить, и т.д.?
РЕДАКТИРОВАТЬ: две вещи, которые я забыл упомянуть: когда я загрузился с USB-ключа, я запустил fsck на обоих md-устройствах.
Вот как выглядит паника:
Я попытался найти в Google некоторые из них, но без особого успеха, но, думаю, в любом случае, скорее всего, виноваты аппаратные средства; Я просто не знаю, какой именно аппарат .
РЕДАКТИРОВАТЬ 2: Просто запустил memtest86, и ни один тест не проходит. Наименее значимые 2 байта тестового шаблона, кажется, всегда читаются неправильно. Все еще не уверен, является ли это ОЗУ или чипсетом, и у меня нет дополнительной палки ОЗУ для тестирования.