1

Несколько месяцев назад мы создали около 12 машин для работы с Ubuntu. Каждый из них имеет следующие характеристики:

Материнская плата ASUS Z8NA-D6 Двухъядерный четырехъядерный процессор Intel® Xeon® R E5520 @ 2,27 ГГц Блок питания OCZ Mod Extreme Pro 500 Вт 12 ГБ Kingston RAM Видеокарта Nvidia GeForce 9800 GT

Моя машина какое-то время хорошо работала. Тем не менее, он начал испытывать случайные блокировки. Эти блокировки не являются блокировками X, они полностью зависают. Ник перестает отвечать, магические кнопки sysrq не будут работать. Машина мертва.

Я впервые заподозрил ОЗУ. Memtest86 ничего не нашел, но я все равно заменил оперативку. Тем не менее, блокировки. Поэтому я заменил видеокарту. Тем не менее, больше замков. Они становились все более частыми и начинали происходить 2-3 раза в день.

Поэтому я заменил материнскую плату и блок питания одним махом. Внезапно, больше нет тупиков! Woohoo!

За исключением того, что через неделю утром машина не проснется. Я сбросил его, запустил, и файлы журнала показали последнюю запись около 11 часов вечера. Это начало происходить с большей частотой ... теперь, почти каждое утро, когда я захожу, машина блокируется и работает с прошлой ночи.

Вчера, через 3 недели, с тех пор как я заменил материнскую плату и блок питания, машина фактически зависла в середине работы. Это первый раз после замены двух (МБ и PS), что это произошло, когда я использовал его. Все остальные произошли, пока меня не было.

Я в недоумении. В системном журнале или сообщении нет ничего, что указывало бы на проблему во время блокировки. Темпы хороши ...Я использую lmsensors для мониторинга и имею скрипт, который записывает вывод в файл каждую минуту. Они никогда не поднимаются так высоко.

Единственное, что я не заменил на данный момент, это корпус и жесткие диски. Я сомневаюсь, что любой из них может быть причиной.

Что бы вы сделали, если бы вы были на моем месте? Есть ли способ устранения неполадок, который я пропускаю?

К слову сказать, у всех остальных машин, у всех одиннадцати проблем нет. Они все используют ту же версию Ubuntu (Lucid), что и я.

1 ответ1

2

Поскольку у вас есть несколько идентичных систем, у вас есть хороший кандидат на обмен бинарными частями.

Возьмите работающую систему и поменяйте местами, скажем, процессоры. Посмотрите, переносится ли проблема на другую машину. Тогда все ОЗУ. (Я знаю, что вы заменили всю оперативную память; однако с ОЗУ, отличным от ECC, вполне возможно, что вы заменили плохую ОЗУ на плохую.) Продолжайте со всеми другими частями, пока проблема не переместится. Вы можете сэкономить материнские платы, потому что в конце концов вы поменяете местами все остальные детали, что тоже самое.

Если вы не можете сэкономить машину, вы можете попробовать уменьшить ее вдвое, или, если у вас два процессора, удалить один.

Вносите одно изменение за раз, чтобы вы могли сразу определить проблему. Вы можете столкнуться с ситуацией, когда обе машины становятся ненадежными. Это может быть связано с тем, что в исходной системе имеется более одной проблемы, и / или существует некоторая пограничная проблема, такая как очень незначительный источник питания.

РЕДАКТИРОВАТЬ: После небольшого исследования, я считаю, что ваши $ 39,99 после скидки источник питания является крайне незначительным, как по качеству, так и по размеру. Вы много вложили в эти системы. Пожалуйста, не заменяйте этот дешевый блок питания на 500 Вт дешевым блоком питания на 1000 Вт. Зайдите на jonnyguru.com и получите некоторые рекомендации по качественным источникам питания, перечислите свои компоненты и дайте им возможность выбрать мощность. Я думаю, 650 Вт или около того, но качество не менее важно, чем мощность. Недавно они рассмотрели 1000 Вт P/S, который на самом деле был больше, чем 650 Вт, так что у вас есть идея, что мощности многих источников питания нельзя доверять.

Даже если вы обнаружите, что проблема связана с другим компонентом, я все же рекомендую обновить блоки питания в этих системах.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .