3

Просто хочу заметить, что у меня нет проблем в данный момент, но у меня уже были проблемы, которые пробудили мое любопытство ...

Когда компьютер внезапно зависает до такой степени, что заглушка загорается непрерывно, и появляется единственная возможность перезагрузить компьютер. Как устранить неполадку, вызвавшую его? В Windows были бы некоторые ошибки в журнале событий ... в Linux кажется, что нет никакой возможности что-либо записать в журнал, что затрудняет поиск и устранение неисправностей ...

В этом случае, как бы вы решили проблему через Linux?

5 ответов5

4

Попробуйте загрузить memtest86+ с загрузочного носителя и посмотрите, что он говорит о вашей памяти и целостности подсистемы памяти.

Кроме того, последнее запущенное задание может быть зарегистрировано в Cron в /var /log /syslog или /var /log /messages.

Если нет, и отладка этой проблемы на постоянной основе, вы можете настроить для Audit и cron задание с ps для регистрации активности системы и того, какие задания выполняются на постоянной основе.

3

Устройства Kernal сообщают о проблемах в dmesg , который также может быть зарегистрирован отдельно или в kern.log .

Для серьезных проблем может использоваться диагностическая плата POST .

2

На большинстве Linux сегодня у вас должен быть журнал MCE (исключение проверки компьютера), который может быть декодирован для поиска реальных аппаратных ошибок (http://freshmeat.net/projects/mcelog/). Кроме того, вы можете запустить Kernel Crash Dump, ядро, которое запускает ядро Linux, которое вы используете ежедневно, и с этим перехватывает инцидент и устраняет причину.

2

Журналы - это первое место, которое нужно искать, как говорит kmarsh, но если журналы ничего не говорят в случае серьезного сбоя HW, то не имеет значения, какую операционную систему вы используете, просто нужны пробные и старые ошибки ,

Определите, является ли это аппаратной проблемой, запустив live CD, в противном случае это может быть проблема с драйвером, ошибочно диагностированная как аппаратный сбой.

Блокировки HW случайны, но часты. Я бы начал с удаления видеокарт (используйте встроенные или резервные карты), сетевых карт или (задыхающихся) модемов, если они у вас есть, по одному, пока вы не определите виновника. Запускайте по одной карте памяти за раз (если у вас есть x2) или меняйте другие палочки во время тестирования.

Ваш блок питания также может выходить из строя, иногда добавление новой карты приводит к потере мощности, что приводит к истощению ресурсов процессора, если ваш блок питания недостаточно мощный, что приводит к случайным сбоям.

Если больше ничего не дает, это может быть ваша основная плата (обычно коррозия, если она составляет 2 года в зависимости от влажности, в которой вы живете) или процессор.

Используйте программное обеспечение для контроля температуры процессора, перегрев также может вызвать зависания.

Попробовав все под солнцем, не повезло, возможно, пришло время для нового ПК;)

0

В настоящее время, когда ранее работающая установка начинает плохо себя вести, я даже не пытаюсь сначала читать журналы или что-то подобное. Качество драйверов и т.д. Сегодня настолько хорошее, что большинство внезапных ошибок было устранено, и некоторые аппаратные проблемы более вероятны, чем программные. И даже самый совершенный код не может бороться с физическими проблемами.

Некоторое время назад мой ноутбук начал странно себя вести. При просмотре фильма, компиляции кода или выполнении чего-либо, даже относительно интенсивного использования процессора, все вдруг стало намного медленнее. Перемещение окна заняло всего 1-15 секунд. Частота процессора упала с 2 ГГц до 800 МГц и решил остаться там. Даже температура на холостом ходу была около +60С. Время от времени все это запиралось.

После уборки пыли внутри ноутбука все нормализовалось. Температура холостого хода +35-40С, замедлений нет.

Хорошо, это было довольно просто отследить из-за жары и из-за чрезмерного количества пыли внутри ноутбука. :-)

Если появляется что-то более сложное, я обычно сначала запускаю memtest86 и проверяю, дает ли это какие-либо результаты. Если это не так, я запускаю cpuburn или какую-либо подобную программу и проверяю, не приводит ли это к краху моего компьютера. Если это не поможет, я перейду к пытке жесткого диска с помощью bonnie++ или iozone и посмотрю, не сломалось ли это. Затем я перехожу к 3D-тестам, таким как игра в PPRacer.

Если после всех этих тестов я не могу получить контролируемый сбой, я перехожу к исследованию более неясных вещей. Возможно, виновата автоподвеска USB? Или что-то еще более странное.

В одном случае компьютер блокировался при каждом запуске программного обеспечения веб-камеры. Потратив слишком много времени на настройку параметров ядра и так далее, lsusb обнаружил что-то неловкое. Веб-камера была подключена к порту USB 1.1 вместо порта USB 2.0. После подключения камеры к порту USB 2.0 она начала работать.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .