40

Я ищу советы, советы и ответы о том, как начать устранение неполадок, когда:

  1. Проблема прерывистая
  2. Проблема может лежать буквально где угодно - операционная система; бесплатное исходное программное обеспечение; мои собственные разработки программного обеспечения; купленное программное обеспечение; крошки на клавиатуре; конкретная комбинация программного обеспечения, которое я сейчас использую; Максвелл демон; маленькие голубые человечки, фактически управляющие машиной, объявили забастовку; и т.п.
  3. У меня есть опыт только в нескольких из областей, которые являются потенциальными кандидатами на причину проблемы.

Конкретная проблема, с которой я сталкиваюсь, подробно описана ниже в качестве примера, но я не ищу ответы на мою текущую проблему, а скорее где и как приступить к решению таких проблем.

В настоящее время я столкнулся с проблемой с моей новой машиной. В нескольких случаях машина только что замерзла; не принимать нажатия клавиш, щелчки мышью или что-либо, кроме выключателя питания. Неизменно я просто просматривал Интернет; У меня было запущено несколько (<= 6 других приложений). Ни одно из этих приложений не является основным; и представляют собой набор коммерческих программ и программ с открытым исходным кодом, обычно перенесенных из Unix некоторого разнообразия.

Моя машина - четырехъядерный ноутбук с операционной системой Windows 7 I7.

РЕДАКТИРОВАТЬ:

Хотя я и заявил, что фактическое описание проблемы является лишь примером, некоторые комментарии сосредоточены на решении этой проблемы. К сожалению, поскольку это был только пример, приведенная информация верна, но не полна. Чтобы люди не тратили свое время на попытки удаленно помочь в решении реальной проблемы, я даю некоторую другую информацию о моих настройках. Как я уже говорил, я не ищу ответов на эту конкретную проблему.

Моя машина - мощный ноутбук; моя главная машина; используется для разработки и технического письма, коммуникации - электронной почты, Интернета, FTP и т. д., а также для редактирования и индексации фотографий. На нем, по крайней мере, ежемесячно запускается строгий и обширный набор программ тестирования оборудования, в том числе тесты ЦП, тестирование нескольких модулей памяти и тесты всех других компонентов. Также, по крайней мере, ежемесячно выполняйте полную проверку на вирусы; полное сканирование шпионских программ; очистка диска; и дефрагментация диска.

Диск содержит примерно 3 * 10 ^ 6 файлов; Использование диска составляет 300 ГБ, оставляя 150 ГБ бесплатно. Память 8 Гб. Хотя машина может немного нагреваться, когда я использую полный набор основных инструментов разработки, я столкнулся с проблемой только при очень легком использовании машины - просмотр веб-страниц, Textpad, Graphwiz, база данных Firebird и облегченный браузер базы данных (Flame Robin. ). В этих условиях даже вентилятор не слегка греет. Я не внес никаких изменений в программное обеспечение, операционную систему или аппаратное обеспечение в течение периода, когда я столкнулся с проблемой. Произошло несколько автоматических обновлений - в основном Microsoft, Adobe и Lenovo, но не исключительно.

Этот фон помещает в контекст (я надеюсь) мои причины для того, чтобы задать этот вопрос так, как я это сделал. Теперь я собираюсь начать изучение различных журналов, упомянутых в ответах, в качестве первого шага в попытке сузить область исследования. И я собираюсь попробовать выполнить одну из характеристик, предложенных в ответах, которые я получил до сих пор, - терпение - в моем расследовании.

4 ответа4

42

Получите лучшую идею.

Вы не выиграете битву без достаточной полевой информации.

  1. Опишите свою проблему подробно, чтобы у вас было хорошее представление о ней, которая знает, что это случается однажды.

  2. Отслеживайте во времени то, что произошло раньше, и вместе с проблемой, и вас, и вашего компьютера.

  3. Подумайте о возможных причинах, потому что иногда это может быть чем-то неочевидным.

  4. Получайте больше информации, когда у вас нет представления о том, что происходит, это может варьироваться от событий, инструментов SysInternals, анализа производительности, отладки до любого другого инструмента в вашем опыте.

  5. Проверьте свои предположения, чтобы убедиться, что ваши мысли не устраняют причину.

Разделяй и властвуй.

Потому что именно так военные побеждают своих противников, даже когда они в меньшинстве.

Устраните возможные причины, иначе у вас возникнут проблемы с отслеживанием проблемы. Таким образом, вы будете становиться все ближе и ближе к основной причине проблемы, это позволит вам решить проблему намного проще.

Например, с оборудованием отключите и удалите все, что вам не нужно для решения вашей проблемы. Таким образом, вы можете отключить компонент, вызывающий проблему. И затем снова нужно вставить половину компонентов, проверить, повторяется ли он, и повторить разбиение, пока у вас не будет плохого компонента ...

Тестирование чего-либо на другом компьютере, если оно доступно, также является хорошим преимуществом для решения проблемы.

Например, с программным обеспечением, перезагрузка в безопасном режиме, отключение записей запуска также помогает. Это также относится к включению / отключению настроек, попытке настройки по умолчанию и так далее ...

Давайте проверим это.

В настоящее время я столкнулся с проблемой с моей новой машиной. В нескольких случаях машина только что замерзла; не принимать нажатия клавиш, щелчки мышью или что-либо, кроме выключателя питания. Неизменно я просто просматривал Интернет; У меня было запущено несколько (<= 6 других приложений). Ни одно из этих приложений не является основным; и представляют собой набор коммерческих программ и программ с открытым исходным кодом, обычно перенесенных из Unix некоторого разнообразия.

  1. Это правильное описание само по себе, это не просто случается один раз.

  2. Вы знаете, что случилось вместе с проблемой,
    но не думали о том, что вы или ваш компьютер сделали до проблемы.

    Я не могу этого сказать, но вы, ваш журнал событий и недавно измененные файлы / папки могли сказать.

  3. Возможная причина, скорее всего, связана с процессором, потому что это компонент, который обрабатывает вещи.

    Более конкретно, это может быть процесс, драйвер или неисправное оборудование (возможно, проблемы с температурой?).

  4. Я знаю, что это процессор, но не знаю что. События не показывают этого, Process Explorer зависает на DPC.

    Итак, следующий шаг - запустить анализ трассировки, который я закрываю после того, как зависание произошло.

    Я смотрю в след, и я вижу, что драйвер X вызывает проблему !

  5. Никаких реальных предположений не делается. Предположение ЦП обрабатывается нашим подходом «разделяй и властвуй» ...

Итак, вот где я начинаю делиться, чтобы победить проблему, я останавливаюсь, как только решу:

  1. Проблема с текущей версией драйвера?
    Обновите драйвер до последней версии.

  2. Проблема с новейшими версиями драйвера?
    Получите новый след. Обновите драйвер до более старой версии, отличной от первоначальной.

  3. Проблема с устройством? Проблема конфигурации в реестре?
    Получите новый след. Переустановите и / или отключите устройство, если это возможно.

  4. Проблема случайная, процессор нагревается?
    Проверьте температуру процессора, при необходимости замените вентилятор.

  5. Проблема не в процессоре, есть ли другие аппаратные и программные влияния?
    Удалите оборудование и отключите программное обеспечение от запуска, чтобы усилить влияние третьих лиц.

  6. Проблема не в съемной части, ее следует заменить.
    В худшем случае, если ничего не помогает, вам нужно пойти на замену.

Получение новых следов и удаление оборудования дает нам больше информации, поэтому мы знаем, где искать дальше.

6

Хорошие логи и интуиция - правда.

  • С первого дня следите за всем, что вы делаете с системой: обновления приложений и ОС, новые установки, новое или удаленное оборудование или подключения, гроза, которая "не вызывала проблем".
  • Когда вы впервые заметили проблему:
    • Что ты делал?
    • Что еще необычного произошло недавно?
    • Что вы сделали по-другому в последнее время?
    • С этого момента будьте внимательны к тому, что вы делаете, и в следующий раз, когда это произойдет, вы лучше разберетесь с тем, что только что произошло.
    • Снимок системных журналов.
  • Посмотри, сможешь ли ты воспроизвести это. Пока вы не сможете воспроизвести его, вы не сможете его найти.
  • Начните разбивать систему на разделы: безопасный режим и текущий режим работы, новая учетная запись и ваша обычная учетная запись, клавиатура и мышь, отличные от обычных (особенно Bluetooth и проводная сеть), это произойдет в течение нескольких минут после запуска или пробуждения или только через час больше бега (думаю, тепловой).
4

Я обычно начинаю с журналов событий и любых журналов, которые программа может создать самостоятельно. Программы иногда создают журнал в папке программ.

Как только вы сможете определить время, ищите в журналах события. Естественно, в журналах Windows могут быть ошибки Stop, которые будет легко идентифицировать.

Проверьте все драйверы и убедитесь, что они текущие.

Терпение также потребуется в больших дозах.

2

В дополнение ко всем хорошим советам, которые уже даны, если файлы журналов не дают много работы, часто стоит провести надлежащий тест памяти машины - неисправная память может вызывать всевозможные странные периодические зависания и сбои. Тест встроенной памяти намного больше похож на подсчет памяти, крайне редко при включении питания происходит сбой памяти.

Google для диагностики памяти Windows и запишите его на компакт-диск. Он старый, но это один из лучших тестов памяти и бесплатный.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .