Как устранить неполадки, когда я понятия не имею, с чего начать?

2667
Chris Walton

Я ищу советы, советы и ответы о том, как начать устранение неполадок, когда:

  1. Проблема прерывистая
  2. Проблема может лежать буквально где угодно - операционная система; бесплатное исходное программное обеспечение; мои собственные разработки программного обеспечения; купленное программное обеспечение; крошки на клавиатуре; конкретная комбинация программного обеспечения, которое я сейчас использую; Максвелл демон; маленькие голубые человечки, фактически управляющие машиной, объявили забастовку; и т.п.
  3. У меня есть опыт только в нескольких из областей, которые являются потенциальными кандидатами на причину проблемы.

Конкретная проблема, с которой я сталкиваюсь, подробно описана ниже в качестве примера, но я не ищу ответы на мою текущую проблему, а скорее где и как начать решать такие проблемы.

В настоящее время я столкнулся с проблемой с моей новой машиной. В нескольких случаях машина только что замерзла; не принимать нажатия клавиш, щелчки мышью или что-либо, кроме выключателя питания. Неизменно я просто просматривал Интернет; У меня было запущено несколько (<= 6 других приложений). Ни одно из этих приложений не является основным; и представляют собой набор коммерческих программ и программ с открытым исходным кодом, обычно перенесенных из Unix некоторого разнообразия.

Моя машина - четырехъядерный ноутбук с операционной системой Windows 7 I7.

РЕДАКТИРОВАТЬ:

Хотя я и заявил, что фактическое описание проблемы является лишь примером, некоторые комментарии сосредоточены на решении этой проблемы. К сожалению, поскольку это был только пример, приведенная информация верна, но не полна. Чтобы люди не тратили свое время на попытки удаленно помочь в решении реальной проблемы, я даю некоторую другую информацию о моих настройках. Как я уже говорил, я не ищу ответов на эту конкретную проблему.

Моя машина - мощный ноутбук; моя главная машина; используется для разработки и технического письма, коммуникации - электронной почты, Интернета, FTP и т. д., а также для редактирования и индексации фотографий. На нем, по крайней мере, ежемесячно запускается строгий и обширный набор программ тестирования оборудования, в том числе тесты ЦП, тестирование нескольких модулей памяти и тесты всех других компонентов. Также, по крайней мере, ежемесячно выполняйте полную проверку на вирусы; полное сканирование шпионских программ; очистка диска; и дефрагментация диска.

Диск содержит примерно 3 * 10 ^ 6 файлов; Использование диска составляет 300 ГБ, оставляя 150 ГБ бесплатно. Память 8 Гб. Хотя машина может немного нагреваться, когда я использую полный набор основных инструментов разработки, я столкнулся с проблемой только при очень легком использовании машины - просмотр веб-страниц, Textpad, Graphwiz, база данных Firebird и облегченный браузер базы данных (Flame Robin. ). В этих условиях даже вентилятор не слегка греет. Я не внес никаких изменений в программное обеспечение, операционную систему или аппаратное обеспечение в течение периода, когда я столкнулся с проблемой. Произошло несколько автоматических обновлений - в основном Microsoft, Adobe и Lenovo, но не исключительно.

Этот фон помещает в контекст (я надеюсь) мои причины для того, чтобы задать этот вопрос так, как я это сделал. Теперь я собираюсь начать изучение различных журналов, упомянутых в ответах, в качестве первого шага в попытке сузить область исследования. И я собираюсь попробовать выполнить одну из характеристик, предложенных в ответах, которые я получил до сих пор, - терпение - в моем расследовании.

39
+1 Потому что на этот вопрос мне может пригодиться ссылка в будущем. Tom Wijsman 13 лет назад 5
Иногда, прежде чем приступить к полному, методическому подходу к решению проблем, вы должны попытаться найти общий низко висящий фрукт: запустить полное сканирование шпионских программ, найти в журнале Windows неожиданные отключения и посмотреть, какие (если они есть) проблемы предшествовали этому, проверьте ситуация с дисковым пространством, запустить проверку диска, дать автозапуску Sysinternal быстрое сканирование на наличие незнакомого / подозрительного программного обеспечения. Имейте простой набор инструментов для запуска, который может быстро идентифицировать большое разнообразие аппаратных и программных проблем. Если они ничего не находят, вы потратили немного времени и можете начать более тщательный процесс. Alain 13 лет назад 2
Кроме того, следуйте [Блогу Марка] (http://blogs.technet.com/b/markrussinovich/) за примерами того, как раздражающие проблемы устраняются с помощью Sysinternals. Tom Wijsman 13 лет назад 1
Удачи в устранении неполадок, я бы предложил создать новый вопрос, если вы хотите получить больше отзывов, чтобы все было организовано ... Tom Wijsman 13 лет назад 1

4 ответа на вопрос

42
Tom Wijsman

Получите лучшую идею.

Вы не выиграете битву без достаточной полевой информации.

  1. Опишите свою проблему подробно, чтобы у вас было хорошее представление о ней, которая знает, что это случается однажды.

  2. Отслеживайте во времени то, что произошло раньше, и вместе с проблемой, и вас, и вашего компьютера.

  3. Подумайте о возможных причинах, потому что иногда это может быть чем-то неочевидным.

  4. Получайте больше информации, когда у вас нет представления о том, что происходит, это может варьироваться от событий, инструментов SysInternals, анализа производительности, отладки до любого другого инструмента в вашем опыте .

  5. Проверьте свои предположения, чтобы убедиться, что ваши мысли не устраняют причину.

Разделяй и властвуй.

Потому что именно так военные побеждают своих противников, даже когда они в меньшинстве.

Устраните возможные причины, иначе у вас возникнут проблемы с отслеживанием проблемы. Таким образом, вы будете становиться все ближе и ближе к основной причине проблемы, это позволит вам решить проблему намного проще.

Например, с оборудованием отключите и удалите все, что вам не нужно для решения вашей проблемы. Таким образом, вы можете отключить компонент, вызывающий проблему. И затем снова нужно вставить половину компонентов, проверить, повторяется ли он, и повторить разбиение, пока у вас не будет плохого компонента ...

Тестирование чего-либо на другом компьютере, если оно доступно, также является хорошим преимуществом для решения проблемы.

Например, с программным обеспечением, перезагрузка в безопасном режиме, отключение записей запуска также помогает. Это также относится к включению / отключению настроек, попытке настройки по умолчанию и так далее ...

Давайте проверим это.

В настоящее время я столкнулся с проблемой с моей новой машиной. В нескольких случаях машина только что замерзла; не принимать нажатия клавиш, щелчки мышью или что-либо, кроме выключателя питания. Неизменно я просто просматривал Интернет; У меня было запущено несколько (<= 6 других приложений). Ни одно из этих приложений не является основным; и представляют собой набор коммерческих программ и программ с открытым исходным кодом, обычно перенесенных из Unix некоторого разнообразия.

  1. Это правильное описание само по себе, это не просто случается один раз .

  2. Вы знаете, что случилось вместе с проблемой,
    но не думали о том, что вы или ваш компьютер сделали до проблемы .

    Я не могу этого сказать, но вы, ваш журнал событий и недавно измененные файлы / папки могли сказать.

  3. Возможная причина, скорее всего, связана с процессором, потому что это компонент, который обрабатывает вещи.

    Более конкретно, это может быть процесс, драйвер или неисправное оборудование (возможно, проблемы с температурой?).

  4. Я знаю, что это процессор, но не знаю что. События не показывают этого, Process Explorer зависает на DPC .

    Итак, следующий шаг - запустить анализ трассировки, который я закрываю после того, как зависание произошло.

    Я смотрю в след, и я вижу, что драйвер X вызывает проблему !

  5. Никаких реальных предположений не делается. Предположение ЦП обрабатывается нашим подходом «разделяй и властвуй» ...

Итак, вот где я начинаю делиться, чтобы победить проблему, я останавливаюсь, как только решу:

  1. Проблема с текущей версией драйвера?
    Обновите драйвер до последней версии.

  2. Проблема с новейшими версиями драйвера?
    Получите новый след. Обновите драйвер до более старой версии, отличной от первоначальной.

  3. Проблема с устройством? Проблема конфигурации в реестре?
    Получите новый след. Переустановите и / или отключите устройство, если это возможно.

  4. Проблема случайная, процессор нагревается?
    Проверьте температуру процессора, при необходимости замените вентилятор.

  5. Проблема не в процессоре, есть ли другие аппаратные и программные влияния?
    Удалите оборудование и отключите программное обеспечение от запуска, чтобы усилить влияние третьих лиц.

  6. Проблема не в съемной части, ее следует заменить.
    В худшем случае, если ничего не помогает, вам нужно пойти на замену.

Получение новых следов и удаление оборудования дает нам больше информации, поэтому мы знаем, где искать дальше.

+1 для разделяй и властвуй. Принято для спецификации описания, отслеживания и механизмов для разделения и преодоления проблемы. Chris Walton 13 лет назад 4
+1 Блестящий ответ. Единственное, что нужно добавить, это: проверить свои предположения Bevan 13 лет назад 5
как насчет "изменить одну вещь за один раз"? Florenz Kley 13 лет назад 0
@Florenz: Ну, разделяя, вы либо берете их по одному (для небольшого числа, или когда вы не можете основывать себя на нескольких причинах), либо вы разделяете их (для большего числа, когда вы можете проверить несколько вещей в Разобрать пополам, если это возможно, быстрее, чем делать их один за другим. Например, для устранения 100 проблем вам нужно всего лишь 8 раз протестировать его (100-> 50-> 25-> 13-> 7-> 4-> 2-> 1) вместо 100 раз ... Tom Wijsman 13 лет назад 2
разумное разделение! То, что я хотел сказать, это «не исправляйте вещи быстрее, чем вы можете приписать изменение наблюдаемой дельте». Использование лабораторной книги со страницами, которые я не могу вырвать, - это мой метод, позволяющий мне это сделать. Florenz Kley 13 лет назад 2
6
JRobert

Хорошие логи и интуиция - правда.

  • С первого дня следите за всем, что вы делаете с системой: обновления приложений и ОС, новые установки, новое или удаленное оборудование или подключения, гроза, которая "не вызывала проблем".
  • Когда вы впервые заметили проблему:
    • Что ты делал?
    • Что еще необычного произошло недавно?
    • Что вы сделали по-другому в последнее время?
    • С этого момента будьте внимательны к тому, что вы делаете, и в следующий раз, когда это произойдет, вы лучше разберетесь с тем, что только что произошло.
    • Снимок системных журналов.
  • Посмотри, сможешь ли ты воспроизвести это. Пока вы не сможете воспроизвести его, вы не сможете его найти.
  • Начните разбивать систему на разделы: безопасный режим и текущий режим работы, новая учетная запись и ваша обычная учетная запись, клавиатура и мышь, отличные от обычных (особенно Bluetooth и проводная сеть), это произойдет в течение нескольких минут после запуска или пробуждения или только через час больше бега (думаю, тепловой).
+1 за регистрацию активности; и для интуиции. Не принятый ответ только потому, что регистрация полезна только в том случае, если она ведется с первого дня. Я веду журналы, но недостаточно подробно; и не включали системные обновления от Microsoft и другие автоматические обновления. Chris Walton 13 лет назад 2
@ChrisWalton: есть подробные журналы для Центра обновления Windows, вставки / удаления устройства, установки драйвера и так далее. Смотрите `C: \ Windows \ *. Log`,` C: \ Windows \ Logs`, `C: \ Windows \ inf \ *. Log`, а также` Монитор производительности> Наборы сборщиков данных> (Запуск) сеансов трассировки событий` , Кроме того, @JRobert, +1 за объяснение, как получить идею более подробно ... Tom Wijsman 13 лет назад 1
4
Dave M

Я обычно начинаю с журналов событий и любых журналов, которые программа может создать самостоятельно. Программы иногда создают журнал в папке программ.

Как только вы сможете определить время, ищите в журналах события. Естественно, в журналах Windows могут быть ошибки Stop, которые будет легко идентифицировать.

Проверьте все драйверы и убедитесь, что они текущие.

Терпение также потребуется в больших дозах.

2
Matt

В дополнение ко всем хорошим советам, которые уже даны, если файлы журналов не дают много работы, часто стоит провести надлежащий тест памяти машины - неисправная память может вызывать всевозможные странные периодические зависания и сбои. Тест встроенной памяти намного больше похож на подсчет памяти, крайне редко тестирование при включении питания обнаруживает сбой памяти.

Google для диагностики памяти Windows и запишите его на компакт-диск. Он старый, но это один из лучших тестов памяти и бесплатный.

спасибо за ваш ответ и предложенный инструмент. Боюсь, вы скорее упустили смысл моего вопроса - вы предлагаете провести тестирование памяти; кто-то еще предложил автоматические загрузки программного обеспечения Adobe. Мой вопрос был; в этих обстоятельствах, как вы решаете, что делать, когда существует огромный спектр возможностей. Chris Walton 13 лет назад 0
@ Крис: Как я уже сказал; при устранении неисправностей, возникающих периодически и необъяснимо (в ситуации, когда нет развития событий), если нет журнала, с которого нужно начинать, и других маркеров, указывающих, с чего начать, я бы запустил тест памяти. Логика в том, что это относительно быстро запустить по сравнению с попыткой повторить прерывистую проблему. После исключения вы начинаете сужаться и получаете идею, как выразился TomWij. Matt 13 лет назад 1
справедливо. Chris Walton 13 лет назад 0