Как отлаживать периодическую безответность Windows 7 после отключения питания

505
BrenBarn

Предыстория : мой компьютер работает под управлением Windows 7 Ultimate 64-разрядной. Процессор AMD Phenom II X4 955. Материнская плата - ASUS M5A88-M. Около месяца назад у меня произошло отключение электричества, и несколько раз оно включалось и выключалось, прежде чем включалось навсегда.

Проблема : с тех пор, мой компьютер показал странное прерывистое поведение замораживания. Когда я запускался после отключения электричества, в течение 3 дней не было никаких зависаний. Затем он несколько раз замерзал в течение следующей недели, затем не замерзал около двух недель, затем снова замерз, затем не замерзал еще несколько дней, а затем снова замерз.

Я заметил эти общие элементы:

  • Замораживание почти всегда происходит либо вскоре после загрузки, либо после долгого простоя компьютера (более 8 часов). Если он загружается и не останавливается в течение первых нескольких минут, он будет работать весь день без проблем или даже вялости, а иногда (как я уже упоминал выше) он будет работать в течение нескольких дней или недель, прежде чем снова замерзнет.

  • Когда происходит зависание, загрузка ЦП, кажется, падает до нуля. Это меня удивило и заставляет думать, что проблема не в том, что какое-то программное обеспечение захватывает слишком много ресурсов.

  • Замораживание, кажется, влияет на приложения одно за другим, когда я пытаюсь что-то сделать. Часто панель задач зависает, но я все еще могу использовать alt-tab для переключения между приложениями. Некоторые приложения не отвечают и не могут быть переключены, но другие будут работать. Обычно, если я пытаюсь «сделать что-то» в данном приложении (например, щелкнуть меню, выбрать элемент в списке), оно зависнет. В конце концов все приложения зависают таким образом. Тогда я все еще буду в состоянии перемещать окна, но в конечном итоге они оставят «следы», так как экран не перерисовывается должным образом.

  • Иногда, если я подожду некоторое время (где-то от 5 до 30 минут), компьютер «проснется» и будет работать в обычном режиме в течение нескольких минут, прежде чем снова перейдет в состояние бездействия.

Что я пробовал :

Я попробовал эти вещи:

  • Я запускал SMART-диагностику на жестком диске, используя SpeedFan и SeaTools. Я также провел «длинный общий» тест с использованием SeaTools. Ошибок не обнаружено и все статистические данные SMART подходят.

  • Я запустил средство диагностики памяти Windows, и он не обнаружил ошибок. Я запустил Memtest86 на ночь; он сделал три прохода и не нашел ошибок.

  • Я запустил сканирование с помощью Microsoft Security Essentials, а также MalwareBytes, и они не обнаружили серьезных угроз (только пара записей трекера реестра).

  • Я запускал SFC / SCANNOW. Он не сообщил о проблемах с системным файлом.

  • Я загрузил Linux live CD и некоторое время зависал и не испытывал никаких проблем, но я не уверен, что это много значит, потому что проблема прерывистая даже в Windows, так что, возможно, мне просто не повезло.

  • В диспетчере устройств я заметил «неизвестное устройство», которое, как я выяснил, было устройством ACPI. Я установил драйверы для него. Я подумал, что, возможно, некоторые настройки питания испортились, поэтому я попытался отключить что-то в BIOS и в настройках управления питанием Windows (например, отключить AMD Cool 'n' Quiet, отключить регулирование процессора в Windows и т. Д.). Время от времени я думал, что исправил это, но это все еще замерзнет на следующий день. (Я также сдул кучу пыли с процессора на случай, если он перегрелся.)

Я также ковырялся в средстве просмотра событий Windows. В середине ночи, когда она замерзла (то есть до того, как утром я заметил замерзание), возникают отдельные ошибки тайм-аута для некоторых служб Windows (обычно это служба отчетов об ошибках Windows). Это говорит о том, что иногда на самом деле замерзает ночью, а службы Windows истекают.

Эти ошибки тайм-аута являются случайными. Похоже, что большинству скоплений таких ошибок предшествует это событие (которое не является ошибкой, а просто сообщением «Информация»):

Microsoft Antimalware Real-time Protection перезапустила функцию. Рекомендуется запустить полное сканирование системы, чтобы обнаружить любые элементы, которые могли быть пропущены, когда этот агент не работал.

Особенность: при доступе

Причина: драйвер фильтра перезапустил сканирование элементов и вышел из режима пропуска.

Я не уверен, означает ли это, что проблема действительно связана с тем, что делает Microsoft Security Essentials, или это просто канарейка в шахте, которая первой указывает на то, что замораживание начинается. Но если компьютер загружается без замораживания, я могу запустить сканирование MSE вручную без проблем (и он не находит угроз).

Я также использовал SpeedFan для регистрации таких вещей, как температура и напряжение процессора, потому что мне было интересно, есть ли там какие-то паттерны. Я не нашел ничего необычного в самих чтениях, но в журналах есть отдельные пробелы. Я настраиваю SpeedFan на регистрацию каждые 3 секунды, но ночью в те же ночи, когда происходило замораживание, во многих местах записи журнала имеют промежутки около 5 минут. Эти разрывы появляются ТОЛЬКО в эти проблемные моменты времени (т. Е. В середине ночи, когда она замерзает или собирается замерзать утром). Это еще раз говорит о том, что он замерзает среди ночи до такой степени, что SpeedFan не может продолжать запись.

Вопрос :

Что здесь происходит? Тот факт, что эти проблемы, казалось, начались после сбоя питания, заставляет меня подозревать аппаратные проблемы, но я не знаю, какое оборудование может быть причиной этого. С другой стороны, тот факт, что сбои всегда происходят в определенное время (после долгого простоя или при загрузке), вызывает у меня подозрение, что это связано с каким-то программным обеспечением, таким как само обновление MSE.

Таймауты просмотра событий и пробелы в журнале SpeedFan указывают на зависание, которое начинается после того, как я ложусь спать, и продолжается с перерывами до утра (когда я перезагружаюсь). Но я не могу найти никакой информации о том, что на самом деле происходит, что может стать причиной замораживания. Единственные ошибки, которые я могу найти в средстве просмотра событий, это просто «ошибка тайм-аута, я замерз», что не указывает на фактическое состояние ошибки; они просто означают, что замораживание уже произошло.

Диагностика жесткого диска и памяти, кажется, исключает эти компоненты. Мои нынешние предположения об оборудовании - это материнская плата, процессор или блок питания. Звучат ли проблемы, которые я описал выше, как что-то, что может быть вызвано этими компонентами? Или есть другие программные решения, которые я должен попробовать?

0
Возможный сбой жесткого диска. Проверьте жесткие диски на наличие ошибок SMART [Как я могу прочитать состояние SMART моего жесткого диска в Windows 7?] (// superuser.com/q/29240) и [Какой самый простой способ проверки состояния SMART для вашего жесткого диска? ] (// superuser.com/q/14803). Отчет с результатами. DavidPostill 7 лет назад 2
Я бы пошел с Дэвидом и сначала заподозрил бы проблему с жестким диском. Вы также можете посмотреть в Event Viewer и наблюдать ошибки и предупреждения, чтобы увидеть, если вы получите что-нибудь полезное. DrZoo 7 лет назад 0
@DavidPostill: я запустил Speccy, который говорит, что SMART "ОК" и ничего плохого не показывает в показаниях SMART. BrenBarn 7 лет назад 0
@DrZoo: Как я уже упоминал в посте, я смотрел на просмотрщик событий, но ничего необычного не увидел. Есть несколько ошибок об истечении срока службы. Есть также некоторые ошибки «SideBySide», но они распространяются много месяцев назад, поэтому, похоже, не связаны с этой проблемой. BrenBarn 7 лет назад 0

2 ответа на вопрос

0
westom

Вы используете правильное отношение. Попытка найти дефект задолго до того, как пытаться что-то исправить. Но ваш лучший диагностический инструмент - это диспетчер задач (нажмите Cntrl-Alt-Del одновременно). В процессах отображаются процессы, занимающие процессорное время. Другими потенциальными узкими местами являются использование памяти, сбои страниц, чтение и запись операций ввода-вывода. Их можно просмотреть, нажав «Вид»> «Выбрать столбцы».

Ищите процессы, которые чрезмерно потребляют ресурсы. Также определите, что «освобождает» систему, щелкнув правой кнопкой мыши по процессу, чтобы завершить его.

Еще одним узким местом могут быть отчеты, потребляющие слишком много ресурсов, потому что другой процесс потерпел крах. Завершение этого процесса для освобождения системы - это просто еще один полезный факт, а не решение.

«Диспетчер задач на стероидах» предоставляется Microsoft - называется Process Explorer. Другой вариант.

Благодарю. Я только что внес изменения в вопрос, добавив дополнительную информацию. Похоже, что проблема не связана с какими-то конкретными процессами, задерживающими ресурсы. Фактически, когда происходит зависание, загрузка ЦП падает до нуля. Ничто не захватывает много памяти либо. Вот почему я подозреваю аппаратную проблему. BrenBarn 7 лет назад 0
0
BrenBarn

I'm tentatively considering the problem fixed, and wanted to post what seemed to fix it, in case anyone else ever has a similar issue.

Contrary to my initial guesses, it seems the problem was Microsoft Security Essentials. Based on the Event Viewer messages I mentioned, I began to wonder if MSE was causing the lockups. I also got an important clue when I happened to unzip a large file and got a freeze. This made me suspect that it was again MSE freezing as it tried to scan the newly unzipped files ("On Access").

I looked around and found people saying MSE wasn't the greatest antivirus these days anyway, so I removed it (and replaced it with BitDefender). It's now been four weeks with no freezes.

I have my fingers crossed that this really fixed it, but I have some lingering doubt. I'm unable to explain why such a peculiar MSE failure was precipitated by a power outage. It's also puzzling that the error only appeared when MSE did an automated scan; I could run scans manually and encounter no problems. (I even did a full scan of the whole drive without any freezes, so it couldn't have been that it was locking up on one particular corrupted file.). And, of course, the failure mode was very strange for a software problem: it's kind of disturbing if MSE is able to throttle my CPU to zero without appearing to use any significant resources itself.

Anyway, hopefully removing MSE has resolved the issue.