2 года повреждения памяти и BSOD ... но нет плохой оперативной памяти?

754
mHurley

Вот ссылка на мою папку Dropbox, где я добавляю дампы памяти по мере их создания. Это так же, как ссылка, представленная ниже. Кроме того, самые новые правки находятся в верхней части этого поста. https://www.dropbox.com/sh/vw7zkiwbq7hh05p/AABxLOaKIc8V5djSgyy3sUWja?dl=0

РЕДАКТИРОВАТЬ: еще один BSOD, а смотреть Netflix в Chrome. Добавлено в ссылку Dropbox.

РЕДАКТИРОВАТЬ: Наконец-то получил еще один BSOD, и этот на самом деле произвел полный дамп памяти (1,07 ГБ). Он должен быть доступен по той же ссылке ниже после завершения загрузки. Я сжал его до 181MB с 7zip, так что это поможет некоторым. Этот последний сбой произошел во время просмотра Vimeo в новом браузере Edge, но это также произошло во время просмотра YouTube в Chrome. Если кто-нибудь может дать какое-либо понимание, я был бы благодарен. Напомним, что это с новым блоком питания и всеми 16 ГБ оперативной памяти. Единственное электронное оборудование, которое я не полностью заменил, это процессор, жесткие диски и, возможно, графические процессоры (это продолжалось достаточно долго, чтобы эта конкретная проблема могла быть новее, чем у моих графических процессоров). Большое спасибо!

РЕДАКТИРОВАТЬ: Таким образом, я RMA сделал мой блок питания, получил новый, установил его два дня назад, и все было хорошо до сих пор. Получил IRQL_not_less_or_equal BSOD. Худшая новость заключается в том, что, похоже, Windows тоже не сохранила дамп памяти :-( Единственный дамп, который у меня есть, это некоторое время назад. Это может быть из-за недостатка места на диске, поэтому я попытаюсь очистить его. Некоторые оставшиеся компоненты, которые не были полностью заменены, - это жесткие диски и процессор.

РЕДАКТИРОВАТЬ: Вот ссылка на мой дамп памяти. Полный дамп 800 МБ, поэтому он все еще загружается. Я добавлю больше здесь, поскольку они генерируются. Это будет в обозримом будущем. https://www.dropbox.com/sh/vw7zkiwbq7hh05p/AABxLOaKIc8V5djSgyy3sUWja?dl=0

Похоже на эту проблему: частые BSoD относительно повреждения памяти ... но при запуске SFC никогда не обнаруживались плохие файлы.

Там много предыстории, поэтому, пожалуйста, потерпите меня. Я постараюсь быть систематическим.

У меня были периодические сбои BSOD в течение последних 2 лет, или около того. Ошибки включали:

  • IRQL_NOT_LESS_OR_EQUAL
  • УПРАВЛЕНИЕ ПАМЯТЬЮ
  • PAGE_FAULT_IN_NONPAGED_AREA
  • BAD_POOL_HEADER
  • и другие.

  • ОС Это началось с Windows 7 и продолжилось с Windows 10. Один такой сбой даже потребовал чистой установки Windows 7, чтобы я мог повторно выполнить обновление до Windows 10, поэтому я полностью переустанавливал ОС как минимум 4 раза с момента проблемы начались.

  • GPU Проблема началась с одной пары графических процессоров NVIDIA без SLI и осталась с другой парой графических процессоров NVIDIA без SLI.

  • Mobo Эта проблема началась с одной материнской платы ASUS и продолжилась с материнской платой ASUS более новой модели.

  • ОЗУ Эта проблема началась с одного набора ОЗУ и сохранилась с совершенно новым набором ОЗУ. В то же время я обновил материнскую плату, я также обновил мою оперативную память с 16 ГБ DDR3 1066 до 16 ГБ DDR3 1333, оба G.Skill. (Обновление GPU было за год до обновления mobo)

  • Дисков у меня четыре HDD, два из которых SSD. Один SSD - мой загрузочный диск, остальные три - хранилище. Я запустил файл подкачки на всех четырех дисках, файла подкачки вообще нет, только на твердотельных накопителях, только на обычных дисках и во всем, что есть между ними, причем BSOD встречаются в каждой конфигурации. Диск ОС был отформатирован несколько раз в процессе установки, но остальные диски практически не изменились. Я думаю, что эта проблема началась, когда у меня все еще была ОС на обычном диске, но я точно не помню.

  • Мощность У меня есть блок питания на 750 ватт, которому 3-4 года, и никогда не было проблем ... но это может быть так. У меня также есть источник бесперебойного питания, но не сообщается о переходе на питание от батареи, так как я установил его пару месяцев назад.

Я запускал MemTest полдюжины раз, вообще без сбоев, а только на первом наборе оперативной памяти. Совсем недавно я запустил диагностику памяти Windows на всех четырех модулях и обнаружил некоторые неисправности. Затем я запустил его только на двух, без сбоев, затем на двух других, без сбоев. Каждый тест состоял из 3 проходов «Расширенного» набора тестов.

Я запустил verifyier.exe, но он довольно непрозрачный, поэтому я не знаю, дал ли он мне какую-либо полезную информацию.

Я использовал домашнюю версию WhoCrashed для просмотра мини-дампов, но недавно я обнаружил WinDBG (ПОЧЕМУ ЭТО НЕ СТАНДАРТНАЯ ОСОБЕННОСТЬ ОС?!?!?!), Но я создал только два дампа с момента его обнаружения, поэтому не много новой информации. Один дамп указал на «memory_corruption», что побудило запустить WMD.

У меня есть два мини-дампа и memory.dmp, которыми я могу поделиться через Dropbox, если они кому-нибудь пригодятся, но они только из последних двух дней.

Спасибо за любые предложения.

0
Чтобы тщательно протестировать баран, вы должны дать Memtest работать в течение 48-72 часов на палку. Ƭᴇcʜιᴇ007 8 лет назад 0
Очевидный вывод, который я имею, - это не имеет ничего общего с памятью. Вы предоставили с нулевой информацией о BSOD вы не можете конкретно. Таким образом, мы никак не можем посмотреть на файл .dmp для их анализа. Если WDM указывает на сбой, хотя есть большая вероятность, что сбой есть, но вы запустите MemTest в течение значительного времени, и предоставление дополнительной информации будет иметь большое значение. Ramhound 8 лет назад 2
Ух ты, запусти MemTest для ** ДВА НЕДЕЛИ ** для четырех флешек ОЗУ? Это кажется чрезмерным. Если я получаю BSOD через день или около того, то похоже, что Memtest должен вызвать это условие за один или два прохода. Почти невозможно запланировать такое большое время простоя для моей машины, но я посмотрю, что я могу сделать, чтобы выполнить более длительный тест. mHurley 8 лет назад 0
Две недели на тестирование, против еще двух лет BSoD? Вы также можете получить другие, хорошо известные флешки и использовать их для тестирования. но, видя, что вы уже заменили ОЗУ один раз, есть вероятность, что у вас, вероятно, нет проблем с памятью. Коды остановки, о которых вы сообщали, обычно указывают либо на плохую оперативную память, либо на плохой драйвер, но они также довольно общие, и может быть несколько причин, по которым вы получили их за последние два года. Вам нужно разбить его, а затем продолжать расследовать, пока не найдете причину. Может быть трудно следовать WinDBG, но это инструмент, который вам не нужен. Ƭᴇcʜιᴇ007 8 лет назад 0
Повреждение памяти происходит чаще из-за ошибок в коде драйвера (использование после освобождения, условия гонки из-за неправильного использования блокирующих примитивов), чем из-за плохого оборудования. Так что я буду винить их, если только вы не увидите однобитовых флипов на свалках. Vojtech 8 лет назад 1
поделиться файлами dmp, чтобы мы могли взглянуть на них. magicandre1981 8 лет назад 0
Я бы посмотрел на то, что ты не изменил. Блок питания и процессор. Находясь на резервной батарее, не решит возможную проблему с источником питания. Вы сказали, что он не «переключился на лучшее питание», что, как я полагаю, означает, что он не перешел в режим работы от батареи. Более дешевые устройства BBU обеспечивают довольно грязное питание при работе от батареи. У более хороших есть кондиционер линии, который выровняет это. Если бы этот компьютер был на моей скамейке, чтобы посмотреть, я бы поменял блок питания. N. Greene 8 лет назад 1
@N. Грин, да, «лучше» надо было читать «батарея». Единственный оставшийся для проверки блок питания - кроме процессора, но у меня нет еще 100 долларов, чтобы выложить новый блок питания для тестирования. Есть (простой) способ проверить это, не заменяя это? magicandre1981, конечно. Я постараюсь поднять их позже. ᴇcʜιᴇ007 Я не имею в виду, что 2 недели - это больше времени, чем я хочу тратить. Я имею в виду, что 2 недели - это больше времени, чем имеет смысл. Я должен отложить, потому что я, вероятно, знаю меньше об оперативной памяти, чем вы, но не похоже, что есть веская причина для этого так долго. mHurley 8 лет назад 0
Продайте свой ИБП, чтобы вы могли проверить оставшиеся детали. Оборудование для правильной проверки блока питания без его замены стоит примерно в десять раз дороже, чем блок питания. qasdfdsaq 8 лет назад 2
Лол, приятно знать mHurley 8 лет назад 0
Симптомы BSOD, которые «повсюду», как и ваши, чаще всего связаны с аппаратным обеспечением, а не с драйверами. Замените свой блок питания. Jamie Hanrahan 8 лет назад 1
@mHurley - Можете ли вы лучше делать ярлыки для ваших файлов? Я не могу сказать, какие старые и новые файлы .dmp, если я не смотрю историю изменений. * Я вижу, как вы только что связали всю свою папку ... не лучший способ связать нас файлы, но приемлемо. * Ramhound 8 лет назад 0
Извините, я пойду уточню. Мое намерение состояло в том, чтобы предоставить единственную ссылку, которая всегда была бы актуальной, даже когда я добавил новые дампы. mHurley 8 лет назад 0

1 ответ на вопрос

2
Jamie Hanrahan

Ok, I looked at your memory.dmp file. It appears that a thread belonging to one of the Chrome processes was near the "end stages" of completing a write to a "named pipe" object, implemented by npfs.sys, the "named pipe file system" driver.

Here's what's relevant about named pipes/npfs.sys: It is an interprocess comm mechanism implemented as a pseudodevice. It is very well-established stable code. It's been in Windows for forever. It is used by a great many internal Windows processes. It's not surprising that Chrome is using it (for comm between Chrome's various processes).

And, as a pseudodevice, it is not specific to any hardware. So every Windows machine that is running the same version of the OS is running the same binary of npfs.sys. This is not like a wireless card or video card where there are many different "WiFi" or "video" drivers out there.

So we can be fairly confident the problem is not in npfs.sys. And it certainly isn't in IopCompleteRequest (the routine that raised the unhandleable exception, by trying to write to a not-defined address, which was the final "cause" of the crash). Both of these are very heavily exercised and well-trusted code. The other kernel mode routines on the stack are NtWriteFile and KiSystemServiceCopyEnd - likewise not at all likely suspects. (NtWriteFile is invoked for every write function to every file or device; KiSystemServiceCopyEnd for the vast majority of calls from user to kernel mode - and btw it has nothing to do with service processes.)

As I said in a comment above - I would replace the power supply. I have seen PSUs cause similar flurries of "widely variant" BSODs before. Be sure you get one with one big 12 volt rail, not multiple rails - this provides the best protection against momentary sags and spikes. This is particularly important given that you have two GPUs.

Это отличная информация, спасибо! Я дам вам знать, как это происходит. mHurley 8 лет назад 0
ЭТО ВСЕГДА ПОД ГАРАНТИЮ !!!! Но только еще на 3 недели, лол mHurley 8 лет назад 0
Получил новый PSU, установленный 2 дня назад ... только что получил еще один BSOD ... И похоже, что Windows не сохранила дамп памяти :-( mHurley 8 лет назад 0
Вовсе нет? Даже не минидамп? Jamie Hanrahan 8 лет назад 0
Даже не мини-дамп :-( Я дважды проверил настройки, и это было установлено, чтобы НЕ перезаписывать любой существующий дамп, поэтому я изменил это, и, надеюсь, будет работать в следующий раз. mHurley 8 лет назад 0

Похожие вопросы