Диагностика ошибок дискового ввода-вывода, сбой дисковых контроллеров

2927
Nicholas Masters

В последнее время мой компьютер постоянно зависал из-за ошибок дискового ввода-вывода, и я пытаюсь выяснить причину, прежде чем заказывать новые детали.

У меня Windows 7 установлен на SSD (с TrueCrypt), и я начал получать BSOD, связанные с диском. Я могу загрузиться в Windows, но он падает в течение нескольких минут, раньше, если я попытаюсь сделать что-то, что записывает на диск, например, установить программу.

Думая, что мой диск умер (возможно, из-за ssd + truecrypt), я позаимствовал его у друга, но не могу установить Windows или Ubuntu на этот диск из-за похожих проблем (ошибки ввода-вывода диска). (При этом я отключил все остальные диски и т. Д.)

При установке windows говорится, что он не может проверить файлы на этапе расширения файлов.

Во время установки Ubuntu я получаю сообщения об ошибках типа "": программа установки обнаружила ошибку при копировании файлов на жесткий диск. errno 5 ошибка ввода / вывода ""

Live Ubuntu, кажется, работает без проблем. Хотя если я пытаюсь установить Ubuntu на диск таким образом, он говорит, что не может проверить, что файл (каждый раз новый) останавливает установку. Во время работы cat /dev/urandom > /dev/nullвсе в порядке, однако cat /dev/urandom > /dev/sdaUbuntu зависает (без сообщений об ошибках) в течение нескольких минут.

Я пробовал каждый флеш-накопитель самостоятельно во время загрузки в Windows, и это, кажется, вызывает его более частое падение.

Я попытался сбросить CMOS, используя разные порты SATA (8 из них) и кабели SATA, ни одно из этого не имеет никакого значения.

Моя материнская плата имеет 2 разных контроллера диска, один Intel и Marvell, и они оба, кажется, имеют эту проблему.

Я слышал о проблемах с моим набором микросхем материнской платы (p67) и портами sata 3 Гбит / с, но у меня тоже есть проблемы с 6 Гбит / с, так что я не думаю, что это связанная проблема.

Мои спецификации ПК:
MSI P67A-GD65 Intel P67 (REV B3)
Intel 2500k
8
ГБ Мушкин-баран BeQuiet! 650 Вт блок питания
Samsung 840 ssd (мой)
OCZ ssd (друг)

Это похоже на сломанную материнскую плату? Что еще я могу сделать, чтобы диагностировать проблему? Кроме того, почему удаление одной палки баранов за раз приводит к более частым сбоям?

Изменить: Спасибо за комментарии. Я забыл упомянуть, что запустил Windows Memtest, которая прошла. Я скачал memtest86 сейчас, и он в настоящее время работает, я обновлю еще раз, как только он будет закончен. Кроме того, я оставил компьютер включенным cat /dev/urandom > /dev/nullна несколько часов, и ничего не произошло. Перешли на cat /dev/urandom > /dev/sdaи все это заперли менее чем за 5 минут.

Изменить: Несмотря на то, что тест памяти Windows сказал, что ошибок не было, memtest86 обнаружил ~ 200k на одном модуле памяти, но 0 на другом. Я удалил неисправный модуль и установил Ubuntu, а затем окна на ssd моего друга, и он, кажется, работает до сих пор. Я до сих пор не могу загрузить свой собственный ssd, он просто bsods. Но я думаю, что оригинальное bsoding должно вызывать ошибки записи на ssd, что вызвало это. Надеюсь, я смогу смонтировать ssd и восстановить данные. Я думаю, что мой рейд-конфиг, возможно, тоже получил некоторый урон во время всего этого процесса, так что надеюсь, что все будет нормально. Что я должен знать при восстановлении этих дисков?

Я выберу ответ, как только я уверен, что неисправный модуль оперативной памяти был единственной проблемой.

Редактировать: Да, похоже, что оперативная память была единственной проблемой, и это вызвало проблемы ввода-вывода. Спасибо за помощь!

2
@Moab он сказал, что пробовал разные кабели SATA. Николас, сначала запусти memtest86 +, чтобы исключить это. Также убедитесь, что ваш процессор не перегревается и радиатор / вентилятор установлены правильно. Bigbio2002 8 лет назад 1

1 ответ на вопрос

1
qasdfdsaq

Прежде всего, вам нужно явно запустить тест памяти, либо использовать встроенный тестер памяти Windows, либо, в идеале, memtest86 +, как предложено Bigbio2002.

Это звучит как проблема с памятью от начала до конца, кроме CPU и MB, это также единственное, что вы не исключили. Продолжение использования вашей системы с неисправной памятью, вероятно, приведет к ухудшению повреждения данных, уже находящихся на вашем диске (ах).

Если вы исключаете память, то оставшиеся компоненты - это процессор и МБ, и вполне возможно, что известная проблема с портами SATA серии Intel 6 вносит свой вклад - вы можете просто случайно получить проблемы с 6 Гбит / с по другим причинам.

Практически то, что я собирался посоветовать - но я бы настоятельно рекомендовал memtest86 + - записать на CD, затем загрузиться с диска и запустить. CJM 8 лет назад 0
12 минут до запуска memtest86 до сих пор, и он говорит: «Ошибки: 168921». Скорее всего, это вызвано самой памятью или модулями / кэшами памяти на материнской плате? Почему неисправный ОЗУ вызывает только проблемы с диском? Nicholas Masters 8 лет назад 0
@NicholasMasters: гораздо более вероятно, что память, потому что современные материнские платы не имеют кэш-памяти, а кэш-память ЦП имеют четность и / или ECC. Причина, по которой это может привести только к проблемам с диском, возможно, связана с тем, что неисправна только часть памяти, и эта часть используется для DMA драйвером диска. ASLR ядра и драйвера относительно ограничен, поэтому более вероятно использование одних и тех же адресов снова и снова, а ошибки памяти, как правило, локализуются. qasdfdsaq 8 лет назад 0
Приветствия для информации! Вы абсолютно правы в том, что только часть памяти была неисправна, memtest86 + показал, что один из адресов памяти был постоянно неправильным, а остальные все правильными. Nicholas Masters 8 лет назад 0

Похожие вопросы