Linux media box / почтовый сервер страдает от файловой системы / ошибок RAID, паники ядра

482
dwf

На прошлой неделе машина mini-ITX, которую я создал для обслуживания почты и общих папок Samba, дважды запаниковала ядром из-за файлов, связанных с файловой системой. Прошлой ночью я заметил ошибки целостности при потоковой передаче фильма на мой приставочный клиент (видео артефакты), поэтому я начал возиться.

И на внутреннем жестком диске, и на внешнем жестком диске используется программный RAID-массив linux и на любом зеркале, если я делаю md5sum для довольно большого файла, такого как видео, и повторяю это несколько раз, я каждый раз получаю разные контрольные суммы (я должен отметить, что один - ext4, другой - JFS). Я загрузил флешку в режим восстановления, тоже самое происходит. Я не пробовал считывать данные с внешнего зеркала на другом компьютере, но я смонтировал один из составляющих дисков, и он выглядел нормально, по крайней мере, он давал согласованные значения md5.

Итак, файловая система исключена (это происходит как на ext4, так и на JFS), жесткие диски, вероятно, отсутствуют (это было бы невероятным совпадением), контроллеры SATA, вероятно, не видят, как это происходит на двух полностью независимых контроллерах, поврежденном модуле ядра или что-то происходит, даже если оно загружается с аварийного диска.

Тот факт, что это происходит с двумя отдельными наборами дисков, управляемыми двумя отдельными контроллерами SATA, работающими с двумя разными файловыми системами, и поведение сохраняется при загрузке двух разных ядер, заставляет меня думать, что единственно вероятным вариантом является то, что что-то ужасно неправильно с материнская плата. Эта материнская плата уже была заменой RMA от компании, которой я не особо доверяю (Zotac), так что это было бы менее удивительно, чем обычно.

Это Ubuntu Server 10.04, кстати, 64-битный, на материнской плате Zotac IONITX-C (я думаю) с Atom N230.

У кого-нибудь есть другие идеи, диагностика, которую я должен выполнить, и т. Д.?

РЕДАКТИРОВАТЬ: две вещи, которые я забыл упомянуть: когда я загрузился с USB-ключа, я запустил fsck на обоих md-устройствах.

Вот как выглядит паника:

Linux media box / почтовый сервер страдает от файловой системы / ошибок RAID, паники ядра

Я попытался найти в Google некоторые из них, но без особого успеха, но я думаю, что в любом случае, скорее всего, виноваты аппаратные средства; Я просто не знаю, какой именно аппарат .

РЕДАКТИРОВАТЬ 2: Просто запустил memtest86, и ни один тест не проходит. Наименее значимые 2 байта тестового шаблона, кажется, всегда читаются неправильно. Все еще не уверен, является ли это ОЗУ или чипсетом, и у меня нет дополнительной палки ОЗУ для тестирования.

3
Вы fsck разделы, когда вы загрузились с устройства USB? matthias krull 14 лет назад 0
Да, несколько раз. Они были в порядке. dwf 14 лет назад 0

1 ответ на вопрос

1
gkrash

Мой голос - плохая память или что-то на чипсете. Можете ли вы заменить оперативную память заведомо исправной и посмотреть, как она работает? - (большинство современных Linux также имеют опцию «memtest» на установочном диске, которую вы можете попробовать, если не знаете, как работает хороший баран, хотя я бы посоветовал выбрать хороший RAM как лучший тест.

Спасибо, что напомнили, я обязательно запишу memtest86, когда вернусь домой. dwf 14 лет назад 0
Оказывается, одна из флешек оперативной памяти была неисправна, другая в порядке. Я отправил запрос RMA. Спасибо! dwf 14 лет назад 0