Какова вероятность того, что неисправленная битовая ошибка возникнет и не будет обнаружена?

582
Sidney

Поэтому сегодня я скопировал установочный exe-файл с диска NAS на два отдельных компьютера одновременно, и у них обоих возникли одинаковые проблемы. Программа установки exe использовалась без учета времени (по крайней мере, дольше, чем я был в этой компании) без проблем, так что это не так, и компьютеры были буквально новыми установками Windows.

После некоторой возни с компьютерным AI обнаружил, что удаление exe и повторное его копирование и переустановка приложения решили проблему, и то же самое для B.

Единственный вывод, к которому я могу прийти, это то, что во время чтения исходного диска произошла какая-то битовая ошибка, оба компьютера получили неверную (идентично) кэшированную копию, и оба реагировали одинаково.

Я хотел бы знать, что есть что-то еще, что может вызвать что-то подобное, иначе какова вероятность того, что это действительно произойдет?

1
Вы будете сталкиваться с неперехваченной / необнаруженной ошибкой в ​​битах примерно один раз на 74 ТБ данных, которые читаются. Для меня это примерно два раза в месяц на моем домашнем рабочем столе. Вот почему серверы используют зарегистрированную память ECC (которая гораздо лучше обнаруживает эти проблемы) и почему я использую файловые системы с контрольной суммой (например, ZFS) для хранения данных. Darth Android 9 лет назад 1
Просто любопытно, а почему 74 ТБ? В моих классах компьютерных сетей было много разговоров о битах четности, контрольных суммах и хэшах и тому подобном, чтобы избежать ошибок, но общий тон лекций, казалось, заключался в том, что никогда не было никаких необученных ошибок или что они были настолько необычны (и 1 бит из 650910883643392 довольно необычен) упоминать их не стоило. Sidney 9 лет назад 0
@ Сидни - Преобразуйте это значение в ТБ. ** Это около 75,776 ТБ, если вам интересно. ** Ramhound 9 лет назад 1
@DarthAndroid, почему это не ответ? Похоже, ты прибил проблему по голове. Michael Frank 9 лет назад 0

1 ответ на вопрос

2
Darth Android

Вы будете сталкиваться с неперехваченной / необнаруженной ошибкой в ​​битах примерно один раз на 74 ТБ данных, которые читаются. На моем домашнем рабочем столе это примерно два раза в месяц.

Вот почему серверы используют память ECC (которая гораздо лучше обнаруживает эти проблемы и исправляет их), и поэтому я использую файловые системы с контрольной суммой (например, ZFS) для хранения данных. Если вы просто храните данные на разделах на диске, то нет способа проверить, что данные не были изменены. Даже наличия копии данных (RAID 1) или данных четности (RAID 5) недостаточно - он скажет вам, что что- то изменилось, но не может сказать вам, каково было первоначальное значение. Файловые системы, которые поддерживают правильное контрольное суммирование и избыточность, могут не только сообщать вам, какие данные были повреждены / перевернуты, но также могут автоматически восстанавливать их из избыточной копии.

Несколько лет назад 1 бит из 650910883643392 был довольно необычным. Облачное хранилище и постоянно растущее качество мультимедиа (4K-видео не за горами), однако, оно становится все более распространенным.

ECC / non-ECC и зарегистрированный / незарегистрированный не один и тот же вопрос. Я думаю, что единственная комбинация из тех, которые вы не видите, это зарегистрированные не-ECC (как правило, зарегистрированные или буферизованные используются только с большими банками модулей памяти, но ECC может быть реализована и с отдельными модулями памяти). Моя домашняя система использует незарегистрированную ECC RAM, например. a CVn 9 лет назад 0
Я также чувствую, что этот ответ получит пользу от источника для цифры 1 / (6,5e14). Стоит отметить, что высокоуровневые жесткие диски сообщают о * некорректируемых ошибках чтения * частоте * статистически * одной ошибки сектора на каждые считанные 1-15 бит, что находится по соседству. Однако исправляемые ошибки чтения по определению обнаруживаются. a CVn 9 лет назад 0

Похожие вопросы