Что более вероятно? гниение памяти для хранения (egURE) или гниение памяти для оперативной памяти?

559
humanityANDpeace

Подоплекой вопроса является то, что на большинстве компьютерных систем данные могут быть повреждены в нескольких местах. Вопросы задаются об относительных проблемах, связанных с двумя местами таких данных - гниение / повреждение данных

  1. в основной памяти - особенно для ноутбуков (нет доступной ECC-памяти)
  2. на носителе данных - например, магнитный жесткий диск или твердотельные накопители, и может даже быть тихим (это не URE )

Идея вопроса заключается в том, что данные чаще всего должны проходить не в обоих местах потенциального повреждения, то есть они будут храниться в памяти (см. 1) и храниться и извлекаться из запоминающего устройства (см. 2).

Есть ли способ определить, какое из этих двух проявлений (с помощью гниения битов) является более вероятным?

Цифры, которые я нашел, не легко соотносятся со мной, и ответ на вопрос будет состоять из именно этого.

Рисунок для каждой формы гнили

  1. переворачивание памяти / оперативной памяти: я прочитал «25 000–70 000 ошибок на миллиард часов работы устройства на мегабит» из википедии / Google . Другой источник прямо говорит, что ошибка 1 bitflip происходит каждые 3 дня (72 часа)
  2. Запоминающее устройство Я прочитал, что неисправимая ошибка чтения на потребительских жестких дисках возникает с "URE ожидается для одного из 10 ^ 14 битов" из https://en.wikipedia.org/wiki/RAID#URE

Теперь для меня это показывает, что можно легко представить себе случаи, когда риск любого из двух гниющих сцен - высота:

для 1) можно было бы но данные в оперативной памяти и ждать очень и очень долго, чтобы сделать это почти наверняка происходит повреждение. для 2) можно было записывать и считывать много данных в хранилище, чтобы сделать объем достаточным, так как это почти наверняка повредит в двух случаях.

Следовательно, вопрос требует больше стандартного сценария записи данных (то есть фотографии на диск и резервные копии). Случай, в котором я ожидаю, что оперативная память будет меньшим из двух злых (как для резервной копии, то есть время копирования оперативной памяти меньше по сравнению с занимаемой памятью).

Я даже подготовил некоторую оценку, чтобы дать возможность ответить на этот вопрос только в подтверждение рассуждений, представленных ниже:

Сценарий я резервное копирование 1 ТБ с одного диска на другой. Предполагается, что задействованы как память, так и память. Для памяти оценка бит гнили относительно необходимого времени. Предполагается, что необходимое время зависит от скорости записи, используемой в запоминающем устройстве (от 1 МБ / с USB1 до 100 МБ / с sata-hdd до 500 МБ / с sata-ssd являются разумными значениями, выбирается 50 МБ / с).

Тогда значения в оценке:

  • 1 ТБ = 10 ^ 12 байт = 10 ^ 15 бит
  • время, необходимое при 50 МБ / с = 1 ТБ / (50 МБ / с) = 20000 секунд = 5,5 часов
  • гниение битов памяти для 1 ТБ со скоростью 1 бит битов каждые 10 ^ 14 бит = 10 бит битов
  • Гниение битов памяти оценивается с помощью (1 бит раз в 72 часа) = 5,5 / 72 бит разрядов = 0,07638 разрядов разрядов

Тогда я предполагаю, что если память не сломана для начала (то есть memcheck86 или memtest86 не говорит вам, что ваш оперативный памяти неисправен), и рассматриваются только 5.5.hours, то основная причина повреждения исходит от массы место хранения.

Следовательно, гниение битов памяти большой емкости (при резервном копировании) более вероятно, чем гниение битов памяти без ECC!

Я с нетерпением жду подтверждающего или корректирующего ответа, который может пролить некоторый свет на относительный риск гниения битов в оперативной памяти или в массовых хранилищах.

0
Более вероятно, что вы должны сравнить любые скопированные / перемещенные данные с некоторой процедурой сравнения, так как она охватывает как проблемы с оперативной памятью, так и проблемы с хранением в данный момент. Затем сделайте 2 резервные копии (которые сравнивались) для данных о данных. Теперь сравните две резервные копии :-) Может произойти что-либо из вышеперечисленного, но, кажется, что это не происходит, когда все идет идеально, это происходит только (и то и все тоже :-), когда дела идут плохо. Если я сравниваю, как идеально все работает нормально, с тем, насколько плохие вещи могут быть, реальные проблемы перечислены в мегах, концертах и ​​террах, а не в битах. Psycogeek 8 лет назад 0
@Psycogeek Я ценю ваш совет и подсказки о том, как избежать необходимости отвечать на вопрос. Я не знаю этого совета, но вопрос, который я задал целенаправленно, и любой способ избежать вопроса, во-первых, не лучший способ ответить на этот вопрос. Представленная оценка кажется вам разумной? humanityANDpeace 8 лет назад 0
Я просто не получаю те же результаты, что и в вики, из которой ты получаешь математику. Но опять же, я не нахожусь в промышленном окружении, тянущем власть небольших городов, и я использую хороший отрегулированный ИБП, все круто, и я за штукатуркой (бетоном) и клеткой из проволочной сетки. Кто-то может ударить мои (обращающиеся как стеклянные) жесткие диски, увеличить мощность и изменить мои характеристики 100 раз за одну секунду, по большей части, несмотря на то, что полностью протестированные рабочие компоненты не получат такого количества ошибок в 2010 и последующих годах. Сделайте сравнение целых террабайт и посмотрите. Psycogeek 8 лет назад 0

0 ответов на вопрос