Разница между обычной RAM и ECC RAM

2585
soandos

Возможный дубликат:
Должен ли я использовать ECC RAM для следующего компьютера, который я собираю?

Как часто обычная RAM делает ошибку?

Вообще говоря, каковы шансы того, что это на самом деле повлияет на что-либо (в том числе повреждение данных в режиме без вывода сообщений, но исключая изменения некоторых данных, которые никогда не будут прочитаны)?

РЕДАКТИРОВАТЬ: Мне также было бы интересно узнать, есть ли различия между DDR2 и DDR3 в этом отношении.

0
@ techie007 Я не согласен. Меня не волнует, что быстрее и какие материнские платы это поддерживают. Также в этом ответе отсутствуют цифры о том, как часто возникают эти проблемы. Все, что он имеет в анекдотических доказательствах, это помогает. soandos 12 лет назад 0
@ techie007 Кроме того, PDF-файл, на который он ссылается, хотя и интересный, не дает действительного числа того, сколько ошибок делает обычная ОЗУ (особенно сегодня, в отличие от 2009 года) или почему, по-видимому, существуют такие различия (признак неверных данных? ). Он также имеет дело только с ошибками, которые можно исправить. В чем разница между этим и общим? soandos 12 лет назад 0
Какой актуальный вопрос? "В чем разница между ECC и не ECC RAM?" (что вы можете узнать по крайней мере в Википедии, я уверен), или "Каковы шансы, что на меня может повлиять 1-битная ошибка ОЗУ, которую ECC мог уловить"? Ƭᴇcʜιᴇ007 12 лет назад 0
Еще одна модификация второй. Какое странное, на меня будет воздействовать ошибка минус вероятность того, что на меня повлияет ошибка с использованием ECC RAM. soandos 12 лет назад 0
Что ж, память ECC может исправлять только 1-битные ошибки, так что, по крайней мере, это единственные, которые вам нужно беспокоиться о вычитании из вашего общего количества. ;) Таким образом, вы хотите знать, насколько больше «подвержено риску» 1-битных ошибок, если у вас нет ECC? Ƭᴇcʜιᴇ007 12 лет назад 0
Что-то вроде того. Я думаю, что есть также небольшой процент (1-битная вероятность ошибки в квадрате), что он не поймает 1-битную ошибку soandos 12 лет назад 0
Другая связана: [Насколько часты ошибки DRAM?] (Http://superuser.com/questions/26493/how-frequent-are-dram-errors) Ƭᴇcʜιᴇ007 12 лет назад 0
Ссылка на статью в этой статье такая же, как и в другом вопросе, который вы пометили как связанный. soandos 12 лет назад 0
Это не значит, что он не задает тот же вопрос (по крайней мере, частично), что и вы. Ƭᴇcʜιᴇ007 12 лет назад 0
Я думаю, что основной вопрос все еще остается "Стоит ли инвестировать в ECC RAM?" и ответ отражает это. Меня это совсем не волнует. soandos 12 лет назад 0
Система, выполняющая одну операцию с памятью в час, будет иметь гораздо меньше шансов получить ошибку типа памяти, которую ECC предотвратит, чем тот же компьютер, выполняющий 10000 операций в секунду. :) Ƭᴇcʜιᴇ007 12 лет назад 0
Почему это так? soandos 12 лет назад 0

1 ответ на вопрос

1
Tom Wijsman

Вы ищете среднее время между отказом (mtbf) и средним временем отказа (mttf).

Оба они зависят от качества (возможны дефекты) ОЗУ, а также от частоты отказов. Частота отказов в основном зависит от общего количества часов работы устройства и коэффициента ускорения, при котором ячейки выходят из строя. Другие параметры включают температуру, время работы и энергию ...

Подробно об этом говорится в документе Hybrid Memory Products Ltd - Модуль SRAM - MTBF-анализ . В этом примере используемая память сохраняется в течение жизни в течение сотен лет. Вы можете увидеть, что разные производители памяти сообщают об одном и том же, вот пример из Kingston :

Наш процесс работает настолько хорошо, что среднее время наработки на отказ превышает 500 лет!

Суть этого в том, что ECC скрывает ошибки аппаратного обеспечения или экстремальное использование, поэтому вы часто видите его установленным на серверах, поскольку они не хотят рисковать наличием неисправной памяти.


Из другого вопроса, есть исследование по этому вопросу, которое показывает разные результаты, 50 - 167 ошибок в месяц, а не ошибку после долгого срока службы. Теперь, кто говорит правду? Google правильно использовал MemTest?

Google вышел, качаясь по этому вопросу. См. Http://blogs.zdnet.com/storage/?p=638 о том, как это действительно влияет на современные системы.

Это, однако, из 2009 года, основанного на данных за предыдущие годы, поэтому в наши дни все может быть иначе.

Если есть ошибки в оборудовании, не появятся ли они довольно быстро, используя что-то вроде memtest? soandos 12 лет назад 0
@soandos: они могут или не могут, это зависит от того, как долго вы сканируете. Некоторые люди не могут позволить себе тратить так много времени, подтверждая, что все их аппаратные компоненты в порядке. Хотя я думаю, что это делается на профессиональном уровне, часто люди просто идут и запускают его, когда подозревают ошибки памяти ... Tom Wijsman 12 лет назад 0
Если это аппаратный дефект, он не будет выходить из строя 100% времени, когда эта область ОЗУ записывается / считывается в / из? soandos 12 лет назад 0
Однобитовые ошибки памяти могут возникать, даже если ОЗУ не является неисправной, и могут возникать практически спонтанно («Электрические или магнитные помехи внутри компьютерной системы могут привести к тому, что один бит динамической памяти с произвольным доступом (DRAM) самопроизвольно переходит на противоположное состояние. "). ECC для перехвата этих одноразовых системных ошибок, а не для того, чтобы он продолжал работать, если ОЗУ не работает (для этого и предназначен «ChipKill»). Ƭᴇcʜιᴇ007 12 лет назад 0
@ techie007: Как я уже сказал, другие параметры оказывают влияние. Помехи должны быть хороши для большинства современных материнских плат, и это опять-таки аппаратный дефект, если он возникает на регулярной основе. Следовательно, ECC скрывает эти аппаратные ошибки ... Tom Wijsman 12 лет назад 0
@soandos: Не совсем, плохой контакт или две ячейки, которые находятся слишком близко друг к другу, могут привести к случайному поведению. Tom Wijsman 12 лет назад 0
Это случается с перерывами? soandos 12 лет назад 0
@soandos: что происходит с перебоями? Кроме того, я немного обновил свой предыдущий комментарий ... Tom Wijsman 12 лет назад 0
Плохие контакты или две ячейки, которые находятся близко друг к другу. soandos 12 лет назад 0
@soandos: Да, на это влияют параметры окружающей среды. Температура может вызвать изменение расстояния между ними, больше / меньше энергии (напряжения) может облегчить / затруднить распространение бита, магнитные помехи из-за дефекта зависят от того, установлены ли положительные / отрицательные биты. Этот последний является одной из причин, почему при тестировании используются разные шаблоны ... :) Tom Wijsman 12 лет назад 0

Похожие вопросы