21

Я много беспокоюсь о создании стабильных машин - в том, что я абсолютно ненавижу сбои, перезагрузки, смешное поведение и т.д. - и поэтому исправление ошибок, или ECC RAM, может решить большую проблему: ошибки памяти.

Но действительно ли это работает? Есть ли измеримое преимущество, например, меньше сбоев или другое поведение?

Помимо стоимости, почему бы не использовать память ECC для новой сборки ПК? Почему функция ECC преимущественно доступна и поддерживается для компьютеров класса сервер / рабочая станция, но не на материнских платах, ориентированных на потребителя?

4 ответа4

10

Я использовал ECC RAM в серверах в течение нескольких лет. ECC действительно светит, когда вы интенсивно используете свою машину, например, «она работает более 12-16 часов в день». У маленьких серверов whitebox, которые я создал без ECC, рано или поздно возникли "проблемы", которые требовали перезагрузки, но на машинах ECC их никогда не было.

Так что мой ответ: если вы используете ваш компьютер много, то , скорее всего , да. Если вы используете свой компьютер 24/7, то это должно быть обязательно.

Есть некоторые материнские платы, которые поддерживают ECC. Они обычно находятся на более высоком уровне, но с небольшим исследованием вы можете найти их от разных производителей. Единственное другое соображение - не забудьте включить поддержку ECC в BIOS.


Google вышел, качаясь по этому вопросу. См. Http://blogs.zdnet.com/storage/?p=638 о том, как это действительно влияет на современные системы.

6

Я думаю, что ECC стоит использовать только тогда, когда этого требует сервер. Википедия:

Обнаружение и исправление ошибок в компьютерных системах, кажется, входит и выходит из моды. Сеймур Крэй, как известно, сказал, что "паритет для фермеров", когда его спросили, почему он оставил это вне CDC 6600. Он включил паритет в CDC 7600 и по общему мнению сказал: «Я узнал, что многие фермеры покупают компьютеры».

Я не могу найти точный источник в Интернете, кроме туманных заявлений об ошибке в один бит в месяц на гигабайт, что явно смешно; серверы будут грохот влево и вправо во всем мире , если это было отдаленно верно.

Некоторые основные моменты из потока MetaFilter от реальных администраторов сервера:

Я думаю, что ECC - это классная штука, но у меня были серверы как с так и без него, и я никогда не делал, чтобы его присутствие или отсутствие делали что-либо, так или иначе.

Я понимаю назначение ECC RAM, но не в этом суть. Я имею в виду, я никогда не замечал никаких проблем, связанных с переключением битов космических лучей. Даже на серверах персональных вычислений / компиляции с несколькими годами безотказной работы. Не сказать, что биты не перевернулись, но они, конечно, не имели значения.

В моем опыте работы с несколькими тысячами машин здесь и там, у вас больше шансов на то, что Ext3 будет молча рвать вас, чем на проблему, исправляемую ECC.

Лично я думаю, что ECC немного грузоподъемен, но это разумный страховой полис на большом мощном сервере, если надбавка к стоимости не слишком высока.

3

Мы рассмотрели это для критических систем. Одна проблема становится, как, черт возьми, вы делаете обнаружение ошибок в программном обеспечении, чтобы проверить целостность вашей памяти, когда программа, используемая для запуска проверки целостности памяти, сама может быть подвержена ошибкам памяти ??? Вы в принципе не можете, и это затрудняет анализ режима отказов / уменьшение отказов, поэтому ECC - это механизм снижения.

Это один из тех случаев, когда в случае возникновения проблем вы можете обвинить космические лучи ;)

2

Я бы рассмотрел ECC RAM для "критически важных" приложений. Если из-за ошибки сервера вы потеряете значительные суммы денег (или убьете людей, или что-то еще), смените их на ECC. В общем, взвесьте стоимость оперативной памяти ECC по сравнению с тем, что вы потеряете в случае ошибки.

Но независимо от того, что вы решите, я рекомендую запускать MemTest86+ в течение ночи (или достаточно долго, чтобы сделать несколько проходов по всему адресному пространству). И если вы сможете увеличить нагрев (в буквальном смысле), это даст вам представление о том, как будет работать ваш ОЗУ, когда система сильно нагревается.

У меня были совершенно новые ошибки экспонирования RAM в MemTest. У меня также были "хорошие" ошибки разработки оперативной памяти, которые обнаружил MemTest. Это отличный инструмент, и я первым делом запускаю новую систему.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .