Я выхожу на конечности здесь. Пожалуйста, дайте мне знать, если я ошибаюсь, и я исправлю или удалю сообщение:
Pre-amble:
- Ваша рабочая станция - Dell Precision 490 с материнской платой 0GU083.
- На плате установлен контроллер памяти на чипсете Intel 5000X, в котором используются полностью буферизованные модули DIMM.
- У вас установлено 8 модулей DIMM. Все 8 FB DIMM с поддержкой ECC. (См. Журнал декодирования DMI, строки 561–578 для DIMM # 1, а затем информацию о других 7 DIMM.
- 8x2 ГиБ - 16 ГиБ. BIOS успешно обнаруживает, что присутствует 16 ГиБ.
Во время проверки POST / памяти обнаружена ошибка: см. Строку 549: Descriptor 4: Multi-bit ECC memory error
и строка 927: Status: Firmware-detected hardware failure
.
Ваша материнская плата использует попытки использовать полностью буферизованные модули DIMM (FBD) в наборах по четыре. (См. Руководство по адресу ftp://ftp.dell.com/Manuals/all-products/esuprt_desktop/esuprt_dell_precision_workstation/precision-490-dt_user%27s%20guide_en-us.pdf).
End_preamble:
Это означает, что:
- Вам не нужно беспокоиться о званиях. (?) Не уверен на 100% здесь, но ранжирование касается электрического пути между контроллером памяти и параллельными модулями DIMM. В FB-DIMM используется последовательный интерфейс, специально разработанный для предотвращения проблем ранга.
- По крайней мере один из модулей DIMM опубликовал ошибку. Эта ошибка либо присутствует, либо должна быть устранена.
Linux, вероятно, не добавил, что неисправный 2 GiB DIMM.
Новая информация, добавленная в POST, теперь делает его чистым: в то время как BIOS обнаруживает 16 ГБ, он также «устанавливает» только 12 ГБ. Это то, что Linux будет использовать. Так что часть о добавлении или пропуске памяти в Linux не имеет значения.
То, что я не унываю, - то, почему это приводит к 12 ГБ памяти, а не 14 ГиБ. Единственная причина, о которой я могу думать, это то, что она сдалась, когда столкнулась с ошибкой после последовательного добавления областей памяти. Что-то вроде этого:
Add 2GiB DIMM. 2GiB now available.
Add 2GiB DIMM. 4iB now available.
Add 2GiB DIMM. 6GiB now available.
Add 2GiB DIMM. 8GiB now available.
Add 2GiB DIMM. 10GiB now available.
Add 2GiB DIMM. 12GiB now available.
Add 2GiB DIMM. ERROR. STOP ADDING. Remain at 12GiB.
Stopped. Do not try the possibly working remaining DIMM.
Было бы здорово подтвердить это от кого-то, кто знает гораздо больше о том, как память добавляется ядром. Справка о том, как провести тестирование на поврежденную область и как ее избежать , также была бы полезной.
Другая потенциальная проблема - поврежденный разъем памяти или след на материнской плате. Это может даже повлиять на многократные сокеты, так как модули FB-DIMM связаны, а не доступны параллельно.
Если вы посмотрите таблицу данных для контроллера памяти Intel 5000X и посмотрите на Figure 1.1
вы увидите это:
На рисунке показано до 16 FBDIMM. До это ключевое слово. Ваш имеет 8. Разумный путь для 8 сокетов при сохранении доступа к четырехканальной памяти будет 4 канала с 2 сокетами в каждом.
Если один такой канал не работает, вы потеряете два модуля DIMM, что приведет к 12 ГиБ.