Я считаю, что мой процессор перегревается, что вызывает панику ядра, и машина перезагружается. Это Intel 3612QE. Я изменил cpufrequtils scaling_governor на ondemand, консервативный, а также powersave для тестирования. По требованию, паника ядра происходит в 70-х годах, и компьютер выключается, консервативно это не происходит, но процессор находится в диапазоне 50-60 градусов, энергосбережение является самым крутым, как и ожидалось, процессор никогда не превышает 1,2 ГГц и колеблется около 50 градусов ,
Я также проверил с выключенным режимом TurboMode (в настройках BIOS), который не позволяет процессору работать с частотой 2,1 ГГц. Это обычно предотвращает панику ядра.
Дело в том, что я не видел темп выше, чем в середине 70-х годов, но паника ядра все еще начинается. Разве это не должно быть 87, о чем мне говорят "датчики"?
Я считаю, что радиатор процессора не идеален, но на самом деле он основан не на фактах, а на тестировании, которое я только что описал. Это пользовательский радиатор.
Есть ли способ поймать это тепловое путешествие, прежде чем оно попадет в ядро? Кроме того, есть ли способ убедиться, что ядро вызвано перегревом? До сих пор мне не удалось запечатлеть вывод паники ядра, так что я только мельком вижу его.
РЕДАКТИРОВАТЬ: есть "активный" тепловой триггер при 71 градусах (cat /sys /class /thermal /thermal_zone0 /trip_point_1_temp), совпадение? Может быть, он пытается запустить вентилятор, который не подключен? Единственный вентилятор находится прямо на радиаторе процессора и постоянно работает на полную мощность.
Вот MCELOG от паники ядра:
mcelog: mcelog read: No such device
Hardware event. This is not a software error.
MCE 0
CPU 0 BANK 4
TIME 1418932337 Thu Dec 18 14:52:17 2014
MCG status:
MCi status:
Uncorrected error
Error enabled
Processor context corrupt
MCA: Internal unclassified error: 402
Running trigger `unknown-error-trigger'
STATUS b200000000100402 MCGSTATUS 0
MCGCAP c09 APICID 0 SOCKETID 0
CPUID Vendor Intel Family 6 Model 58