Я пытаюсь использовать мой NVIDIA GPU для научных целей. Однако через некоторое время я запустил процесс для этого графического процессора, мой компьютер выключается. Она не может быть открыта с помощью кнопки кейса, пока кнопка питания блока питания не отключится и не останется в этом состоянии не менее 30 секунд, а затем не включится. Я пытаюсь определить причину этой ситуации.

Мой системный обзор:

  • Linux (Fedora)
  • Материнская плата: Gigabyte GA-970A-UD3
  • Nvidia Gtx 1070 (для задач GPU)
  • Radeon HD 7850 (для стандартных целей)
  • 700 Вт БП

Вот список вещей, которые я пробовал до сих пор:

  • Я сделал тест загрузки процессора, и он не выключается
  • Я снял AMD GPU, он все еще выключается
  • Он не выключается, если я в течение короткого времени даю легкий расчет графическому процессору Nvidia
  • Если я приведу тяжелый расчет, он отключится очень скоро после запуска
  • Я проверил nvidia gpu temp и даже он плавает макс. около 55 С, выключается
  • Я вручную установил скорость вентилятора графического процессора Nvidia на% 80. Похоже, это помогло, потому что задание выполнялось немного дольше, чем обычно, но не мешало завершению работы.
  • Я удалил лишний HDD или вентиляторы, чтобы сделать PSU менее уставшим, это не помогло вообще
  • Я добавил дополнительный блок питания, используя add2psu, но все еще выключения
  • Даже если температура процессора составляет около 45, он выключается, если Nvidia GPU начинает делать вычисления
  • Я полностью изменил свое программное обеспечение для расчетов, однако он отключился
  • Я обновил драйвер Nvidia и это не помогло
  • Я попробовал случайные вычисления, чтобы изолировать процесс чтения жесткого диска, но он все еще отключается
  • Я переустановил ОС, но проблема сохраняется
  • Я проверил материнскую плату, но никаких следов ожога

Каковы ваши предложения? Что может быть причиной этого?

Спасибо.

2 ответа2

0

Какая у вас температура процессора? Неправильное использование термопасты, например: нехватка или неправильное расположение процессорного кулера может вызвать ту же проблему из-за перегрева, и последнее, что нужно проверить, это источник питания, у меня недавно был один, который выходил из строя под нагрузкой (играми) и перезагружал мою систему но когда я не играл, бегал часами. Самым дешевым и легким для проверки вначале был бы блок питания, если все еще нет никакого облегчения, а затем изучите возможность восстановления термопасты на процессоре и убедитесь, что кулер процессора установлен правильно.

-1

Я проверил тактовые частоты во время выполнения задач в графическом процессоре Nvidia и обнаружил, что он действительно превышает максимально допустимый. Таким образом, в некоторых более низких состояниях, таких как P8, он не выключается, но эта разогнанная частота не позволяет работать в более высоких состояниях.

Я не могу ограничить тактовую частоту графического процессора Nvidia. Однако мне удалось заставить его работать, ограничивая его энергопотребление, но за счет относительной более медленной скорости выполнения на 20%.

Команда:

nvidia-smi --persistence-mode=1
nvidia-smi --power-limit=$POWER_LIMIT

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .