Я использую глубокое обучение в своих исследованиях, и я добавил в компьютер второе 1080ti, потому что использование только одного не позволило бы мне закончить свои эксперименты вовремя. Tensorflow будет использовать почти 100% GPU и немного CPU.
Проблема: если я запустил тензор потока с обоими графическими процессорами, система выключится примерно через 30 секунд и не будет POST. Я должен удалить первый графический процессор, чтобы снова включить питание (после этого я могу снова добавить первый графический процессор).
Спецификация ПК:
- 1x молчи! Dark Power Pro 11 750 Вт ATX 2.4 (BN252)
- 1x ASUS Prime X370-Pro (90MB0TD0-M0EAY0)
- 1x AMD Ryzen 5 1600 (TDP: 65 Вт), 6x 3,20 ГГц, в штучной упаковке (YD1600BBAEBOX)
- 2 x MSI GeForce GTX 1080 Ti (250 Вт) Gaming X 11G, 11 ГБ GDDR5X, DVI, 2x HDMI, 2x DP (V360-001R)
- 1x Samsung SSD 850 EVO 250 ГБ, SATA (MZ-75E250B)
- 3x Seagate IronWolf NAS HDD 10 ТБ, SATA 6 Гбит / с (ST10000VN0004)
- 1 комплект G.Skill Aegis DIMM 16 ГБ, DDR4-3000, CL16-18-18-38 (F4-3000C16D-16GISB)
Я использую PCIEX16_1 и PCIEX16_2 для графических процессоров.
Что я пробовал до сих пор:
- Запуск тензорного потока с каждым из графических процессоров (100% использования графического процессора) -> ОК для обоих графических процессоров
- Проверка температуры обоих графических процессоров при параллельном использовании графических процессоров: -> OK max temp <80 ° C
- Дважды проверил, что ничего не разлочено -> ОК
Может кто-нибудь, пожалуйста, проведите меня через следующие шаги, чтобы выяснить проблему?
Спасибо за вашу помощь.