Поэтому я создаю машину глубокого обучения с 1 Xeon e5-2620v4 и 2 gtx 1080ti на серверной плате Intel S2600CW2R.
Я купил его в местном магазине и попросил собрать мою систему. Когда он прибыл, система даже не выдает сообщение POST или выводит какие-либо данные на дисплей, просто не отображается (попытался подключить кабель к видеокарте и к встроенному разъему, результаты совпадают). Проведя некоторые исследования, я обнаружил, что локальное хранилище неуместно расположило графический процессор в неправильном слоте PCIe. Я исправляю это, получаю POST системы, и дисплей работает (подключил кабель дисплея к разъему встроенного дисплея) и устанавливаю сервер Ubuntu 16.04.
После этого я попытался «lspci | grep NVIDIA» и вывод мне ничего не дал. Поэтому я подумал, что это должны быть драйверы, которые должны быть установлены. Я установил пакет «nvidia-381» из «ppa:graphics-drivers/ppa», перезагрузил систему, снова попытался «lspci | grep NVIDIA», но ничего не вышло. Затем я попробовал «nvidia-smi», но в выводе говорится:«NVIDIA-SMI не удалось, потому что он не мог связаться с драйвером NVIDIA. Убедитесь, что последний драйвер NVIDIA установлен и работает "
Поэтому я делаю вывод, что материнская плата каким-то образом не может обнаружить подключенную графическую карту. Как я могу решить эту проблему? Кто-нибудь сталкивался с такой же проблемой?
Замечания:
Я пытался подключить дисплейный кабель к одной из видеокарт, пустой экран.
Уже проверены настройки BIOS, опция «Отображение надстроек» выделена серым цветом.
Пробовал GPU на другой системе, работает как шарм
Пробовал загружаться из прежнего режима и режима UEFI, ничего не дает.
Пытался обновить прошивку BIOS, пока безрезультатно.
Я знаю хитрость о том, как работает линия PCIe на этой конкретной платформе (LGA2011). В техническом описании упоминается, что слот PCI/e 1 - 2 связан с разъемом CPU2, а слот PCI/e 3-6 связан с разъемом CPU1. Поэтому, если я хочу подключить свой GPU1 к разъему PCIe 1 и GPU2 к разъему PCIe 4, у меня должно быть установлено 2 ЦП.