Я следовал приведенным ниже инструкциям и подробно прочитал официальное руководство, чтобы настроить Cuda в контейнере LXC.
Когда я пытаюсь выполнить пример сценария ./deviceQuery из официальных примеров кода, я получаю PASS на хосте. Однако когда я выполняю скрипт в контейнере, я получаю следующую ошибку:
$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL
Cuda распознается и устанавливается внутри контейнера:
$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015
Cuda compilation tools, release 7.5, V7.5.17
Устройства nVidia установлены внутри хоста и контейнера LXC:
$ ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195, 0 Dec 20 23:31 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Dec 20 23:31 /dev/nvidiactl
crw-rw-rw- 1 root root 246, 0 Dec 20 23:31 /dev/nvidia-uvm
Когда я запускаю sudo nvidia-smi
внутри контейнера, я получаю следующую ошибку:
Failed to initialize NVML: Unknown Error
Как я могу сделать устройство доступным внутри контейнера?
Linux /index.html