Niedawno zainstalowałem cuda toolkit 5.5 ze sterownikiem 331.67 (Mam GeForce GTX 680). Z jakiegoś powodu nie można uruchomić dowolny z scrips Test:nie wykryto urządzenia obsługującego CUDA (przy użyciu serwera Ubuntu 12.04.4)
$./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery
./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL
ja śledził kroki na „podręczny przewodnik” tu
http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/
i wykonany skrypt, aby utworzyć urządzenie znakowe plików przy starcie (jak używam Ubuntu server edition plików graficznych takie nie są tworzone domyślnie):
$ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195, 0 Apr 11 17:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Apr 11 17:29 /dev/nvidiactl
wyjście na poleceni g polecenie nvidia-smi -a
jest (zarówno dla zwykłego użytkownika, a użytkownik root):
Failed to initialize NVML: Unknown Error
Oto kilka informacji na module nvidia
$ lsmod | grep nvidia
nvidia 11335080 0
$ modinfo nvidia
filename: /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias: char-major-195-*
version: 331.67
supported: external
license: NVIDIA
...
...
sugestie? Dzięki.
EDIT # 1 Próbowałem obniżamy do sterownika 319.76:
$ modinfo nvidia
filename: /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias: char-major-195-*
version: 319.76
supported: external
...
teraz gdy uruchamiam nvidia-smi -a
otrzymuję następujący:
NVIDIA: API mismatch: the NVIDIA kernel module has version 304.116,
but this NVIDIA driver component has version 319.76. Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error
zainstalowałem pakiety nvidia-current-updates
i nvidia-settings-updates
od repos przed zainstalowaniem pliku sterownika i wydaje mi się, że właśnie tam powstały konflikty. Nie znalazłem rozwiązania, ale myślę, że jest to o krok bliżej. Oto wynik modprobe -l | grep nvidia
kernel/drivers/video/nvidia/nvidiafb.ko
kernel/drivers/net/ethernet/nvidia/forcedeth.ko
updates/dkms/nvidia.ko
updates/dkms/nvidia_304_updates.k
jaki jest wynik uruchomienia 'nvidia-smi -a' jako zwykłego użytkownika, a następnie jako użytkownik root? Wklej wyniki do swojego pytania, a nie w komentarzach. –
Jaki jest wynik działania 'nvidia-smi -a'? – cklin
Jeśli 'nvidia-smi -a' pokazuje błąd NVML po uruchomieniu jako root, sterownik nie jest poprawnie załadowany lub nie może znaleźć GPU. Może być konieczne ponowne uruchomienie systemu lub ponowne załadowanie sterownika. Powinieneś również sprawdzić wyjście 'lspci | grep -i nvidia' pokazuje GPU (twój GTX 680) jako obecny. –