2016-10-20 26 views
9

Próbuję zainstalować tensorflow 0.11.0 uruchamiającbłędu instalacja Tensorflow - (katalog nie jest pusty)

./configure 

Dostaję błąd mówiąc:

ERROR: /home/abc/.cache/bazel/_bazel_abc/235fe154e0/server (Directory not empty). 

nie jestem pewien, czy są one związane, ale przed komunikatem o błędzie, ja również dostać ostrzeżenie, mówiąc:

WARNING: Output base '/home/abc/.cache/bazel/_bazel_abc/235fe154e0' is on NFS.  
This may lead to surprising failures and undetermined behavior. 

nie mam pojęcia, co znaczy, że komunikat o błędzie s, ale jeśli spróbuj uruchomić ./configure zaraz po tym komunikacie o błędzie, mam inny komunikat mówiąc:

/home/rkohli1/.cache/bazel/_bazel_rkohli1/235fe154e0a4c7e0c0527cd185fe6b6b/server/ 
.nfs00000000820050bd00000e9e (Device or resource busy). 

W tym momencie, po prostu próbowałem usunięcie całego folderu .cache (musiałem najpierw zabić proces co uniemożliwiło mi usunięcie go). Próbowałem również uruchomić configure z flagą --expunge_async, ale to nie pomaga. Przenosi mnie z powrotem do pierwszego komunikatu o błędzie.

Nie jestem pewien, czy to istotne, ale próbuję zainstalować tensorflow GPU z obsługą CUDA 8.0 i używać i cudNN 5

+1

To jest błąd w Bazelu (widocznie ma problem z użyciem pliku .cache na NFS), czy możesz go zgłosić https://github.com/bazelbuild/bazel/issues? –

+0

Okay, podniosłem problem w bazel: https://github.com/bazelbuild/bazel/issues/1970 Mam nadzieję, że ktoś może zaproponować obejście, chociaż istnieje, lub musiałbym do korzystania z innej biblioteki głębokiego uczenia się, aby móc korzystać z GPU. Dzięki! – kerouac

+0

Otrzymujesz 'Device or resource busy' ponieważ bazel wydaje się kontynuować działanie. Wykonaj 'ps aux | grep bazel', a zobaczysz. – Mitar

Odpowiedz

18

Nie jestem pewien, czy to jest prawidłowe. Po zmianie

bazel clean --expunge 

do

bazel clean --expunge_async 

w pliku tensorflow/configure, kompilacja zakończy się powodzeniem.

środowiskach:

  • Bazel 0.3.1
  • cuDNN 5
  • Cuda 8,0
0

obliczu sam problem z Bazel 0.4.5 jednak mogłoby rozwiązać przez zmianę bazel clean --expunge do bazel clean --expunge_async w tensorflow/configure plik.

Powiązane problemy