Używam nvidia GTX1080 gpu (8 GB) do uruchomienia Inception model na tensorflow, gdy ustawię batch_size = 16 i image_size = 400, a następnie po uruchomieniu programu, mój ubuntu14. 04 spowoduje automatyczne ponowne uruchomienie.system automatycznie uruchamia się ponownie, gdy model tensorflow jest zbyt duży
Odpowiedz
Upewnij się, że to nie jest problem z zasilaczem. Obserwowałem dziwne sporadyczne restarty na mojej maszynie programistycznej. W miarę zwiększania rozmiaru danych wejściowych (wielkość partii, większa liczba NN) wzrastała również szybkość restartów. Okazało się, że to problem z zasilaczem. Szybkim sprawdzeniem jest ograniczenie zużycia energii GPU i sprawdzenie, czy to zachowanie zniknie. Na przykład, można ograniczyć moc do około 150 watów z tego polecenia (trzeba mieć uprawnienia sudo):
sudo nvidia-smi -pl 150
I śledzone problemu w dół do wadliwego zasilacza. Miał wystarczającą pojemność zgodnie ze specyfikacją, a ograniczanie poboru mocy przez GPU przez uruchomienie "nvidia-smi -pl 150" wcale nie pomogło. Prawdopodobnie nie byłby w stanie poradzić sobie z impulsami w zużyciu energii.
W każdym razie, po zmianie zasilacza z "Corsair CX750 Builder Series ATX 80 PLUS" na "Cooler Master V1000", problem już minął. Zobacz szczegóły mojego dochodzenia w TensorFlow GitHub issue.
Zmiana ustawień zasilania GPU będzie działać, jeśli masz zasilacz z wystarczającą mocą (WATTS). Ograniczałem moc mojego GPU (TITANX) do max. 200 WATTS używa,
sudo nvidia-smi -pl 200
UWAGA: Każdy GPU ma ograniczenia mocy, np. Limit mocy TITANX wynosi od 125 W do 300 W. Dlatego upewnij się, że wartość dodana jest pomiędzy tymi limitami.
- 1. Projekt Java staje się zbyt duży
- 2. JAVA -tomcat- Nagłówek żądania jest zbyt duży
- 3. wykryć, czy przesłany plik jest zbyt duży
- 4. Zmiana działania czcionki ponownie uruchamia się.
- 5. Szyny: zbyt duży poziom stosu
- 6. Python Multiprocessing: niektóre funkcje nie zwracają się, gdy są kompletne (materiał kolejki jest zbyt duży)
- 7. automatycznie ponownie uruchamia usługę przez wieczność dla nodejs
- 8. Wyczyść stos ponownie, gdy obiekt aplikacji zostanie zabity przez system
- 9. Klient SockJS automatycznie łączy się ponownie?
- 10. Spróbuj ponownie/złap, gdy się zawiedzie
- 11. excel VBA uruchamia makro automatycznie, gdy komórka zostanie zmieniona
- 12. MouseHover nie uruchamia się, gdy mysz jest wyłączona.
- 13. WPF TouchUp nie uruchamia się, gdy włączona jest nadrzędna manipulacja.
- 14. Tryb pojedynczej aplikacji Enterprise App nie zawsze automatycznie się uruchamia.
- 15. Jak ponownie użyć RNN w TensorFlow
- 16. Przesyłanie pliku Golang: bliskie połączenie, jeśli plik jest zbyt duży.
- 17. Jak uzyskać system Windows SCM, aby ponownie uruchomić moją usługę, gdy się zawiedzie
- 18. Tekst w skrypcie WPF pasuje tylko wtedy, gdy jest zbyt duży
- 19. Plik pikli zbyt duży, aby załadować
- 20. Błąd przesunięcia jest ujemny lub zbyt duży - poprawne rozwiązanie?
- 21. MPMoviePlayerController zatrzymuje odtwarzanie iPoda i nie uruchamia się ponownie.
- 22. Zbyt duży rozmiar pliku dziennika w szynach
- 23. Wizualizacja niekierowanego wykresu, który jest zbyt duży dla GraphViz?
- 24. Aplikacja ulega awarii i uruchamia się ponownie telefon
- 25. Rozmiar aplikacji aplikacji Corona sdk jest zbyt duży
- 26. Animacja CSS nie uruchamia się ponownie po zresetowaniu klasy
- 27. Usługa android uruchamia się ponownie po zabiciu aplikacji
- 28. Klucz komputera zmienia się, gdy pula aplikacji jest ponownie przetwarzana.
- 29. C String Literal "zbyt duży dla postaci"
- 30. Auto-Start service application/global.asax/WCF uruchamia się automatycznie, gdy IIS7
Możesz chcieć dodać wartości batch_size i image_size, które wydają się powodować problem w uzyskaniu trafnych odpowiedzi. – fvu
jaka jest konfiguracja systemu? – titus
tensorflow powinien wyrzucać błąd braku pamięci, a nie restartować system. – suiyuan2009