Obecnie jest możliwe określenie, który procesor lub GPU będzie używany z funkcją tf.device (...) dla określonych operacji, ale czy jest tam gdzie można określić a rdzeń procesora?Tensorflow: wykonywanie ops z określonym rdzeniem procesora
7
A
Odpowiedz
13
Obecnie nie ma interfejsu API do przypinania ops do określonego rdzenia, ale byłby to dobry feature request. można w przybliżeniu tę funkcjonalność poprzez stworzenie wielu urządzeń procesora, każdy z pojedynczym gwintem puli wątków, ale to nie jest gwarantowane, aby utrzymać lokalizację rdzenia-przypinanie rozwiązanie:
with tf.device("/cpu:4"):
# ...
with tf.device("/cpu:7"):
# ...
with tf.device("/cpu:0"):
# ...
config = tf.ConfigProto(device_count={"CPU": 8},
inter_op_parallelism_threads=1,
intra_op_parallelism_threads=1)
sess = tf.Session(config=config)
Powiązane problemy
- 1. TensorFlow: Wykonywanie tego obliczenia strat
- 2. Limit Tensorflow Wykorzystanie procesora i pamięci
- 3. Obliczanie SHA1 z rdzeniem ASP.NET
- 4. Jak sprawić, aby TensorFlow używał bardziej dostępnego procesora CPU
- 5. Problem kompilacji Resharpera z rdzeniem ASP.NET 1.0
- 6. Uwierzytelnianie systemu Windows z rdzeniem asp.net
- 7. Programowanie z rdzeniem JAVA - Reflection API
- 8. Rdzenie w stylu silnika z rdzeniem źródłowym
- 9. Jak korzystać z aplikacji dapper z rdzeniem ASP.Net?
- 10. Używanie procesora z Androidem
- 11. Tensorflow OOM na GPU
- 12. TensorFlow in_top_k dane wejściowe do oceny
- 13. Przywracanie modelu TensorFlow
- 14. Dlaczego powinienem wybrać ASP.NET Core z rdzeniem .Net?
- 15. Tworzenie animatable półprzezroczystą nakładkę z rdzeniem warstw animacji
- 16. Sprawdź, czy pakiet jest zgodny z rdzeniem .net
- 17. Różnica między ehcache i ehcache rdzeniem
- 18. Co to jest state_size z MultiRNNCell w TensorFlow?
- 19. Co oznacza czas procesora Incl, czas procesora, czas rzeczywistego procesora, czas rzeczywistego procesora w trybie śledzenia?
- 20. Tensorflow - Python: Jak mogę używać własnych danych z TensorFlow?
- 21. Wykorzystanie procesora Java VisualVM i powinowactwo procesora
- 22. semantyczny segmentacja z tensorflow - ValueError w funkcji straty (rzadki-Softmax)
- 23. Sprawnie pobierać gradienty z TensorFlow?
- 24. Walidacja i test z TensorFlow
- 25. Wyjście z Tensorflow LSTM-Cell
- 26. Implementacja słowa tensorflow z word2vec
- 27. Html.ActionLink z określonym identyfikatorem HTML?
- 28. TensorFlow REST Frontend ale nie TensorFlow Obsługa
- 29. Wykonywanie innej aplikacji z Java
- 30. Wykonywanie skryptu Bash z Golang
Wow, po prostu za pomocą prostego testu przyrost prędkości był 3-krotny. Dziękuję bardzo! EDYCJA: Po przeprowadzeniu badania, 3-krotny wzrost prędkości jest spowodowany tylko przez ustawienie konfiguracji zgodnie z opisem w odpowiedzi. To sprawia, że czuję, że używam RNN. Zajrzę w to! – PhABC
BTW, myślę, że musisz ustawić inter_op_parallelism_threads na wyższy numer w powyższym przykładzie, w przeciwnym razie uruchomi wszystko sekwencyjnie, oto test https://gist.github.com/yaroslavvb/b73ff35424dd7ab762234620cf583aac –