Podążałem za linkiem this, aby użyć tekstu. Wyszkoliłem model za pomocą dostarczonego polecenia. Ale nie widzę żadnego folderu "train" w katalogu "textsum/log_root /". Ponieważ szkolenie odbywa się na przykładowym pliku, czy model będzie mógł pracować na danych testowych w czasie rzeczywistym? Jeśli nie, w jaki sposób mogę utworzyć dane szkoleniowe i przeszkolić model? A co najważniejsze, w jaki sposób mogę przetestować/użyć modelu, aby zobaczyć podsumowanie wyników?Jak korzystać z tekstu?
Odpowiedz
Szczerze nie mogę odpowiedzieć, dlaczego nie widziałbyś folderu kolejowego w katalogu katalog_główny_logów, jeśli poprawnie przekazałeś wszystkie parametry. Jeszcze jedną rzeczą do zapamiętania jest upewnienie się, że czekasz wystarczająco długo. Więc kiedy wykonasz ćwiczenie treningowe za pomocą funkcji Textsum, widzisz jakieś szczegółowe dzienniki z informacją, że jest jakiś błąd, na przykład brak listy plików lub coś podobnego. Jeśli tak, to ścieżka przekazana do jednego z parametrów jest prawdopodobnie wyłączona. Jest to względne względem ścieżki, z której ją wywołujesz, więc musisz upewnić się, że jesteś na ścieżce głównej, gdzie znajduje się plik obszaru roboczego.
Kolejna rzecz, czy korzystasz z procesora lub GPU? Jeśli korzystasz z procesora CPU, to zajmuje trochę czasu, zanim model osiągnie punkt, w którym jest nawet w stanie zapisać dane. Teraz, jeśli używasz GPU, jest to znacznie szybsze, ale musisz poczekać, aż logi "average_loss" zaczną drukować na twoim ekranie. Gdy zauważysz te, istnieje duża szansa, że zobaczysz swój folder "train" z danymi.
Jeśli chodzi o dane testowe "w czasie rzeczywistym", wciąż w to wpatruję, a teraz, gdy moje bieżące dane są przeszkolone w tym modelu, zacznę od tego również. Kierunek, jak rozumiem do tej pory, polega na tym, że gdy już wyćwiczysz swój model i posiadasz plik pikla lub coś innego, możesz "obsłużyć" go przy użyciu informacji tutaj: https://tensorflow.github.io/serving/
W tym momencie twój model jest przeszkolony i możesz zapytać o niego i podać nową odpowiedź, aby z czasem twój model stał się mądrzejszy. Jeszcze raz nie dowiodłem tego na przykładzie, ale jest to podejście, które niedługo rozpocznę.
Jeśli chodzi o "testowanie modelu", wystarczy wykonać instrukcje zawarte w pliku tekstowym git, ponownie wygenerować plik vocabu, a następnie szkolenie. Następnie, po tym, jak otrzymasz średnią stratę do wystarczająco małej frakcji, możesz uruchomić dekodowanie względem danych. Następnie w folderze dekodowania log_root zobaczysz wygenerowane nagłówki i powiązane z nimi pliki referencyjne (jaki był rzeczywisty nagłówek). Mam nadzieję, że to pomoże i powodzenia!
- 1. Jak korzystać z edytora tekstu WordPress zachowywać się jak html
- 2. Jak korzystać z adnotowanego obrazka dla chińskiego tekstu?
- 3. Czy mogę korzystać z wyświetlacza: wbudowany z wyrównaniem tekstu: prawda?
- 4. Jak korzystać z find_module?
- 5. Jak korzystać z RedirectToRoute?
- 6. Jak korzystać z WSDL
- 7. Jak korzystać z kCTSuperscriptAttributeName?
- 8. Jak korzystać z pgdb.executemany?
- 9. Jak korzystać z org.mockito.AdditionalMatchers.gt?
- 10. Jak korzystać z createTransport?
- 11. Jak korzystać z UIRemoteNotificationTypeVoIP?
- 12. Jak korzystać z onResume()?
- 13. Jak korzystać z phantomjs?
- 14. Jak korzystać z Form.ShowDialog?
- 15. jak korzystać z particles.js?
- 16. Jak korzystać z MonadRandom?
- 17. Jak korzystać z ReadWriteLock?
- 18. Jak korzystać z QueryPerformanceCounter?
- 19. Jak korzystać z QTextBlock?
- 20. Jak korzystać z cepstral?
- 21. Jak korzystać z metodyWindowFocusChanged()?
- 22. Jak korzystać z MediaSessionCompat?
- 23. Jak korzystać z navigator.app.exitApp()?
- 24. Jak korzystać z MPI_Type_create_subarray?
- 25. Jak korzystać z Microsoft.Scripting.Hosting?
- 26. Jak korzystać z PackageManager.addPreferredActivity()?
- 27. Jak korzystać z Html.Action?
- 28. Jak korzystać z UIPageControl?
- 29. Jak korzystać z cscope?
- 30. Jak korzystać z BottomSheetDialog?
Witaj xtreeme, trenowałem mój model ponad 1 milion rekordów, ale nie generuje dekodowanego podsumowania z plikiem referencyjnym. – Wazzzy
Hej @Wazzzy ... jakość w dużej mierze zależy od czystości danych użytych do szkolenia. Ponieważ jest to model abstrakcyjny, nie uzyskasz dokładnego dopasowania, ponieważ model generuje dosłownie coś samodzielnie w oparciu o dane, które zostały przeszkolone, i dlatego potrzebujesz tak dużego zestawu danych. To powiedziawszy, wyniki powinny być bliskie. Jeśli tak nie jest, możesz spojrzeć na dane, które wprowadziłeś i spróbować je wyczyścić. Możesz łatwo powiedzieć, jak dobre są Twoje dane, patrząc na plik vocab i widząc, co tam jest. – xtr33me