W moim problemie mam bardzo duży zbiór danych, który jest poza moją pamięcią. Chciałbym trenować mój model przy użyciu danych dyskowych, takich jak HDF5 lub podobne. Czy sklearn obsługuje to, czy jest jakaś inna alternatywa?Czy istnieje sposób na wyćwiczenie modelu sklearn na podstawie danych dyskowych, takich jak HDF5?
7
A
Odpowiedz
4
To, o co prosisz, nazywa się uczeniem typu out-core lub streaming. Jest to możliwe tylko w przypadku podzbioru modeli naukowego uczenia się, które implementują metodę przyrostowego dopasowania do metody partial_fit
.
Istnieje example in the documentation. W szczególności nie ma konkretnego narzędzia do dopasowania modeli do danych w HDF5, ale można go dostosować do pobierania danych z dowolnego zewnętrznego źródła danych (np. Danych HDF5 na dysku lokalnym lub bazy danych w sieci, na przykład przy użyciu adaptera pandas SQL).
Powiązane problemy
- 1. Sklearn: Czy istnieje sposób debugowania rurociągów?
- 2. Czy istnieje sposób wyłączenia buforowania systemowego (unix) dla plików dyskowych?
- 3. Czy istnieje sposób na utrzymanie danych HSQLDB?
- 4. Jak ustawić próg dla klasyfikatora sklearn na podstawie wyników ROC?
- 5. Czy istnieje sposób drenażu części wektora na podstawie predykatu?
- 6. sortuj kolekcję szkieletową na podstawie atrybutów modelu
- 7. (Rails) Czy istnieje sposób na sprawdzenie typu danych pola?
- 8. Czy istnieje lepszy sposób na zbieranie danych z Twittera?
- 9. Warunkowa zmiana img src na podstawie danych modelu
- 10. Czy istnieje sposób na zamaskowane pole liczbowe?
- 11. Błąd "Brak miejsca na urządzeniu" podczas dopasowywania modelu Sklearn
- 12. Czy istnieje sposób na zapewnienie uwierzytelnienia dla bazy danych riak?
- 13. Zmienić wartość modelu na podstawie innych wartości?
- 14. Czy istnieje sposób na wyprowadzenie typu danych Java do konsoli?
- 15. AngularJs: Dodaj klasę na podstawie modelu
- 16. Czy istnieje sposób na przetestowanie połączenia SQLAlchemy?
- 17. Czy istnieje sposób na uzyskanie danych wyjściowych jQuery * rzeczywisty znacznik *?
- 18. Czy istnieje sposób na uzyskanie danych pikseli z Internet Explorera?
- 19. Czy istnieje sposób na znalezienie nazwy div na podstawie lokalizacji (kable x, y)?
- 20. Jak wybrać na podstawie różnych danych kolumny
- 21. Czy istnieje sposób na uzyskanie instancji System.Configuration.Configuration na podstawie dowolnego kodu XML?
- 22. Czy istnieje prosty sposób na uzyskanie ID folderu na podstawie danej ścieżki?
- 23. Czy istnieje sposób na zlokalizowanie aplikacji na różnych platformach?
- 24. cbind: czy istnieje sposób na ustawienie brakujących wartości na NA?
- 25. Czy istnieje sposób na spowolnienie efektu zawisu?
- 26. Usuwanie danych z pliku HDF5
- 27. Czy istnieje szybki sposób na utworzenie zestawu?
- 28. Czy istnieje sposób na zwiększenie symulacji iPada?
- 29. Czy istnieje sposób na wyczyszczenie wyjścia NSLog?
- 30. W React Native na iOS, czy istnieje sposób na określenie, kiedy aplikacja jest wznowiona? Takich jak wydarzenie onResume?
To pytanie zakłada, że w zasadzie wszystkie modele można trenować bez posiadania wszystkich danych w pamięci. Wątpię, czy tak jest. – cel
Jest to całkowicie możliwe, na przykład Caffe używa struktury podobnej do bazy danych do pobierania danych z dysku podczas treningu. – erogol
Ogrisel udzielił odpowiedzi, ale czy znalazłeś jakieś dodatkowe sposoby? Szukam tego samego. – KobeJohn