Chciałbym użyć Attribute-Relation File Format z scikit-learn, aby wykonać zadanie NLP, czy to możliwe? Jak korzystać z pliku .arff
z scikit-learn
?. Pliki .arff z scikit-learn?
Odpowiedz
Naprawdę polecam liac-arff. To nie jest ładowany bezpośrednio do numpy, ale konwersja jest prosta odpowiedź
import arff, numpy as np
dataset = arff.load(open('mydataset.arff', 'rb'))
data = np.array(dataset['data'])
Znalazłem, że scipy has a loader for arff files, aby załadować je jako numpy tablice rekordów. Nie jestem w 100% pewien, czy te tablice są odpowiednie do bezpośredniego spożycia przez naukę scikit, ale to powinno wystarczyć.
Czy myślisz, że będę musiał przeanalizować te numpy tablice? ... Jaki rodzaj preprocesu musiałbym zrobić, aby podać jakiś algorytm klasyfikacji w nauce scikit? – tumbleweed
Śledź renatopp za: zakładamy danych jest zbiór danych irys, nie powinno być 5 wymiarowa z ostatniego jest kolumna klasy etykieta.
s = svm.SVC()
data_input = data[:,0:4]
labels = data[:,4] # this is the class column
s.fit(data_input, labels)
Myślę, że to jest coś, co chcesz.
- 1. Jak odczytać plik .arff z R?
- 2. ARFF do przetwarzania języka naturalnego
- 3. jak załadować plik w formacie .arff do matlab
- 4. dlaczego scikitlearn mówi, że wynik F1 jest źle zdefiniowany przy FN większym niż 0?
- 5. Pliki strumieniowe z cherrypy
- 6. Porównaj pliki z awk
- 7. statyczne pliki z express.js
- 8. Konwersja Weka CSV na Arff: IllegalArgumentException: nazwy atrybutów nie są unikalne
- 9. Jak zamknąć pliki z tempfile.mkstemp?
- 10. Usuń pliki obrazów z serwera
- 11. Pliki z mapą pamięci Windows
- 12. Jak „Split” pliki z git
- 13. Jak tworzyć pliki z JavaScript?
- 14. Node.js + Pliki statyczne z RESTIFY
- 15. Porównaj dwa pliki z Aptana
- 16. Pliki RD z innym kodowaniem
- 17. Jak odzyskać pliki z indeksu
- 18. Wygasające pliki cookie z AngularJS?
- 19. Pobierz pliki binarne z Javascriptem
- 20. Pliki listy z wieloma warunkami
- 21. Dołącz pliki YAML z snakeyaml
- 22. Przenośne pliki binarne z rdzą
- 23. Ciągnij specjalne pliki z ADB
- 24. Problemy z wydajnością licząc pliki z System.IO.Directory.GetFiles()
- 25. Brakujące pliki JAR Brakujące obrazy/pliki (zasoby)
- 26. Jak przekonwertować pliki WMF na pliki SVG
- 27. Skopiuj pliki, pomijając istniejące pliki - Unix
- 28. Jakie pliki COFF (pliki .OBj) są dostępne?
- 29. Jak połączyć dwa pliki tcpdump (pliki pcap)?
- 30. gdzie pliki bazy danych MySQL przechowują pliki?
Dzięki za opinię. Każdy pomysł, w jaki sposób mogę użyć tej rozmowy do klasyfikacji? – tumbleweed
Wszyscy wiemy, że na przykład z SVM podstawową ideą klasyfikacji jest: 'od sklearn import svm s = svm.SVC() lables = [etykieta1, etykieta2] s.fit (training_data, etykiety)' Jak przedstawiam plik 'arff' do algorytmu klasyfikacji? – tumbleweed
Czy można analizować wyniki TF-IDF z pliku .arff i używać go w sklearn? –