. Pliki .arff z scikit-learn?

Chciałbym użyć Attribute-Relation File Format z scikit-learn, aby wykonać zadanie NLP, czy to możliwe? Jak korzystać z pliku .arff z scikit-learn?. Pliki .arff z scikit-learn?

Źródło

2014-12-03 tumbleweed

Naprawdę polecam liac-arff. To nie jest ładowany bezpośrednio do numpy, ale konwersja jest prosta odpowiedź

import arff, numpy as np 
dataset = arff.load(open('mydataset.arff', 'rb')) 
data = np.array(dataset['data'])

Źródło

2014-12-04 12:12:20 renatopp

Dzięki za opinię. Każdy pomysł, w jaki sposób mogę użyć tej rozmowy do klasyfikacji? – tumbleweed

Wszyscy wiemy, że na przykład z SVM podstawową ideą klasyfikacji jest: 'od sklearn import svm s = svm.SVC() lables = [etykieta1, etykieta2] s.fit (training_data, etykiety)' Jak przedstawiam plik 'arff' do algorytmu klasyfikacji? – tumbleweed

Czy można analizować wyniki TF-IDF z pliku .arff i używać go w sklearn? –

Znalazłem, że scipy has a loader for arff files, aby załadować je jako numpy tablice rekordów. Nie jestem w 100% pewien, czy te tablice są odpowiednie do bezpośredniego spożycia przez naukę scikit, ale to powinno wystarczyć.

Źródło

2014-12-03 07:44:31 ogrisel

Czy myślisz, że będę musiał przeanalizować te numpy tablice? ... Jaki rodzaj preprocesu musiałbym zrobić, aby podać jakiś algorytm klasyfikacji w nauce scikit? – tumbleweed

Śledź renatopp za: zakładamy danych jest zbiór danych irys, nie powinno być 5 wymiarowa z ostatniego jest kolumna klasy etykieta.

s = svm.SVC() 
data_input = data[:,0:4] 
labels = data[:,4] # this is the class column 
s.fit(data_input, labels)

Myślę, że to jest coś, co chcesz.

Źródło

2017-02-15 10:48:15

. Pliki .arff z scikit-learn?

Odpowiedz

Powiązane problemy