Jestem zaznajomiony z posiadaczami danych R, takimi jak wektory, ramka danych itd., Ale trzeba przeprowadzić analizę tekstu i wygląda na to, że pyton ma kilka dobrych ustawień. Moje pytanie brzmi: gdzie mogę znaleźć wyjaśnienie, w jaki sposób Python przechowuje dane.Przejście do Pythona z R, jaki jest odpowiednik ramki danych w pythonie?
W szczególności mam zestaw danych w pliku oddzielonym tabulatorami, w którym tekst znajduje się w trzeciej kolumnie, a punktacja potrzebnych danych znajduje się w czwartej kolumnie.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
W R bym po prostu załadować do ramki danych o nazwie df1
a gdy chciałem zadzwonić kolumnę użyję DF1 $ tekst lub df1[,3]
i gdybym chciał konkretną komórkę I przydałby df1[1,3]
.
Czuję, jak czytać dane w pythonie, ale nie mam do czynienia z strukturami podobnymi do tabel.
Jak zasugerowałbyś pracę z tym dla początkującego pytona?
Python ma równoważną ramka danych –
@DavidHeffernan Co z tymi [pandami] (http://pandas.pydata.org/) rzeczy? Czy to nie ma być zamierzone? – joran
@joran To trzecia strona. Przypuszczam, że chodzi mi o to, że nie ma nic wbudowanego w sposób, w jaki ramka danych R jest wbudowana. –