2016-01-07 13 views
5

Czy jest coś takiego jak funkcja stołu R w Julii? Przeczytałem o xtab, ale nie wiem jak z niego korzystać.Funkcja stołu R w Julii (dla DataFrames)

Załóżmy, że mamy R data.framerdata, który jest col6 z typu .

R przykładowy kod:

rdata <- read.csv("mycsv.csv") #1 table(rdata$col6) #2

W celu odczytania danych i dokonania czynniki Julia robię to tak:

using DataFrames jldata = readtable("mycsv.csv", makefactors=true) #1 :col6 will be now pooled.

..., ale jak zbudować R's table jak w Julii (jak osiągnąć # 2)?

+0

Zobacz tę bieżącą dyskusję na stronie: [StatsBase] (https://github.com/JuliaStats/StatsBase.jl/issues/32) – SalchiPapa

Odpowiedz

4

Możesz użyć funkcji countmap z StatsBase.jl, aby policzyć wpisy pojedynczej zmiennej. Na tym etapie brakuje ogólnych tabel krzyżowych i testów statystycznych na tablice kontyngencji. Jak wskazuje Ismael, zostało to omówione w narzędziu do śledzenia problemów pod numerem StatsBase.jl.

4

doszedłem do wniosku, że podobny efekt można osiągnąć stosując by:

Niech jldata składa :gender kolumnie.

julia> by(jldata, :gender, nrow) 3x2 DataFrames.DataFrame | Row | gender | x1 | |-----|----------|-------| | 1 | NA | 175 | | 2 | "female" | 40254 | | 3 | "male" | 58574 |

Oczywiście nie jest to table ale przynajmniej mam ten sam typ danych jako źródło danych. Zaskakująco by wydaje się być szybsze niż countmap.

+0

to naprawdę miłe. Wolę to przez 'countmap' dla ramek danych. – niczky12

+0

Warto dodać, że ta metoda może być używana do wykonywania wielu tabel krzyżowych, których 'countmap' nie może teraz wykonać. – niczky12