Jaka jest moja najlepsza opcja dla wykresów typu rozkładu (histogram lub kde), gdy moje dane są ważone?Wykresy typu rozkładu (histogram/kde) z ważonymi danymi
df = pd.DataFrame({ 'x':[1,2,3,4], 'wt':[7,5,3,1] })
df.x.plot(kind='hist',weights=df.wt.values)
To działa dobrze, ale Seaborn nie zaakceptuje ciężarów kwarg, tj
sns.distplot(df.x, bins=4, # doesn't work like this
weights=df.wt.values) # or with kde=False added
Byłoby również miło, gdyby kde zaakceptuje ciężary ale ani pandy ani Seaborn Wygląda na to pozwolić.
Zdaję sobie sprawę, że dane mogą zostać rozszerzone w celu udowodnienia ważenia i jest to łatwe, ale nie jest zbyt użyteczne w moich prawdziwych danych z wagami w setkach lub tysiącach, więc nie szukam takiego obejścia.
W każdym razie to wszystko. Próbuję tylko dowiedzieć się, co (jeśli w ogóle) mogę zrobić z ważonymi danymi poza podstawowym histogramem pand. Nie oszukałem jeszcze z bokeh, ale sugestie bokeh są również mile widziane.
Tak, dzięki, że jest bardzo pomocna. Nie byłem pewien, jak przekazać kwarg do matplotlib. Przeprowadzę teraz przegłos, ale zostawię go nieco dłużej otwarty na wypadek, gdyby ktoś miał pomysły na temat KDE. – JohnE
Seaborns kde działki wykorzystuje do obliczeń szablony pakietów Pythona. Odpowiednie funkcje przyjmują argumenty wagowe, ale wydaje się, że nie są one przekazywane przez seaborn. Odpowiednie pliki źródłowe: https://github.com/mwaskom/seaborn/blob/master/seaborn/distributions.py i https://github.com/statsmodels/statsmodels/blob/master/statsmodels/nonparametric/kde.py – hitzg
OK, dzięki. Wygląda na to, że wagi mogą nie zostać jeszcze zaimplementowane (nie mogę powiedzieć na pewno z szybkiego podglądu). W każdym razie zamknę to teraz i może zadam pytanie bardziej skupione na kde w późniejszym czasie. – JohnE