Próbuję pokazać względny procent przez grupę, jak również całkowitą częstotliwość w barnot sns. Dwie porównywane przeze mnie grupy różnią się bardzo rozmiarem, dlatego też pokazuję procent według grup w poniższej funkcji.częstotliwość i procent nierównomiernych grup sns barplot
Oto składnia dla próbki dataframe utworzonego że ma podobne rozmiary w stosunku do grupy moich danych („grupy”) Wśród docelowej kategorycznego zmiennej („punkt”). "rand" jest po prostu zmienną, której używam, aby df.
# import pandas and seaborn
import pandas as pd
import seaborn as sns
import numpy as np
# create dataframe
foobar = pd.DataFrame(np.random.randn(100, 3), columns=('groups', 'item', 'rand'))
# get relative groupsizes
for row, val in enumerate(foobar.rand) :
if val > -1.2 :
foobar.loc[row, 'groups'] = 'A'
else:
foobar.loc[row, 'groups'] = 'B'
# assign categories that I am comparing graphically
if row < 20:
foobar.loc[row, 'item'] = 'Z'
elif row < 40:
foobar.loc[row, 'item'] = 'Y'
elif row < 60:
foobar.loc[row, 'item'] = 'X'
elif row < 80:
foobar.loc[row, 'item'] = 'W'
else:
foobar.loc[row, 'item'] = 'V'
Oto funkcja, którą napisałem, która porównuje częstotliwości względne według grup. Ma kilka domyślnych zmiennych, ale przydzielono je do tego pytania.
def percent_categorical(item, df=IA, grouper='Active Status') :
# plot categorical responses to an item ('column name')
# by percent by group ('diff column name w categorical data')
# select a data frame (default is IA)
# 'Active Status' is default grouper
# create df of item grouped by status
grouped = (df.groupby(grouper)[item]
# convert to percentage by group rather than total count
.value_counts(normalize=True)
# rename column
.rename('percentage')
# multiple by 100 for easier interpretation
.mul(100)
# change order from value to name
.reset_index()
.sort_values(item))
# create plot
PercPlot = sns.barplot(x=item,
y='percentage',
hue=grouper,
data=grouped,
palette='RdBu'
).set_xticklabels(
labels = grouped[item
].value_counts().index.tolist(), rotation=90)
#show plot
return PercPlot
Funkcja i otrzymaną obserwacji wykres:
percent_categorical('item', df=foobar, grouper='groups')
to dobrze, ponieważ pozwala mi pokazać względny procent w grupie. Jednak chcę również wyświetlić bezwzględne liczby dla każdej grupy, najlepiej w legendzie. W tym przypadku, chciałbym to pokazać, że istnieje 89 Wszystkich członków grupy A i 11 Wszystkich członków grupy B.
Z góry dziękuję za wszelką pomoc.
Dzięki! w poleceniu "brplt =" obie wystąpienia "zgrupowane" należy przełączyć na "zgrupowanie". Dzięki tej zmianie działa to doskonale. – Andrew
Dzięki za słuchawki @Andrew! – Daan