Jaki jest najlepszy sposób uzyskania losowej próbki elementów z groupby
? Jak rozumiem, numer groupby
jest po prostu możliwy do sprawdzenia przez grupy.Pandy Pythona Wybieranie losowej próbki grup z Groupby
Standardowy sposób byłoby to zrobić dla iterable gdybym chciał wybrać N = 200
elementy to:
rand= random.sample(data, N)
Jeśli spróbujesz wyżej, gdzie dane jest „zgrupowane” elementy listy wynikowej są krotki z jakiegoś powodu.
Znalazłem poniższy przykład losowego wybierania elementów pojedynczego klucza groupby
, jednak nie działa to z kluczem uniwersalnym groupby
. Z, How to access pandas groupby dataframe by key
tworzyć GroupBy przedmiotu
grouped = df.groupby('some_key')
odbiorem N dataframes i chwytają za Wiadomości Finansowe
sampled_df_i = random.sample(grouped.indicies,N)
chwytak grupy
df_list = map(lambda df_i: grouped.get_group(df_i),sampled_df_i)
ewentualnie - włącz wszystkie powrotem pojedyncza ramka danych obj ect
sampled_df = pd.concat(df_list, axis=0, join='outer')
Bardzo dokładny. Dziękujemy za uwzględnienie przykładów z wieloma indeksami. – sfortney