Mam zestaw danych będzie brakujące dane, które wygląda tak:Pandy: Jak wypełnić wartości null ze średnią grupy?
id category value
1 A NaN
2 B NaN
3 A 10.5
4 C NaN
5 A 2.0
6 B 1.0
muszę wypełnić null korzystać z danych w modelu. Za każdym razem, gdy pojawia się kategoria po raz pierwszy, jest to NULL. Sposób, w jaki chcę to zrobić, dotyczy przypadków takich jak kategorie A
i B
, które mają więcej niż jedną wartość, zastępując wartości null średnią z tej kategorii. A dla kategorii C
tylko z jednym wystąpieniem wystarczy wpisać średnią pozostałych danych.
Wiem, że mogę to zrobić po prostu dla przypadków takich jak C
, aby uzyskać średnią wszystkich wierszy, ale utknąłem próbując zrobić kategorie dla A i B i zastępując wartości null.
df['value'] = df['value'].fillna(df['value'].mean())
muszę ostateczną df być jak ten
id category value
1 A 6.25
2 B 1.0
3 A 10.5
4 C 4.15
5 A 2.0
6 B 1.0
wielki! tego właśnie potrzebowałem. dzięki ! – sfactor
Podoba mi się twoja praca, to jest fajne – Axis