Mam ramkę danych z wartościami powtórzeń w kolumnie A. Chcę usunąć duplikaty, zachowując wiersz o najwyższej wartości w kolumnie B.python pandy: Usuń duplikaty według kolumn A, zachowując wiersz o najwyższej wartości w kolumnie B
Więc tak:
A B
1 10
1 20
2 30
2 40
3 10
powinien przekształcić się w ten sposób:
A B
1 20
2 40
3 10
Wes dodał kilka ciekawych funkcjonalności do spadku duplikaty: http://wesmckinney.com/blog/?p=340. Ale AFAICT, jest przeznaczony do dokładnych duplikatów, więc nie ma żadnej wzmianki o kryteriach wyboru, które wiersze zostaną zachowane.
Zgaduję, że prawdopodobnie jest to prosty sposób - może tak łatwo jak sortowanie ramek danych przed upuszczeniem duplikatów --- ale nie znam wewnętrznej logiki groupby na tyle dobrze, aby to zrozumieć. Jakieś sugestie?
Należy pamiętać, że adres URL w pytaniu pojawia EOL. – DaveL17
Dla idiomatycznego i wydajnego sposobu, [zobacz to rozwiązanie poniżej] (https://stackoverflow.com/a/41650846/3707607). –