Przyjrzałem się Sklearn stratified sampling docs, a także pandas docs, a także Stratified samples from Pandas i sklearn stratified sampling based on a column, ale nie rozwiązują tego problemu.Próbkowanie warstwowe w pandach
Poszukuję szybkiego sposobu pandy/sklearn/numpy, aby wygenerować stratyfikowane próbki o rozmiarze n z zestawu danych. Jednak w przypadku wierszy o numerze mniejszym niż określony numer próbki powinien on zawierać wszystkie wpisy.
konkretny przykład:
Dziękujemy! :)
To genialne rozwiązanie, dziękuję! :) – Wboy
@Wboy Cieszę się, że Ci się podoba. – piRSquared