Chcę replikować wiersze w ramce danych Pandas. Każdy wiersz należy powtórzyć n razy, gdzie n jest polem w każdym rzędzie.Replikowanie wierszy w ramce danych pandy według wartości kolumny
import pandas as pd
what_i_have = pd.DataFrame(data={
'id': ['A', 'B', 'C'],
'n' : [ 1, 2, 3],
'v' : [ 10, 13, 8]
})
what_i_want = pd.DataFrame(data={
'id': ['A', 'B', 'B', 'C', 'C', 'C'],
'v' : [ 10, 13, 13, 8, 8, 8]
})
Czy to możliwe?
Czy jest jakiś powód, aby to zrobić? Myślę, że najlepiej jest unikać powielania danych. – greole
Cóż, jest to etap pośredni - generuję kolumnę "v" zgodnie z rozkładem prawdopodobieństwa, a następnie dodaję kolejną kolumnę, losowo wybierając wiersze z innego zestawu danych. –
Nadal nie widzę powodu, aby nie robić tego bezpośrednio. Ale potrzebowałbym więcej informacji na temat tego, co faktycznie próbujesz osiągnąć. – greole