Załóżmy, że mam zagnieżdżonego słownika 'user_dict' o strukturze:Construct pandy DataFrame od pozycji w zagnieżdżonego słownika
Poziom 1: UserId (Long Integer)
Poziom 2: Kategoria (String)
Poziom 3 Różne atrybuty (pływaki, typu int itp ..)
Przykładowo wpis z tego słownika byłoby:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
każda pozycja w „user_dict” ma taką samą strukturę i „user_dict” zawiera dużą liczbę elementów, które chcę karmić do DataFrame pandy, konstruując serię przeprowadzoną atrybuty. W tym przypadku przydatny byłby indeks hierarchiczny.
W szczególności moje pytanie brzmi, czy istnieje sposób, aby pomóc konstruktorowi DataFrame zrozumieć, że seria powinna być zbudowana z wartości "poziomu 3" w słowniku?
Gdy próbuję coś takiego:
df = pandas.DataFrame(users_summary)
pozycje w „poziom 1” (identyfikator użytkownika) są brane jako kolumny, która jest przeciwieństwem tego, co chcę osiągnąć (mają identyfikator użytkownika jako indeks).
Wiem, że mógłbym skonstruować serię po iteracji nad słownikiem, ale jeśli istnieje bardziej bezpośredni sposób, byłoby to bardzo przydatne. Podobnym pytaniem byłoby pytanie, czy możliwe jest skonstruowanie pandas DataFrame z obiektów json wymienionych w pliku.
Czy istnieje rozsądny sposób uogólnienia tego, aby działał na dowolnie rozmieszczonych listach z głębiami? na przykład wyświetla się na dowolną głębokość, gdzie niektóre gałęzie mogą być krótsze od innych, a brak lub nan jest używany, gdy krótsze gałęzie nie osiągają końca? – naught101
Czy patrzyłeś na wsparcie pandy json (narzędzia io) i normalizacji? http://pandas.pydata.org/pandas-docs/dev/io.html#normalization –
Uratuj mi życie !!!!!!!!!! Naucz się dużo !! dziękuję – Wen