XML do pand dataframe

Mam plik XML z tysiącami linie jak:XML do pand dataframe

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>

chcę przekonwertować go (wszystkich jego atrybutów) do pandasdataframe. W tym celu mógłbym przejrzeć plik za pomocą pięknej zupy i wstawić wartości wiersz po wierszu lub utworzyć listy, które mają zostać wstawione jako kolumny. Chciałbym jednak wiedzieć, czy istnieje bardziej pytonowy sposób spełnienia tego, co opisałem. Z góry dziękuję.

przykładem Kod:

x1list=[] 
x2list=[] 

for word in soup.page.findAll('word'): 
    x1list.append(int(word['x1'])) 
    x2list.append(int(word['x2'])) 
df=DataFrame({'x1':x1list,'x2':x2list})

Źródło

2012-06-08 root

Pokaż nam swój kod. – eumiro

@eumiro: dodano przykład kodu ... – root

Spróbuj tego:

DataFrame.from_records([(int(word['x1']), int(word['x2'])) 
         for word in soup.page.findAll('word')], 
         columns=('x1', 'x2'))

Źródło

2012-06-08 12:09:32 eumiro

Dzięki. Spróbuję. – root

XML do pand dataframe

Odpowiedz

Powiązane problemy