Próbowałem odciąć niektóre dane z plików HTML. Mam kodowanie logiczne, aby uzyskać właściwe komórki. Teraz walczę, aby uzyskać rzeczywiste zawartości 'komórki':Jak uzyskać tekst z "datacell" HTML przy użyciu BeautifulSoup
tutaj jest mój htm wycinek
headerRows [0] [10] .contents
[<font size="+0"><font face="serif" size="1"><b>Apples Produced</b><font size="3">
</font></font></font>]
Należy pamiętać, że jest to lista element z Python [].
Potrzebuję wartości wyprodukowanych jabłek, ale nie mogę się do niej dostać.
Wszelkie sugestie będą mile widziane
sugestie na dobrą książką, która wyjaśnia to by zarobić Moją wieczną wdzięczność
Dziękuję za tę odpowiedź. Jednak nie ma bardziej ogólnej odpowiedzi. Co się stanie, jeśli moja komórka nie posiada atrybut pogrubienia
powiedzieć, że jest:
[<font size="+0"><font face="serif" size="1"><I>Apples Produced</I><font size="3">
</font></font></font>]
Jabłka Produkowane
Próbuję nauczyć się czytać/rozumieć dokumentację i swoje Odpowiedź pomoże
Naprawdę doceniam tę pomoc. Najlepszą rzeczą w tych odpowiedziach jest to, że łatwiej jest je uogólnić, a następnie udało mi się to zrobić z dokumentacji BeautifulSoup. Nauczyłem się programować w erze Fortranu, a ja czerpię przyjemność z uczenia się Pythona i jestem amzowany jego mocą - BeautifulSoup jest przykładem. tworzenie spójnej całości dokumentacji jest dla mnie trudne.
Cheers