Uczę się Python i BeautifulSoup, aby skrobać dane z sieci i czytać tabelę HTML. Mogę go przeczytać w Open Office i mówi, że jest to Tabela nr 11.Jak uzyskać wszystkie wiersze z określonej tabeli przy użyciu BeautifulSoup?
Wydaje się BeautifulSoup jest preferowanym wyborem, ale może ktoś mi powiedzieć jak chwycić konkretnej tabeli i wszystkie wiersze? Przyjrzałem się dokumentacji modułu, ale nie mogę się z tym pogodzić. Wiele przykładów, które znalazłem w Internecie wydaje się robić więcej, niż potrzebuję.
To była podstęp! Kod zadziałał i powinienem móc go zmodyfikować w razie potrzeby. Wielkie dzięki. Ostatnie pytanie. Mogę postępować zgodnie z kodem, z wyjątkiem sytuacji, gdy przeszukujesz stół dla dzieci, które mają tr. Czy to po prostu przeszukuje mój stół i zwraca zarówno wiersze nagłówka, jak i tabeli? Gdybym tylko chciał wierszy tabeli, po prostu mógłbym szukać tylko tr? wielkie dzięki jeszcze raz! – Btibert3
Tak, '.findChildren (['th', 'tr'])) szuka elementów z typem znacznika' th' lub 'tr'. Jeśli chcesz po prostu znaleźć elementy "tr", użyjesz '.findChildren ('tr')' (nie notuj listy, tylko ciąg) –
Warto również zauważyć, że [PyQuery] (https://pythonhosted.org /pyquery/api.html) jest naprawdę świetną alternatywą dla BeautifulSoup. –