Jestem nowy w Pythonie i Beatiful Soup też! Słyszałem o BS. Mówi się, że jest doskonałym narzędziem do analizowania i wydobywania treści. Więc tutaj jestem ...:Piękna zupa [Python] i ekstrakcja tekstu w tabeli
Chcę wziąć zawartość pierwszego td tabeli w dokumencie html . Na przykład: Mam tę tabelę:
Jak mogę użyć beautifulsoup do pobrania tekstu "To jest przykładowy tekst"? Używam soup.findAll ('table', attrs = {'class': 'bp_ergebnis_tab_info'}), aby uzyskać całą tabelę.
Dzięki ... czy powinienem spróbować zdobyć całość z Perlem ... o czym nie jestem zaznajomiony. Kolejnym rozwiązaniem będzie regex w PHP.
Patrz cel [1]: http://www.schulministerium.nrw.de/BP/SchuleSuchen?action=799.601437941842&SchulAdresseMapDO=142323
Uwagi; ponieważ html jest nieco nieważny - myślę, że musimy trochę wyczyścić. To może spowodować wiele kodu PHP - ponieważ chcemy rozwiązać zadanie w PHP. Perl również byłby dobrym rozwiązaniem.
Dziękujemy za kilka wskazówek i pomysłów na punkt wyjścia zerowy
Cóż, najwyraźniej nie udało Ci się uzyskać wiele z pytań na temat Perla, więc nie jestem nawet pewien, dlaczego to pytanie jest oznaczone jako Perl. Ponadto nie twórz nowych kont co kilka tygodni: stwórz nowe i pozostań przy nim. @ Zero wie, o czym mówię. Inni mogą przyjrzeć się http: // stackoverflow.com/users/477580/thebutcher i http://stackoverflow.com/q/3991571/100754 oraz powiązane z tym pytania. –