Dziewięć lat temu, kiedy zacząłem parsować HTML i darmowy tekst za pomocą Perla, czytałem klasyczny Data Munging with Perl. Czy ktoś wie, czy David zamierza zaktualizować książkę, czy też istnieją podobne książki lub strony internetowe, na których wyjaśnione są nowe moduły analizowania, takie jak: XML-Twig, Regexp-Grammars itd.?Które moduły Perla są dobre do zmieniania danych?
Zakładam, że w ciągu ostatnich dziewięciu lat niektóre moduły nadal są tak dobre, jak były, niektóre są aktualne, ale z nowymi, ciekawymi metodami, a niektóre z lepszymi zamiennikami. Na przykład, czy nadal jest dostępna Parse-RecDescent jedyna opcja do darmowego analizowania tekstu lub czy Perl 6 wpłynie na jej zmianę w wielu scenariuszach?
Mam cztery lata bez aktywnego HTML, XML lub darmowego wyszukiwania danych tekstowych w Perlu, więc prawdopodobnie mój zestaw narzędzi w tym obszarze jest nieco przestarzały. Dlatego wszelkie opinie na temat manipulacji HTML i DOM, ekstrakcji linków/weryfikacji linków, testowania stron internetowych, takich jak Mechanize, manipulowanie XML i analiza tekstu, od osób, które są na bieżąco z aktualnymi modułami CPAN w tym obszarze, będą mile widziane.
Niektóre nowe dodatki do mojego zestawu narzędzi:
nadal w moim zestawie narzędzi: nie
- HTML-TableExtract # aktualizowane od 2006
- WWW-Mechanize
- Parse-RecDescent
- HTML-TokeParser
- URI-Escape
- [więcej ...]
Niektóre specyfiki mogły ulec zmianie, ale pojęcia są takie same. :) –
Dave, byłoby miło przeczytać te recenzje i przepisy na twoim blogu. –
Tak, byłbym BARDZO zainteresowany czytaniem tego postu. Jeśli w końcu publikujesz dodatkowe aktualizacje na swoim blogu, to będzie super. Twoje zdrowie! – blunders