pQuery jest pragmatycznym portem skryptu JavaScript jQuery do Perla, który może być używany do skriningu ekranu.Jak sprawić, aby program pQuery działał z lekko zniekształconym HTML?
pQuery dość wrażliwy na zniekształcony HTML. Rozważmy następujący przykład:
use pQuery;
my $html_malformed = "<html><head><title>foo</title></head><body>bar</body></html>>";
my $page = pQuery($html_malformed);
my $title = $page->find("title");
print "The title is: ", $title->html, "\n";
pQuery nie znajdziemy tagu tytułu w powyższym przykładzie z powodu podwójnego „>>
” w zniekształconych HTML.
Aby moje aplikacje oparte na pQuery były bardziej odporne na zniekształcony kod HTML, muszę wstępnie przetworzyć kod HTML, czyszcząc go przed przekazaniem do pQuery.
Poczynając od fragmentu kodu podanego powyżej, jaki jest najsolidniejszy sposób czyszczenia w czystym kodzie HTML, aby był analizowany: w stanie przez pQuery?
Przepraszam, ale potrzebuję roztworu czystego perla. Zostało to wyjaśnione w pytaniu. Dziękuję za odpowiedź! :-) – knorv