Szukam dokumentacji (oficjalnie dokumentacja, jeśli jest to możliwe) dla bibliotek TagSoup i jTidy. Chcę używać tych bibliotek do manipulowania plikami html "tagsoup", które zawierają znaczniki xml z
Wikipedia zawiera link (lewa strona na Drukuj/eksport) na każdym artykule, aby pobrać artykuł w formacie pdf. Napisałem mały skrypt Haskella, który najpierw dostaje link do Wikipedii i wyprowadza link
Próbowałem dowiedzieć się, jak wyodrębnić dane z plików HTML w Haskell i uderzyłem o ścianę. Nie jestem w ogóle doświadczeniem z Haskellem, a moja poprzednia wiedza pochodzi z Pythona (i BeatifulSoup