tag-soup

5Ciepło

1Odpowiedz

Szukam dokumentacji (oficjalnie dokumentacja, jeśli jest to możliwe) dla bibliotek TagSoup i jTidy. Chcę używać tych bibliotek do manipulowania plikami html "tagsoup", które zawierają znaczniki xml z

6Ciepło

1Odpowiedz

Pobierz plik pdf z wikipedia

Wikipedia zawiera link (lewa strona na Drukuj/eksport) na każdym artykule, aby pobrać artykuł w formacie pdf. Napisałem mały skrypt Haskella, który najpierw dostaje link do Wikipedii i wyprowadza link

6Ciepło

1Odpowiedz

Analizowanie znaczników za pomocą TagSoup w Haskell

Próbowałem dowiedzieć się, jak wyodrębnić dane z plików HTML w Haskell i uderzyłem o ścianę. Nie jestem w ogóle doświadczeniem z Haskellem, a moja poprzednia wiedza pochodzi z Pythona (i BeatifulSoup