tag-soup

    5Ciepło

    1Odpowiedz

    Szukam dokumentacji (oficjalnie dokumentacja, jeśli jest to możliwe) dla bibliotek TagSoup i jTidy. Chcę używać tych bibliotek do manipulowania plikami html "tagsoup", które zawierają znaczniki xml z

    6Ciepło

    1Odpowiedz

    Wikipedia zawiera link (lewa strona na Drukuj/eksport) na każdym artykule, aby pobrać artykuł w formacie pdf. Napisałem mały skrypt Haskella, który najpierw dostaje link do Wikipedii i wyprowadza link

    6Ciepło

    1Odpowiedz

    Próbowałem dowiedzieć się, jak wyodrębnić dane z plików HTML w Haskell i uderzyłem o ścianę. Nie jestem w ogóle doświadczeniem z Haskellem, a moja poprzednia wiedza pochodzi z Pythona (i BeatifulSoup