pdf-scraping

    5Ciepło

    2Odpowiedz

    Próbuję wyodrębnić dane z tabel w niektórych raportach pdf. Widziałem kilka przykładów przy użyciu albo pdftools i podobnych pakietów Udało mi się uzyskać tekst, ale po prostu chcę wyodrębnić tabele.

    49Ciepło

    5Odpowiedz

    Czy to nawet możliwe!?! Mam kilka starszych raportów, które muszę zaimportować do bazy danych. Jednak wszystkie są w formacie pdf. Czy są jakieś pakiety R, które mogą odczytać pdf? Czy powinienem zost

    25Ciepło

    3Odpowiedz

    Czy istnieją biblioteki open source, które obsługują identyfikację tabeli & ekstrakcji? przez to znaczy: zidentyfikować struktury tabeli istnieje klasyfikować tabeli z jego zawartością pobiera dane z