Próbuję wyodrębnić tekst z plików pdf, a następnie spróbować zidentyfikować odniesienia. Używam pdfminer 20140328. Z plików niezaszyfrowanych jego działa dobrze, ale mam teraz plik gdzie uzyskać: File
Ponieważ chcę przenieść z Pythona 2 do 3, starałem się pracować z pdfmine.3kr w Pythonie 3.4. Wygląda na to, że wszystko edytowali. Ich dzienniki zmian nie odzwierciedlają zmian, które zrobiły, ale ni
Python w wersji 2.7 szukam dokumentacji lub przykładów, w jaki sposób wyodrębnić tekst z pliku PDF za pomocą PDFMiner z Pythona. Wygląda na to, że PDFMiner zaktualizował swoje API, a wszystkie znalezi