Hej, od jakiegoś czasu szukam przeglądarki plików pdf dla linii poleceń.Przeglądarka CLI pdf dla linux
Ponieważ lubię pracować bez X na Linuksie i często pracuję na zdalnym komputerze, chciałbym mieć narzędzie do czytania plików pdf. Istnieje wiele naprawdę dobrych programów graficznych (evince, okular, acroread, ...) do wykonania zadania, więc pomyślałem, że powinno być przynajmniej jedno przyzwoite narzędzie w trybie tekstowym. Ale nie wiem nawet o bzdurnym!
Obecnie albo uruchamiam X tylko po to, aby przeczytać pdf, albo użyć pdftohtml + lynx. Jednak ten ostatni nie daje bardzo dobrego wyniku, a większość dokumentów jest po prostu nieczytelna, szczególnie jeśli zawierają wzór matematyczny.
Google jest pełne ludzi, którzy twierdzą, że nie jest to możliwe lub sugeruje wersję pdftohtml.
Zdaję sobie sprawę, że nie jest to dokładnie kwestia programowania, ale obecnie rozważam rozpoczęcie projektu wdrożenia takiego programu, chyba że jest już dobry.
Dzięki za wszelkie sugestie.
Jak obsługiwać pliki PDF które są zbudowane ze źródła obrazu (bez tekstu), co jest zbyt częste? –
Niektóre pliki PDF są konwertowane na zły tekst !, albo tylko kształty, albo wynik OCR, który jest ukryty nad obrazem źródłowym tylko ze względu na wybór. Które nigdy nie można przekonwertować na dobry tekst! Jak uważasz, że należy to zrobić? –
@ 0xA3: Cóż, istnieją biblioteki zdolne do renderowania grafiki na konsolę - libcaca i aalib. Możliwe jest nawet oglądanie filmów w ascii art. Nie słyszałem jednak o podobnej przeglądarce plików PDF. Możliwe jest również renderowanie obrazów do framebuffera przy użyciu svgalib. Nie słyszałem jednak o przeglądarce CLI pdf. Oczywiście można to zrobić, ale nie jestem pewien, czy ktoś rzeczywiście to robił. Aha, z libcaca/aalib "grafika" pdf będzie ledwie czytelna. – SigTerm