Potrzebuję renderować lub pobierać wszystkie obrazy z określonego pliku PDF. Jak mogę to osiągnąć za pomocą Ghostscript lub ImageMagick?Jak wyodrębnić obrazy z plików PDF za pomocą Ghostscript lub ImageMagick?
Odpowiedz
Z pewnością nie można tego zrobić w Ghostscript, bez kodowania się urządzeniem Ghostscript.
Wątpię, czy możesz to zrobić również za pomocą ImageMagick.
Czy spojrzałeś na PDFtk?
Jeśli jesteś na systemie Windows, a następnie szybkie Google zamienia się:
http://www.somepdf.com/some-pdf-image-extract.html
oraz na systemie Linux:
https://askubuntu.com/questions/150100/extracting-images-from-a-pdf
nie można zrobić go z Ghostscript, ale można to zrobić za pomocą narzędzi wiersza Poppler lub XPDF o nazwie pdfimages
:
pdfimages -j some.pdf subdir/image-prefix
Wszystkie obrazy będą teraz znajdować się w subdir/
nazwie image-prefix-0001.jpg
, image-prefix-0002.jpg
...
Parametr -j
uczyni polecenia spróbować bezpośrednio wyodrębnić JPEG. Niezastosowanie się do tworzenia JPEG, stworzy PNMs lub PPMS, który zawsze można konwertować za pomocą ImageMagick:
convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg
Chcę zrobić coś podobnego, ale chcę całkowicie usunąć wszystkie obrazy z pliku pdf, to znaczy plik PDF powinien zawierać tylko tekst/czcionkę, ale bez obrazów, czy można to zrobić? pls pomoc. – codin
@codin: Komentarze nie są przeznaczone do omawiania zupełnie nowego tematu. Zadaj nowe pytanie, oznacz to jako '[ghostscript]' + '[pdf]', a ja postaram się odpowiedzieć na nie najlepiej jak potrafię. Proszę również podać, jaki jest cel twojego wniosku. Oszczędzasz na filesize? Usunąć informacje zawarte w obrazach? Lub? –
przykład wydobywania 1 strona:
gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf
To nie wyodrębnia oryginalnych obrazów. Wykonuje obraz oparty na wyglądzie strony. Na przykład, jeśli na obrazie zostanie nałożony tekst, dostaniesz go również w renderowanym obrazie. – mlissner
- 1. ImageMagick lub GhostScript: przekonwertuj wielostronicowy TIFF na wielostronicowy PDF
- 2. Hasło chronione PDF za pomocą Ghostscript
- 3. łączenie plików pdf z ghostscript, jak dołączyć oryginalne nazwy plików?
- 4. Jak wyodrębnić obrazy z pliku PDF za pomocą biblioteki poppler w Pythonie?
- 5. Jak wyodrębnić obrazy i tekst w kolejności z pliku PDF za pomocą iText na Androida
- 6. Jak wyodrębnić obrazy z wideo?
- 7. Wyodrębnij tekst i obrazy z pliku PDF za pomocą iText5
- 8. ImageMagick za pomocą więcej niż 2 GB pamięci do konwersji plików PDF
- 9. Jak ustawić niestandardowy rozmiar strony za pomocą Ghostscript
- 10. Ghostscript Multipage PDF to PNG
- 11. Konwertowanie pliku PDF na serię obrazów za pomocą Pythona
- 12. Tworzenie plików PDF za pomocą django (wkhtmltopdf)
- 13. Generowanie plików PDF za pomocą PHP
- 14. Jak przesunąć obrazy strony w plikach PDF bardziej w lewo lub w prawo?
- 15. Konwersja plików PDF na JPG w wysokiej jakości za pomocą PHP i ImageMagick
- 16. Konwersja SVG na PDF za pomocą ImageMagick przy użyciu niezawodnego doboru czcionek?
- 17. Jak przyciąć animowany gif za pomocą ImageMagick?
- 18. Imagemagick przekonwertować wiele obrazów do rozmiaru pdf
- 19. Przepis na tworzenie plików Windows ICO za pomocą ImageMagick?
- 20. Jak pixelować/rozmazać obraz za pomocą ImageMagick?
- 21. ImageMagick PDF do JPG czasami skutkuje czarnym tle
- 22. Wyodrębnij obraz z pliku PDF za pomocą .Net C#
- 23. Jak wydrukować plik PDF na domyślnej drukarce sieciowej za pomocą polecenia powłoki GhostScript (gswin32c.exe)
- 24. Uzyskaj lub oblicz entropię obrazu za pomocą Ruby i imagemagick
- 25. PHP: Określ wizualnie uszkodzone obrazy (jeszcze ważne) pobrane za pomocą Curl z GD/Imagemagick
- 26. Jak scalać obrazy w płótno za pomocą PIL/Pillow?
- 27. Zmiana koloru obrazu za pomocą imagemagick
- 28. Jak wyodrębnić słowa za pomocą dopasowywania wzorców?
- 29. Jak wyodrębnić tekst podrzędny za pomocą Nokogiri?
- 30. Strony Ghostscript obracają się
powodem chcę używać GS lub obrazu magia że używają skryptu, który mogę uruchomić przez Javę, czy polecasz jakieś narzędzie PDF, które używa poleceń wiersza poleceń lub skryptów, aby to osiągnąć? – user1283633
Niestety, nie ...... – KenS
pdftk może wyodrębnić załączniki, ale nie wydaje się wyodrębniać obrazów. – bonh