Java Pdf Biblioteka Diff

Czy ktoś wie o bibliotece Java o otwartym kodzie źródłowym, która wykona rozbudowane porównanie części tekstowych plików pdf?Java Pdf Biblioteka Diff

Idealnie chciałbym coś, co dałoby różnicę w postaci łatki.

Źródło

2009-05-20 mac

Być może potrafisz wyjaśnić swoje oczekiwania. Istnieje wiele sposobów tworzenia dwóch różnych plików PDF, które wyglądają dokładnie tak samo. Pamiętaj też, że pliki PDF nie muszą zawierać tekstu do wyszukania. –

Wyodrębnij tekst w formacie pdf za pomocą http://incubator.apache.org/pdfbox/ i utwórz różnicę za pomocą http://code.google.com/p/google-diff-match-patch.

Źródło

2009-05-20 11:25:03 trunkc

Jeśli pliki PDF różnią się tylko tekstem, można również zrasteryzować strony, a następnie spojrzeć na różnice w ten sposób - używamy tego do wyników testów regresji na naszym kodzie PDF.

Źródło

2009-05-21 06:49:44

Czy są jakieś biblioteki lub kod do rasteryzacji pliku PDF? Również przy rasteryzacji, wynik zawsze będzie taki sam pod względem skrótu MD5/SHA1? Czy będziecie musieli go rozróżnić za pomocą rozmytego narzędzia porównywania, takiego jak Sikuli itp.? – David

Po prostu zauważyłem, że Apache PDFBox może rasteryzować PDF na obrazy według stron. – David

Możesz obejrzeć Xdiffweb.com. Jest to projekt open source oparty na apache pdfbox.

Źródło

2018-02-28 09:57:35 lumpchen

Dzięki. Wygląda na to, że aplikacja jest wyłączona. – mac

Java Pdf Biblioteka Diff

Odpowiedz

Powiązane problemy