Czy istnieje narzędzie do znalezienia lokalizacji X-Y na treści tekstowej w pliku PDF?Jak znaleźć x, y lokalizację tekstu w pdf
Odpowiedz
Spróbuj uruchomić "Preflight ..." w Acrobat i wybierając PDF Analysis -> List page objects, grouped by type of object
.
Po zlokalizowaniu obiektów tekstowych na liście wyników zauważysz, że istnieje wartość pozycji (w punktach) w sekcji Text Properties -> * Font
.
Docotic.Pdf Library może to zrobić. Patrz C# próbki poniżej:
using (PdfDocument doc = new PdfDocument("your_pdf.pdf", "password_if_need"))
{
foreach (PdfTextData textData in doc.Pages[0].Canvas.GetTextData())
Console.WriteLine(textData.Position + " " + textData.Text);
}
TET, Toolkit ekstrakcji tekstu z rodziny produktów pdflib może to zrobić. TET ma interfejs wiersza poleceń i jest to najpotężniejszy ze wszystkich dostępnych narzędzi do ekstrakcji tekstu. (Może nawet obsługiwać ligatur ...)
Geometria
TET zapewnia precyzyjne dane dotyczące tekstu, takich jak miejsce na stronie, szerokościami glifów i kierunku tekstu. Określone obszary na stronie można wykluczyć lub włączyć do ekstrakcji tekstu, np. zignorować nagłówki i stopki lub marginesy.
- 1. znajdź lokalizację {x, y} tekstu w uilabel
- 2. Dziwactwo rubowe: x == y && [x, y] .uniq == [x, y]
- 3. x, y = getPos() vs. (x, y) = getPos()
- 4. Jak automatycznie znaleźć lokalizację użytkownika?
- 5. Jak zrobić pętlę nieskończoną z "x <= y && x > = y && x! = Y"?
- 6. Kombinacje trzech liczb dodatnich x, y, z tak, że x + y, x-y, y + z, y-z, x + z i x-z są idealnymi kwadratami
- 7. (x: y) operator Julia
- 8. Kiedy używać std :: hypot `(x, y)` `nad std :: sqrt (x * x + y * y)`
- 9. dla x w y(): jak to działa?
- 10. Jak porównać x i y w F #?
- 11. Dlaczego argumenty atan2 Y, X zamiast X, Y?
- 12. Jak znaleźć położenie kursora (X/Y, nie linia/kolumna) w obszarze tekstowym HTML?
- 13. jak znaleźć lokalizację biblioteki R w Mac OSX?
- 14. Jak znaleźć swoją aktualną lokalizację CoreLocation
- 15. Jak znaleźć pustą stronę w pliku pdf
- 16. Dlaczego javac nie akceptuje `x = x +++++ y`?
- 17. jak zaimplementować pow (podwójne x, podwójne y)?
- 18. Jak korzystać z matrix.preScale (x, y)
- 19. jak mapować punkty siatki 2d (x, y) na kuli jako punkty 3d (x, y, z)
- 20. Wykonywanie instrukcji if (x == y) w Brainfuck
- 21. Znajdź X/Y elementu HTML z JavaScript
- 22. Co oznacza pix [x, y] w Pythonie
- 23. Jaki jest odwrotna x = pow (y, 5)
- 24. Ustawienia UILabel x, y są skoordynowane programowo
- 25. chcę znaleźć lokalizację numeru w macierzy w Matlab
- 26. Jak znaleźć węzeł DOM w danej pozycji (X, Y)? (Hit test)
- 27. Dlaczego/Kiedy w Pythonie występuje `x == y` wywołanie` y .__ eq __ (x) `?
- 28. Jak zmienić pozycje osi X i Y w ggplot2
- 29. Kompresja `x jeśli x indziej y` oświadczenie w Pythonie
- 30. Jaka jest logika dla x, y = y, x aby zamienić wartości w Pythonie?
Czy można znaleźć pozycję x, y i wysokość, szerokość każdego słowa? – raki
@raki: Tam, gdzie jest pozycja, rozmiar jest tuż poniżej, ale to jest tylko dla bloku tekstowego, którym może być dowolny dowolny tekst. Aby uzyskać indywidualne rozmiary słów, należy obliczyć metryki czcionek. Jaki jest cel tego, co robisz, może być lepsze podejście. – Orbling