2009-02-28 13 views

Odpowiedz

13

Przykłady i przykładowy kod na stronie Apache są całkiem dobre. Polecam zacząć tam.

http://poi.apache.org/hwpf/quick-guide.html

Aby uzyskać konkretne fragmenty tekstu, najpierw utworzyć org.apache.poi.hwpf.HWPFDocument. Pobierz zakres za pomocą getRange(), a następnie pobierz z niego akapity. Możesz wtedy uzyskać tekst i inne właściwości.

Here dla przykładu wyodrębnienia obrazu. Here w celu uzyskania najnowszej wersji od tego momentu.

I oczywiście Javadocs

pamiętać, że w zależności od miejsca POI

HWPF jest wciąż na wczesnym etapie rozwoju.

1

To nie jest za darmo (lub nawet tanie!), Ale Aspose.Words powinien być w stanie to zrobić. Pobieranie ich ocen pozwoli ci grać małymi plikami.

Czy pliki docelowe również muszą być dokumentami? Możesz otworzyć dokumenty w pakiecie Office i zapisać je jako HTML. Wtedy rozdzielenie staje się trywialne. RTF jest również opłacalną opcją, ale nie mogę polecić dobrego parsera RTF z mojej głowy.

Edit powiedzieć: Właśnie sobie przypomniałem Innym możliwym rozwiązaniem: Jacob, ale trzeba instancję Urząd działa na tej samej maszynie. Jest to skrót od Java COM Bridge i umożliwia wykonywanie połączeń do bibliotek COM w pakiecie Office w celu manipulowania dokumentami. Jestem pewien, że to nie jest tak straszne, jak mogłoby się wydawać!

Powiązane problemy