<node> test
test
test
</node>
chcę mój parsera XML odczytać znaki <node>
oraz:Usuwanie duplikatów nowe linie/tabs/białe znaki w postaci elementu XML
- zastąpić newlines i spacje i komponować wielokrotne spacje w jedną. W rezultacie tekst powinien wyglądać podobnie do "testu testu testowego".
- Jeśli węzeł zawiera znaki zakodowane w XML: tabulatory (
	
), znaki nowej linii (

) lub białe znaki (
) - należy je pozostawić.
Próbuję kod poniżej, ale zachowuje duplikaty białych znaków.
dbf = DocumentBuilderFactory.newInstance();
dbf.setIgnoringComments(true);
dbf.setNamespaceAware(namespaceAware);
db = dbf.newDocumentBuilder();
doc = db.parse(inputStream);
Czy jest jakiś sposób, aby zrobić to, co chcę?
Dzięki!
spróbuj dodać ten wiersz 'dbf.setIgnoringElementContentWhitespace (true);' – deanosaur
Niestety, to nie działa. Ta właściwość kontroluje sposób postępowania z białymi przestrzeniami w elementach innych niż tekstowe – dbahdano