uzyskać wszystkie html jako ciąg z HTMLDocument

Im kodowania w Javie ..uzyskać wszystkie html jako ciąg z HTMLDocument

Czy ktoś wie jak mogę uzyskać zawartość javax.swing.text.html.HTMLDocument jako ciąg? To, co mam do tej pory ...

URL url = new URL("http://www.test.com"); 

HTMLEditorKit kit = new HTMLEditorKit(); 
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument(); 
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE); 
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream()); 
kit.read(HTMLReader, doc, 0);

Potrzebuję zawartość dokumentu HTML jako ciąg.

przykład:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">

....... itp

pomoc byłaby cenione. Muszę użyć klasy HTMLDocument w celu html zostać przetworzone poprawnie :)

Thanks Daniel

Źródło

2012-05-06 Zelleriation

StringWriter writer = new StringWriter(); 
kit.write(writer, doc, 0, doc.getLength()); 
String s = writer.toString();

Źródło

2012-05-06 16:25:24

Dzięki! Kod Joopa Eggensa poradził sobie! – Zelleriation

Nie trzeba edytor i czytnika w ogóle - po prostu czytać strumienia wejściowego. Na przykład, w świetlicy-IO IOUtils.toString(inputStream)

lub można użyć:

Content content = document.getContent(); 
String str = content.getString(0, content.length() - 1);

Źródło

2012-05-06 16:26:04 Bozho

To nie zadziała, ponieważ dziedziczona metoda [getContent] (http://docs.oracle.com/javase/7/docs/api/javax/swing/text/AbstractDocument.html#getContent%28%29) jest chroniona . – vallismortis

uzyskać wszystkie html jako ciąg z HTMLDocument

Odpowiedz

Powiązane problemy