używam Boilerpipe wyodrębnić tekst z adresem URL, używając tego kodu:Extract HTML z URL
URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);
text
String zawiera tylko tekst strony html, ale trzeba wyodrębnić do całego kodu html z tego.
Czy jest ktoś, kto użył tej biblioteki i wie, jak wyodrębnić kod HTML? Aby uzyskać więcej informacji o bibliotece, można sprawdzić numer demo page.
sun.net.www.protocol.http.HttpURLConnection $ HttpInputStream nie mogą być oddane do java.lang.String –
@dotNet : Przepraszam, to było mylące. Poprawiłem moją odpowiedź. –