Używam JSoup do analizowania treści z http://www.latijnengrieks.com/vertaling.php?id=5368. jest to strona trzecia i nie określa właściwego kodowania. Używam następujący kod do załadowania danych:JSoup kodowanie znaków problemu
public class Loader {
public static void main(String[] args){
String url = "http://www.latijnengrieks.com/vertaling.php?id=5368";
Document doc;
try {
doc = Jsoup.connect(url).timeout(5000).get();
Element content = doc.select("div.kader").first();
Element contenttableElement = content.getElementsByClass("kopje").first().parent().parent();
String contenttext = content.html();
String tabletext = contenttableElement.html();
contenttext = Jsoup.parse(contenttext).text();
contenttext = contenttext.replace("br2n", "\n");
tabletext = Jsoup.parse(tabletext.replaceAll("(?i)<br[^>]*>", "br2n")).text();
tabletext = tabletext.replace("br2n", "\n");
String text = contenttext.substring(tabletext.length(), contenttext.length());
System.out.println(text);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
To daje następujące wyniki:
Aeneas dwaalt rond in Troje en zoekt Cre?sa. Cre?sa is echter op de vlucht gestorven Plotseling verschijnt er een schim. Het is de schim van Cre?sa. De schim zegt:'De oorlog woedt!' Troje is ingenomen! Cre?sa is gestorven:'Vlucht!' Aeneas vlucht echter niet. Dan spreekt de schim:'Vlucht! Er staat jou een nieuw vaderland en een nieuw koninkrijk te wachten.' Dan pas gehoorzaamt Aeneas en vlucht.
jest tam jakikolwiek sposób? Znaki mogą być ponownie oryginalne (ü) na wyjściu?
Jsoup można analizowania poprawnie. Jak wizualizujesz wyjście? W oknie konsoli? Tekst zapisany w pliku? –
końcowy wynik będzie w android TextView, ale to okno konsoli, a android logcat dał takie same wyniki. – Hihaatje
Balus ma twoją odpowiedź. –