Używam parsera HTML o nazwie Jsoup, do ładowania i parsowania plików HTML. Problem polega na tym, że strona, którą skrobię, jest zakodowana w zestawie znaków ISO-8859-1
, podczas gdy Android używa kodowania UTF-8
(?). Powoduje to pojawienie się niektórych znaków jako znaków zapytania.Jak przekonwertować ciąg znaków na kodowanie UTF-8 w systemie Android?
Więc teraz powinienem przekonwertować ciąg na format UTF-8.
Teraz znalazłem tę klasę o nazwie CharsetEncoder w pakiecie Android SDK, co może mi pomóc. Ale nie mogę wymyślić, jak go wdrożyć w praktyce, więc zastanawiam się, czy można uzyskać pomoc z praktycznym przykładem.
UPDATE: Kod do odczytu danych (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
mógłbyś pisać kod używany do odczytania dokumentu HTML? – yanchenko
OK, zaktualizowałem swój post. – droidgren