Czy istnieje sposób, aby jsoup wyczyścił ciąg znaków przy użyciu kodu HTML, uciekając przed niepożądanym kodem HTML zamiast go całkowicie usunąć? Mój przykład:Jsoup - Howto clean html przez ucieczkę, nie usuwając niechcianego html?
String dirty = "This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
String clean = Jsoup.clean(dirty, new Whitelist().addTags("a").addAttributes("a", "href", "name", "rel", "target"));
To daje "czysty" ciąg:
This is REALLY dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
Co ja chcąc jest "czysty" łańcuch być:
"This is <b>REALLY</b> dirty code from <a href="www.rubbish.url.zzzz">haxors-r-us</a>
Niezły. Nie, Jsoup go nie obsługuje. Możesz wysłać wiadomość o funkcji na stronie https://github.com/jhy/jsoup/issues, aby dodać nową metodę do interfejsu API "Biała lista", która może spowodować usunięcie kodu HTML do przechodzenia HTML. – BalusC
Wysłano żądanie funkcji: https://github.com/jhy/jsoup/issues/515 –