Obecnie pracuję nad konwersją kodów HTML na równoważne znaki w java. Konwertuj poniższy kod na znaki.Zamień kody HTML odpowiednimi znakami w Javie
è - è
® - ®
& - &
ñ - ñ
& - &
Próbowałem za pomocą wzoru regex
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Kiedy debugowanie, matcher.find()
daje mi true
ale kontrola pomija pętlę gdzie ja napisałem kod konwersji. Nie wiem, co się tam dzieje.
Czy istnieje również sposób na zoptymalizowanie tego wyrażenia regularnego?
Każda pomoc jest doceniana.
Wyjątek
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
Jest już odpowiedź :). [Zalecana metoda wychodzenia z HTML w Javie] (http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java) –