2009-08-03 17 views

Odpowiedz

36
+2

Ten link już nie działa. Klasę można znaleźć tutaj: http://commons.apache.org/proper/commons-lang/javadocs/api-3.1/org/apache/commons/lang3/StringEscapeUtils.html, a zawierający ją projekt znajduje się tutaj http: // commons.apache.org/proper/commons-lang/ – Jakub

+0

@Jakub Dzięki. Zaktualizowano wpis nowszym adresem URL. – Amber

3

To jest zwykle nazywany "HTML ucieczki". Nie jestem świadomy czegokolwiek w standardowych bibliotekach, aby to zrobić (chociaż możesz to zobrazować za pomocą ucieczki XML). Istnieje jednak wiele niezależnych bibliotek, które mogą to zrobić. StringEscapeUtils z org.apache.commons.lang ma metodę escapeHtml, która może to zrobić.

2
public static String stringToHTMLString(String string) { 
    StringBuffer sb = new StringBuffer(string.length()); 
    // true if last char was blank 
    boolean lastWasBlankChar = false; 
    int len = string.length(); 
    char c; 

    for (int i = 0; i < len; i++) 
     { 
     c = string.charAt(i); 
     if (c == ' ') { 
      // blank gets extra work, 
      // this solves the problem you get if you replace all 
      // blanks with &nbsp;, if you do that you loss 
      // word breaking 
      if (lastWasBlankChar) { 
       lastWasBlankChar = false; 
       sb.append("&nbsp;"); 
       } 
      else { 
       lastWasBlankChar = true; 
       sb.append(' '); 
       } 
      } 
     else { 
      lastWasBlankChar = false; 
      // 
      // HTML Special Chars 
      if (c == '"') 
       sb.append("&quot;"); 
      else if (c == '&') 
       sb.append("&amp;"); 
      else if (c == '<') 
       sb.append("&lt;"); 
      else if (c == '>') 
       sb.append("&gt;"); 
      else if (c == '\n') 
       // Handle Newline 
       sb.append("&lt;br/&gt;"); 
      else { 
       int ci = 0xffff & c; 
       if (ci < 160) 
        // nothing special only 7 Bit 
        sb.append(c); 
       else { 
        // Not 7 Bit use the unicode system 
        sb.append("&#"); 
        sb.append(new Integer(ci).toString()); 
        sb.append(';'); 
        } 
       } 
      } 
     } 
    return sb.toString(); 
} 
+0

Dodatkowe znaki Unicode są zakodowane jako 2 znaki w łańcuchu, co nie spowoduje poprawnego renderowania. Aby wesprzeć Unicode, naprawdę musisz radzić sobie z punktami kodowymi, a nie z znakami. – Jakub

+1

Hej Wiem, że to stary q, ale zastanawiałem się - dlaczego metoda String.replaceAll() nie działa zamiast przechodzić przez znaki jedna po drugiej? –