2011-12-05 11 views
5

Jeśli moja strona używa UTF-8, czy jest jakaś zaleta/wada, że ​​nadal ucieka znaki HTML? na przykład Korzystanie "& „zamiast po prostu” & „Co jest najlepsze praktyki?Uciekające znaki HTML za pomocą UTF-8?

+0

' & 'to postać niskiego porządek ASCII. To nie ma nic Zrób z Unicode – SLaks

Odpowiedz

6

trzeba jeszcze uciec znaki, które mają specjalne znaczenie w HTML, takie jak <, >, &, aby uniknąć niejednoznaczności/niepoprawnej składni parsera.To nie ma nic wspólnego z kodowaniem.Nie musisz się uciec każdym znakiem spoza ASCII, np. "ö" do &ouml;, ponieważ możesz reprezentować je natywnie e Kodowanie UTF-8.

+0

Pierwsze pytanie, zobacz [to inne pytanie] (http://stackoverflow.com/questions/10371493/what-are-the-reserved-characters-in-xhtml) Aby uzyskać ogólną koncepcję, zobacz [Wielka ucieczka (lub: Co musisz wiedzieć, aby pracować z tekstem w tekście)] (http://kunststube.net/escap izm/). – deceze

0

& jest nieprawidłowy HTML (to jest niezakończony odniesienia podmiot).
To nie ma nic wspólnego z Unicode.

+0

Lub odniesienia do znaku :-) –

0

trzeba konwertować do podmiotu <> & zawsze, a "tylko wtedy, gdy w atrybutu html

np

<a title="tell me &quot;more&quot;"> 
Powiązane problemy