2011-12-13 14 views
9

Czy istnieje sposób obsługi znaków Unicode, takich jak \ u0016 w XML? Zgodnie z moim rozumowaniem, ładowanie takich znaków w XMLDocument powoduje zgłoszenie błędnego znaku szesnastkowego. Próbowałem z innymi znakami Unicode. Wydaje się, że działają dobrze. Tylko znaki kontrolne powodują ten błąd. Czy możemy usunąć te znaki bez faktycznego analizowania kodu XML?Znaki Unicode, takie jak u0016 w XML

+1

Dlaczego trzeba użyć U + 0016 w formacie XML? Jest to starszy znak używany do kontroli transmisji, a nie znak tekstowy. –

Odpowiedz

2

Nie można używać znaków sterujących bezpośrednio w języku XML. Jeśli chcesz przechowywać dane binarne w pliku XML, możesz je kodować. W ten sposób można przechowywać obrazy, ...

+0

Lub jeśli naprawdę chcieli kodować U + 0016 zamiast tego oktetu, to coś w rodzaju '' wskazuje tę samą semantykę. –

18

Postacie są oznaczone za pomocą oznaczenia stosowane w standardzie Unicode, który jest opcjonalny U + a następnie ich liczba szesnastkowa, używając co najmniej 4 cyfry, takie jak U+1234 lub U+10FFFD. W kodzie XML lub HTML można to wyrazić jako ሴ lub 􏿽.

z Unicode Technical Report.

Prawidłowe znaki w XML:

Char :: = # x9 | #xA | #xD | [# x20- # xD7FF] | [# xE000- # xFFFD] | [# X10000- # x10FFFF]

z Extensible Markup Language (XML) 1.0 (Fifth Edition)

+4

Piąta edycja wersji 1. Bahahahaha! Przepraszam, łatwo rozbawiony. –

Powiązane problemy