Co to jest dokładnie zbyt długa forma/kodowanie?

Czytanie Wikipedia article on UTF-8, Zastanawiam się nad terminem overlong. Termin ten jest używany w różnych czasach, ale artykuł nie zawiera definicji ani odniesienia do jego znaczenia.Co to jest dokładnie zbyt długa forma/kodowanie?

Chciałbym wiedzieć, czy ktoś może wyjaśnić termin i jego cel.

Źródło

2011-08-18 nEAnnam

Jest to kodowanie punktu kodowego, który pobiera więcej jednostek kodu niż potrzeba.

Na przykład U + 0020 jest reprezentowany w UTF-8 przez jeden bajt 0x20. Jeśli odszyfrujesz dwa bajty 0xc0 0xa0 w zwykły sposób, nadal będziesz wracał do U + 0020, ale jest to nieprawidłowa reprezentacja.

Więcej informacji znajduje się w Tabeli 3.1B, pod numerem Unicode Corrigendum #1.

Źródło

2011-08-18 19:39:57

UTF-8 teoretycznie pozwala na różne odwzorowania znaków, które również są krótsze. Na przykład można zakodować znak ASCII w dwóch bajtach, ustawiając MSB na zero. Specyfikacja UTF-8 wyraźnie to zabrania.

Źródło

2011-08-18 19:41:25 Joey

Okropne kalambur. Głosowałem w dół. – Computer

@Computer: o.O o jakiej kalambrze tęskniłem? – Joey

Powiedziałeś, że forbity! – Computer

Co to jest dokładnie zbyt długa forma/kodowanie?

Odpowiedz

Powiązane problemy