2013-12-15 9 views
8

Podczas badania problemów Unicode w Python3, mogę przez to often-quoted document, który określa wstępne pomysły za wsparciem dla Unicode w Python3. Cytat z tej strony:7-bitów do 0xEF

Ze względów historycznych, kodowanie najczęściej używanym jest ASCII, który może obsłużyć tylko punkty kodowe Unicode w zakresie 0-0xEF (czyli kodowanie ASCII jest 7-bitowy).

Rozumiem, że 0xEF = 14*16 + 15*1 = 239. Wydaje mi się to niewłaściwe, ponieważ binarny 1111111 (7 bitów) jest 127. Czy ten cytat jest błędny, czy też moje rozumienie jest złe?

AKTUALIZACJA: Dokument został naprawiony! Podziękowania dla Nicka Coghlana za doskonałe wprowadzenie do obsługi ciągów Pythona 3 i pomoc w potwierdzeniu literówki.

+2

Co oznacza "0xEF"? – thefourtheye

+1

To naprawdę dziwne, ponieważ 7-bitowy ASCII ma zakres od '00' do' 7F', a '0xEF' jest wyraźnie 8-bitowy. A akapit nie odnosi się również do UTF-8. Złóż błąd! – 9000

+0

Dzięki, po prostu zostawiłem komentarz do funkcji komentarza tej strony. – dotancohen

Odpowiedz

10

Tak, 0xEF wydaje się być zwykłą literówką. Ta sekcja ma sens, a zastąpiona przez 0x7F.

+0

Dziękuję Bobrze. – dotancohen

Powiązane problemy