2011-01-24 9 views
5

I'de lubią iterację listy i wydrukować go (do późniejszego użycia z biblioteki curses):początkujący python unicode: jak wydrukować serię listów?

  • U + 0080 ... U + 00FF: Latin-1 Supplement
  • U + 0100 ... U + 017F: Rozszerzony łaciński-A
  • U + 0180 ... U + 024F: Rozszerzony łaciński-B
  • U + 0250 ... U + 02AF: Rozszerzenia IPA
  • U + 02B0 ... U + 02FF: Oddzielanie liter modyfikujących
  • U + 0300 ... U + 036F: Łączenie znaków diakrytycznych
  • U + 0370 ... U + 03FF: grecki i koptyjski
  • U + 0400 ... U + 04FF: cyrylica
  • U + 0500 ... U + 052F: cyrylica Suplement
  • U + 0530 ... U + 058F: ormiański
  • U + 0590 ... U + 05FF: hebrajski
  • U + 0600 ... U + 06FF: arabski
  • U + 0700 ... U + 074F: Syriac
  • U + 0750 ... U + 077F: arabski dodatek
  • U + 0780 ... U + 07BF: Thaana
  • U + 07C0 ... U + 07FF: NKO
  • U + 0800 ... U + 083F: Samarytanin
  • U + 0900 ... U + 097F: Devanagari
  • U + 0980 ... U + 09FF: bengalski
  • U + 0A00 ... U + 0A7F: gurmukhi
  • U + 0A80 ... U + 0AFF: gudżarati
  • U + 0B00 .. U + 0B7F: Oriya
  • U + 0B80 ... U + 0BFF: Tamil
  • U + 0C00 .. . U + 0C7F: telugu
  • U + 0C80 ... U + 0CFF: kannada
  • U + 0D00 ... U + 0D7F: malajalam

Ale w dokumentacji Pythona nie tylko o tym, jak zadeklaruj ciąg, a nie jak go utworzyć dynamicznie (jak w pętli). Przykro mi, jeśli to pytanie początkującego ... ale nie wiem jak to zrobić.

Jeszcze raz dziękuję!

+3

Mam edytować swoje pytanie, jak to wyraźnie nie znaczy UTF-8, ale Unicode. To różne rzeczy. Wymienione powyżej kody U + to nie UTF8, są to kody Unicode. –

Odpowiedz

10

Co o: http://docs.python.org/howto/unicode.html

for i in xrange(0x80, 0xFF): 
    print unichr(i) 
+3

Należy zauważyć, że aby to zadziałało, standardowe wyjście musi być podłączone do poprawnie skonfigurowanego terminala, w taki sposób, aby Python mógł wykryć kodowanie terminala (sprawdź 'sys.stdout.encoding'). Nie powiedzie się, jeśli przekierujesz wyjście do, powiedzmy, pliku. – nosklo