w Pythonie, które można umieścić wewnątrz ciągów znaków Unicode na trzy sposoby. (Jeśli używasz wersji 2.x zamiast wersji 3.x, łatwiej używać ciągu Unicode - jak w u"…"
zamiast "…"
- i musisz użyć unichr
zamiast chr
, ale poza tym wszystko jest takie samo.)
- "©": Wpisz bezpośrednio.
- Oznacza to, że prawdopodobnie będziesz musiał wybrać kodowanie znaków dla kodu źródłowego - np. Jawnie zapisać plik jako UTF-8 i umieścić nagłówek kodowania na górze. (W przypadku 3.3, UTF-8 jest domyślny, więc nie potrzebujesz nagłówka kodowania, jeśli tego używasz.)
- W Mac OS X, w domyślnej konfiguracji większości języków, jest to opt-G.
- Pod Windows, wierzę, że możesz użyć sztuczki alt-numeric z numerem 0169, aby wejść do tego, choć nie wydaje się to bardzo łatwe.
- Jeśli nie wiesz, jak wpisać "©" za pomocą klawiatury, skopiuj i wklej ją z innego miejsca (google "znak praw autorskich", a powinieneś znaleźć stronę, z której możesz ją skopiować - lub, jeśli to możliwe, prawo) stąd).
- Albo, twój komputer prawdopodobnie ma Przeglądarkę postaci lub coś podobnego, co pozwala wskazywać i klikać znaki specjalne.
- '\ u00a9': Użyj numerycznej sekwencji unikodowej Unicode.
- Google za "znak praw autorskich Unicode", a szybko zobaczysz, że to U + 00A9. W języku Python to "\ u00a9".
- W przypadku elementów spoza podstawowej płaszczyzny wielojęzycznej - czyli więcej niż 4 cyfry szesnastkowe, należy użyć kapitału
U
i 8 cyfr.
'\N{COPYRIGHT SIGN}'
: Użyj sekwencji escape nazwy jednostki Unicode.
- Ponownie, prawdopodobnie będziesz potrzebować wyszukiwarki Google, aby znaleźć właściwą nazwę jednostki.
- Nie jest to całkowicie udokumentowane, jakie nazwy można i nie można używać. Ale generalnie działa, gdy tego oczekujesz, i
COPYRIGHT SIGN
jest oczywiście bardziej czytelny niż 00a9
.
Można również robić rzeczy pośrednio np. unicodedata.lookup('COPYRIGHT SIGN')
lub chr(0xa9)
zwróci ten sam ciąg jako powyższych literałów. Ale naprawdę nie ma powodu, aby nie używać dosłowności.
W dokumencie Pythona jest dużo więcej szczegółów - jeśli nie chcesz czytać całości, The String Type opisuje różne rodzaje sekwencji ucieczki (oraz problemy z kodowaniem/dekodowaniem między kodami Unicode i bajtami ciągi znaków, które są szczególnie ważne w 2.x), a Unicode Literals in Python Source Code opisuje sposób określania deklaracji kodowania.
Jeśli chcesz uzyskać oficjalną listę wszystkich znaków, których możesz użyć, zamiast po prostu google dla nich, spójrz na dokumenty unicodedata
dla Twojej wersji Pythona, która zawiera linki do odpowiedniej wersji bazy danych znaków Unicode. (Na przykład: 6.1.0 w 3.3.0, 5.2.0 w 2.7.3 itd.) Będziesz musiał poruszać się po kilku linkach, aby dostać się do rzeczywistej listy, ale to jedyny sposób, w jaki będziesz uzyskaj coś, co gwarantuje, że jest dokładnie skompilowane w Pythonie. (A jeśli nie obchodzi, że równie dobrze można po prostu google lub użyć Wikipedia lub widza znaków komputera.)
Na marginesie: Naprawdę chcesz tam te backslashe ? Jeśli tak, lepiej albo jednoznacznie je podwoić, albo użyć ciągłego łańcucha, zamiast polegać na tym, że '\ (' i '\)' nie są sekwencjami unikowymi. – abarnert
Hmm ... Używanie tylko jednego ukośnika odwrotnego zawsze działało dla mnie, aby wydrukować cytaty i nawiasy. Niemniej dziękuję za poradę. – Evan