Jeśli mam ciąg znaków Unicode w języku Python zawierający kombinację znaków, len
zgłasza wartość, która nie odpowiada liczbie znaków "widzianych".Jak uzyskać "widoczną" długość łączenia ciągu znaków Unicode w języku Python?
Na przykład, jeśli mam ciąg znaków zawierający kombinacje i podkreślenia, takie jak u'A\u0332\u0305BC'
, len(u'A\u0332\u0305BC')
, raporty 5; ale wyświetlany ciąg ma tylko 3 znaki.
Jak uzyskać "widoczny" - czyli liczbę różnych pozycji zajmowanych przez ciąg znaków widziany przez użytkownika - długość ciągów Unicode zawierających kombinację glifów w języku Python?
hmm to jest interesujące, najlepsze, jakie mam Myślę, że to po prostu rozbierać niechciane znaki. – postelrich
@riotburn: To będzie trudne. Znaki mogą być dowolne (dostarczone przez użytkownika). Musiałbym sprawdzić listę tego, co łączą glify Unicode - chyba że jest to systemowa część kodowania. – orome