2013-04-17 20 views
6

Mam ciąg znaków Unicode, jestem pewien, że jest to kodowanie UTF-8, ale nie mogę go rozszyfrować. Łańcuch to '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'. Jak to rozszyfrować?Łańcuch dekodujący " u041b" w języku Python

+1

dekodowania, co - jak chcesz go użyć? – Mark

+0

Och, jestem głupia :) print "\ u0441 \ u0434 \ u0435 \ u043d \ u044c \ u044f" daje normalny ciąg czytelny dla człowieka. – arts777

+0

To zdecydowanie nie jest UTF8. – glglgl

Odpowiedz

24

Można użyć aString.decode('unicode_escape'), to przekonwertować ciąg Unicode formacie Unicode obiektu

>>> u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> 

W twoim przypadku

>>> print '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
Легковые 
>>>