Czy istnieje norma, najlepiej pythonowy, sposobem konwersji notacji &#xxxx;
do właściwego ciąg Unicode?Konwersja numerycznej notacji odniesienia znaków Unicode ciąg
Na przykład
מפגשי
powinny być zamienione na:
מפגשי
Można to zrobić - dość łatwo - za pomocą manipulacji ciąg, ale zastanawiam się, czy nie jest to standardowa biblioteka dla tego produktu.
Podpowiedź: że zapis jest nazywany [ "numeryczne odniesienia postaci"] (https: // pl. wikipedia.org/wiki/Numeric_character_reference). –
+1 @ JoachimSauer, dzięki, zaktualizowałem tytuł. –
pokrewne: http://stackoverflow.com/questions/3894564/replace-numeric-character-references-in-xml-document-using-python –