Jak używać Pythona do zastępowania znaków ewidencyjnych HTML?

Powiel możliwe:
Decode HTML entities in Python string?Jak używać Pythona do zastępowania znaków ewidencyjnych HTML?

mam pełny ciąg znaków ewakuacyjnych HTML, takich jak ", ” i —.

Czy każda biblioteka Pythona oferuje niezawodne sposoby zastąpienia wszystkich znaków ewakuacyjnych odpowiednimi rzeczywistymi znakami?

Na przykład, chcę wszystkie " s zastąpić „s

Źródło

2012-07-10 dangerChihuahua007

[string.replace] (http://docs.python.org/library/string.html#string.replace) –

pomocą Piękne Soup: http: // lxml .de/elementsoup.html – sateesh

Chcesz użyć tego.

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string)

ja też widzę dużo miłości dla BeautifulSoup

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES)

Również duplikat tych istniejących pytań:

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

Źródło

2012-07-10 03:04:14

Jeśli wiesz, że to duplikat, czemu nie oznaczać flagą zamiast odpowiadać (innym niż rep)? – kapa

To irytujące, gdy ludzie nie poświęcają czasu na szukanie odpowiedzi na swoje pytania, zwłaszcza w tym przypadku - gdy jest tak wiele dokładnych replik. Czasami jednak czuję, że wspólnoty się zwierają. Co by było, gdybyśmy źle zrozumieli pytanie i naprawdę nie było duplikatem? Co jeśli odpowiedź na pytanie wywołałaby sensowną rozmowę/wątek, który podejmuje pytanie i odpowiedź w innym kierunku? Nie chodzi też o reputację, gdy pytanie zostanie zamknięte lub utracona reputacja z nim związana może zostać zanegowana ... –

Próbowałem tylko ostrzec was o ogólnie akceptowanych normach zachowania tutaj na StackOverflow. Jeśli wydawało ci się, że troszczysz się trochę, to sprawdziłbym pytanie Meta na ten temat, ale myślę, że możesz znaleźć to sam, jeśli jesteś zainteresowany. Nie chcę się z tym kłócić, byłem tylko posłańcem, rób to tak, jak sobie życzysz :). – kapa

Jak używać Pythona do zastępowania znaków ewidencyjnych HTML?

Odpowiedz

Powiązane problemy