2011-06-24 16 views
15

im parsowania HTML za pomocą BeautifulSoup w Pythoniewydobywania element i wstawić spację

nie wiem jak wstawić spację podczas wydobywania element tekstowy

Jest to kod:

import BeautifulSoup 
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>') 
print soup.text 

następnie wyjście to

ten przykładowy numer

ale chcę, aby wstawić spację do tego jak

Tak jest przykładem

jak mogę wstawić spację?

Odpowiedz

33

Zastosowanie getText zamiast:

import BeautifulSoup 
soup=BeautifulSoup.BeautifulSoup('<html>this<b>is</b>example</html>') 

print soup.getText(separator=u' ') 
# u'this is example' 
1

Jeśli wersja BeautifulSoup nie posiada getText następnie można to zrobić:

In [26]: ' '.join(soup.findAll(text=True)) 
Out[26]: u'this is example' 
Powiązane problemy