Chciałbym zeskrobać stolik z sieci i zachować & nbsp; encje nienaruszone, aby móc ponownie opublikować jako HTML później. BeautifulSoup wydaje się jednak konwertować je do przestrzeni. Przykład:Scrape przy użyciu Beautiful Soup zachowując podmiotów
from bs4 import BeautifulSoup
html = "<html><body><table><tr>"
html += "<td> hello </td>"
html += "</tr></table></body></html>"
soup = BeautifulSoup(html)
table = soup.find_all('table')[0]
row = table.find_all('tr')[0]
cell = row.find_all('td')[0]
print cell
obserwowany wynik:
<td> hello </td>
wymagane wyniki:
<td> hello </td>
Dzięki za odpowiedź :) –