12
próbuję następujący kod z danego pliku HTMLPiękna błąd kodowania Unicode Soup
from BeautifulSoup import BeautifulSoup
import re
import codecs
import sys
f = open('test1.html')
html = f.read()
soup = BeautifulSoup(html)
body = soup.body.contents
para = soup.findAll('p')
print str(para).encode('utf-8')
pojawia się następujący błąd:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 9: ordinal not in range(128)
Jak debugować to?
Nie dostaję żadnego błędu po usunięciu funkcji wywołania funkcji drukowania.