Więc sparsowałem stronę html z .findAll
(BeautifulSoup) do zmiennej o nazwie result
. Gdybym wpisać result
w Pythonie skorupy a następnie naciśnij Enter, widzę normalny tekst zgodnie z oczekiwaniami, ale jak chciałem do przetworzenia ten wynik jako obiekt String, zauważyłem, że str(result)
powraca śmieci, jak to próba:Jak przekonwertować BeautifulSoup.ResultSet na ciąg
\xd1\x87\xd0\xb8\xd0\xbb\xd0\xbd\xd0\xb8\xd1\x86\xd0\xb0</a><br />\n<hr />\n</div>
HTML źródłem strony jest utf-8
kodowana
Jak mogę sobie z tym poradzić?
Kod jest w zasadzie to, w przypadku jest to ważne:
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib.open(url).read())
result = soup.findAll(something)
Python 2.7
wyświetl swój kod pls – cetver