2013-05-29 25 views
12

To mój drugi dzień z biblioteką Selenium 2 i ból z Unicode nigdy nie wydaje się ustępować.Selenium webdriver i unicode

Robię najbardziej podstawowe czynności, aby wydrukować źródło strony:

from selenium import webdriver 


driver = webdriver.Firefox() 
driver.get("http://google.com") 

print driver.page_source 

Rzeczywiście, pojawia się błąd:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u0119' in position 62045: 
ordinal not in range(128) 

Jak mogę zakodować to proszę utf-8?

Odpowiedz

18

Masz opcje, oparte na tym podobnym question.

Możesz przekonwertować źródło na wszystkie ascii, które utraciły znaki Unicode w procesie.

(driver.page_source).encode('ascii', 'ignore')

Albo, i myślę, że wolisz to można zakodować go na UTF-8 tak: (driver.page_source).encode('utf-8').

Powiązane problemy