2016-01-01 11 views
13

Próbuję wyodrębnić stany USA z adresu URL wiki i dla których używam Pand Pythona.Pandy: read_html

import pandas as pd 
import html5lib 
f_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

Jednakże powyższy kod daje mi błąd L

ImportError Traceback (most recent call last) in() 1 import pandas as pd ----> 2 f_states = pd.read_html(' https://simple.wikipedia.org/wiki/List_of_U.S._states ')

if flavor in ('bs4', 'html5lib'): 662 if not _HAS_HTML5LIB: --> 663 raise ImportError("html5lib not found, please install it") 664 if not _HAS_BS4: 665 raise ImportError("BeautifulSoup4 (bs4) not found, please install it") ImportError: html5lib not found, please install it

zainstalowałem html5lib i beautifulsoup4 jak dobrze, ale to nie działa. Czy ktoś może pomóc pls.

Odpowiedz

20

Running Python 3.4 na mac

New pyvenv

pip install pandas 
pip install lxml 
pip install html5lib 
pip install BeautifulSoup4 

Następnie prowadził swój przykład ....

import pandas as pd 
import html5lib 
f_states= pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

Wszystkie prace ...

+2

dziękuję, działało. Chociaż zainstalowałem je wszystkie, ale ponownie je zainstalowałem i otworzyłem nową instancję, i zadziałało. dzięki – user4943236

+0

Cieszę się, że pomogło ci –

+0

To samo tutaj @ TimSeed, zainstalowałem wszystko za pomocą pip, następnie musiałem ponownie uruchomić nowe wystąpienie. –

0

Musisz zainstalować lxml za pomocą pip.

instalacja pip lxml

to działało dla mnie.

+0

Niektóre formatowanie wykona magię. Lepiej edytować bit – Billa