2017-01-12 23 views
9

ja próbuje zaimportować pakiet NLTK w Pythonie 2,7Corpora/stopwords Nie znaleziono kiedy biblioteka import NLTK

import nltk 
    stopwords = nltk.corpus.stopwords.words('english') 
    print(stopwords[:10]) 

Running to daje mi następujący błąd:

LookupError: 
********************************************************************** 
Resource 'corpora/stopwords' not found. Please use the NLTK 
Downloader to obtain the resource: >>> nltk.download() 

Tak więc otwieram pytona Termin i zrobił następujący:

import nltk 
nltk.download() 

co daje mi:

showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml 

Jednak wydaje się, że to się nie kończy. Ponowne uruchomienie nadal daje ten sam błąd. Wszelkie przemyślenia, gdzie to idzie źle?

Odpowiedz

20

Obecnie próbujesz pobrać każdy element w danych nltk, więc może to potrwać długo. Możesz spróbować pobrać tylko stopwords które trzeba:

import nltk 
nltk.download('stopwords') 
0

Wystarczy uruchomić to polecenie w swoim ipython notebooku (lub innego edytora tekstu/IDE używasz):

import nltk 

nltk.download('stopwords') 

będzie automatycznie pobierać plik stopword i rozpakuj go do wymaganego katalogu.

0

niektóre wymienione przez Kurt Bourbaki ale w wierszu poleceń:

python -m nltk.downloader stopwords