OK, to trochę hack, ale oto, co musiałem zrobić, aby móc korzystać z różnych plików danych NLTK w Pythonie 3.x na moim laptopie Mac (z systemem macOS 10.12.2).
Po pierwsze, zauważ, że błąd certyfikatu występuje tylko wtedy, gdy próbuję pobrać dane NLTK za pomocą Pythona 3.x na moim Macu (moja maszyna wirtualna Ubuntu w VirtualBox nie miała takiego błędu podczas używania Pythona 3.x - co jest denerwujące) . To, dlaczego powoduje to błąd na moim Macu, jest poza mną, zwłaszcza, że moduł NLTK instaluje się w Pythonie 3.x, używając pip
bez żadnych problemów. Jest to połączenie z serwerem pobierania NLTK, który wydaje się powodować problem z weryfikacją SSL.
Moje "ah ha!" Moment, kiedy zorientowałem się, że NLTK - po zainstalowaniu w Pythonie 3.x lub Pythonie 2.x - ma tę samą strukturę katalogów spośród wszystkich wersji Pythona zainstalowanych na dowolnym komputerze. Tak więc użyłem Pythona 2.x, który jest fabrycznie zainstalowany na macOSie, aby zainstalować NLTK, a następnie użył nltk.download()
w Pythonie 2.x, aby zainstalować korpus korpuskularny bez żadnych problemów. Uczyniwszy to (w Pythonie 2.x), I wtedy wrócił do Python 3.x, i ten kod działa:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))
Jak powiedziałem, jest to bit hack, ale ta technika pozwala mi dane NLTK zainstalowane za pomocą Pythona 2.x, które mogę następnie przetworzyć w Pythonie 3.x zgodnie z wymaganiami.
Czy na pewno używasz najbardziej zaktualizowaną wersję NLTK i może spróbować nltk.download („all”) – SAMO
nie zrobił pracować –
http://stackoverflow.com/a/37053858/1168680 – RAVI