Właśnie zacząłem mój pierwszy projekt NLTK i jestem zdezorientowany co do właściwej konfiguracji. Potrzebuję kilku zasobów, takich jak Tokenizer Punktów i maksymalny tag Tag. Ja sam pobrałem je za pomocą GUI nltk.download()
. Dla moich współpracowników chcę oczywiście, aby te rzeczy były pobierane automatycznie. W dokumencie nie znalazłem żadnego idiomatycznego kodu.Jak sprawdzić, czy zasób nltk jest już zainstalowany na komputerze, na którym działa mój kod?
Czy mam po prostu wstawić nltk.data.load('tokenizers/punkt/english.pickle')
i tym podobne do kodu? Czy to będzie pobieranie zasobów przy każdym uruchomieniu skryptu? Czy mam przekazywać użytkownikowi (tj. Moim współtwórcom) opinie na temat tego, co jest pobierane i dlaczego trwa to tak długo? MUSI być tam sprzęt, który spełnia swoją funkcję, prawda? :)
// Edit Aby explify moje pytanie:
Jak mogę sprawdzić, czy dany zasób NLTK (jak Punkt Tokenizer) jest już zainstalowany na komputerze z systemem mojego kodu i zainstalować go, jeśli nie jest?
Mam problem z ustaleniem, o co prosisz. Przykładem może być zwięzły, testowalny przykład demonstrujący twoje obecne podejście. –
Pozwól mi zmienić pytanie: Jak sprawdzić, czy zasób nltk (taki jak Tokenizer punktu) jest już zainstalowany na komputerze, na którym działa mój kod, i zainstalować go, jeśli tak nie jest? – Zakum
Edytuj swoje pytanie, aby dopasować swój komentarz. Umieszczenie krótkiego pytania w komentarzach może pozwolić mi go przeoczyć: – Spaceghost