2015-09-06 7 views

Odpowiedz

3

Aby dodać użytkownika @ abarisone odpowiedzi, rzeczywiste identyfikatory synset sami mogą się różnić między WordNet 3.0 i WordNet 3.1 :(

Na przykład w WordNet 3.1a krzesło jest 103005231-n.

Jednak w WordNet 3.0 to był103001627-n. ale nie mogę patrzeć, że w http://wordnet-rdf.princeton.edu/wn31/103001627-n ani http://wordnet-rdf.princeton.edu/wn30/103001627-n, ale zamiast tego trzeba użyć http://wordnet-rdf.princeton.edu/wn30/03001627-n który nieprawidłowo przekierowuje do 102992974-n.

Myślę, że to błąd w WordNet RDF 3.1 online app, ponieważ 102992974-n oficjalnie nie istnieje. Nie możesz nawet go wyszukać (zarówno online, jak i offline). Jeśli otrzymasz plik RDF/JSON-LD na tej stronie, otrzymasz od ciebie 103005231-n.

W wn3.1.dict/dict/index.noun:

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 

Nie ma wzmianki o 02992974 nigdzie w tym pliku.

Oba te problemy są mylące. Zastanawiam się, dlaczego zmienili synsety ID w mniejszej wersji.


Odnośnie statusu WordNet synset identyfikatorów:

Wniosek jest obecnie, przy użyciu WordNet 3,0 identyfikatory synset jest najbezpieczniejsze.

W przypadku przyszłych prac można rozważyć użycie indeksu międzyjęzykowego z Global Wordnet Association (już wkrótce). Który będzie miał identyfikatory zgodne z Wordnetem 3.0.

Referencje wn-users mailing list, 30 Oct 2015:

Od: Raphael, Nicholas

URI jest zbudowany z „dblocation” pole, które jest offset bajtowy od początku odpowiedniej bazy danych znaków oparte plik (jestem nie wiem, który). To zmieni się z wersji na wersję, gdy elementy zostaną usunięte, dodane i przeniesione.

.

Od: Peter Clark

Zgodnie z moją najlepszą wiedzą .... FYI mało znanym faktem jest to, że klucze rozróżniające (np. "Zdolność% 1: 07: 00 ::") są stabilne między wydaniami, , z wyjątkiem sytuacji, gdy zmysły są dzielone lub łączone. Zapewnia to stabilny sposób, aby odwoływać się do zestawień synchronicznych w różnych wydaniach, zamiast używać numerów synsetów. Również można znaleźć mapowania między numerami synsetów w różnych wersjach , szukając tych samych kluczy sensu. (sensekey-> synset jest mapowaniem wiele do 1: : Zestaw synaptyczny może mieć wiele kluczy sensytywnych, po jednym dla każdego słowa kluczowego w zestawie synaps, ale klucz sensowności jest mapowany dokładnie na jeden synset). Najlepsze życzenia, Pete

.

Od: John McCrae

Witam Hendy,

Tak WordNet synset Identyfikatory są oparte na bajt offsetowego deskryptora w danym wydaniu WordNet jako takie są one dalekie od stabilny w różnych wersjach WordNets. Identyfikatory sensów są bardziej stabilne, ale wciąż mogą być niewiarygodne, ponieważ sens zostaje podzielony i scalony. Istnieją również dwie nieznacznie różne wersje WordNet 3.1 i WordNet w wersji RDF akceptuje identyfikatory zestawów synoptycznych z albo ... to jest oczywiście, jak mówili inni, wszystko bardzo mylące.

Z tego powodu globalnego WordNet Stowarzyszenie rozpoczęło pracę nad Inter-językowej Index, którego spodziewamy się wkrótce (czyli w czasie na konferencję Globalny WordNet w styczniu) online i dam każdemu synchronizuje pojedynczy niezmienny identyfikator URI.

Piek Vossen dał dobrą rozmowę o tym niedawno i to slajdy są on-line tutaj: http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

Na razie, polecam korzystania WN 3,0 identyfikatory połączyć synsets, który będzie również WordNet międzyjęzykowej Index oparte na.

Pozdrowienia Jan

0

Jeśli spojrzeć pod WordNet's Current Version section przekonasz się, że:

Najnowszą wersję Windows WordNet to 2.1, wydany w marcu 2005. Wersja 3.0 dla Unix/Linux/Solaris/etc. został wydany w grudniu 2006 roku. Wersja 3.1 jest obecnie dostępna tylko online.

Ponadto, mówiąc o różnicy między wersją 3.0 i 3.1 można przeczytać:

WordNet 3,1 DATABASE tylko pliki

Można pobrać pliki bazy danych WordNet 3.1 stąd. Zauważ, że nie jest to pełny pakiet, jak te powyżej, ani nie zawiera żadnego kodu do uruchamiania WordNet. Można jednak zastąpić pliki z katalogu baz danych o numerze katalogowym instalacji 3.0 z tymi plikami i uruchomi się interfejs WordNet, zwracając wpisy z bazy danych 3.1 . Jest to po prostu skompresowany plik tar plików bazy danych WordNet 3.1 .

Różnica polega na tym, że WordNet 3.1 jest tylko w trybie online, ale można zastąpić bazę danych wersji 3.0 i użyć instalacji lokalnej.

Możesz znaleźć dokumentację dotyczącą wersji 3.0 here.

Powiązane problemy