Poszukuję lekkiej biblioteki Java obsługującej najbliżej sąsiadujące wyszukiwania według szumu lokalnego w prawie równomiernie rozproszonych danych w wysokiej jakości (w moim przypadku 32) zbiorze danych z setkami tysięcy punktów danych.Biblioteki LSH w Javie
Jest wystarczająco dobrze, aby uzyskać wszystkie wpisy w wiadrze dla zapytania. Które z nich naprawdę potrzebuję, mogą być przetworzone w inny sposób, biorąc pod uwagę niektóre parametry filtru, które obejmuje mój problem.
Znalazłem już likelike, ale mam nadzieję, że istnieje coś nieco mniejszego i bez potrzeby stosowania jakichkolwiek innych narzędzi (takich jak Apache Hadoop w przypadku).
Znalazłeś coś? Szukałem tego samego z odległością euklidesową jako moją miarą dla kNN. –
Niezupełnie. Ale myślę, że będę musiał sam wymyślić implementację. Pozostaje jednak pytanie, jak wybrać dobre funkcje mieszania ... – s1lence
Możesz rozpocząć od funkcji mieszania w implementacji MATLAB pod adresem http://ttic.uchicago.edu/~gregory/download.html –