Szukam odpowiedzi, która skaluje, ale dla mojego konkretnego celu, mam wektor 48-wymiarowy. Może to być reprezentowane jako tablica składająca się z 48 liczb całkowitych od 0 do 255.Szybkie wyszukiwanie wektora słownikowego dla danego wektora. Wysokie wymiary
Mam duży słownik tych wektorów, w przybliżeniu 25 tysięcy z nich.
Potrzebuję być w stanie wziąć wektor, który może ale nie musi być w mojej bazie danych, i szybko znaleźć który wektor z bazy danych jest najbliżej. Najbliższy, mam na myśli w kategoriach tradycyjnej formuły dystansowej.
Mój kod skończy się pytonem, ale jest to bardziej ogólne pytanie.
Brute Force jest zbyt wolny. Potrzebuję wyszukiwania w pobliżu słownika. Ktoś ma pomysł?
LSH wydaje się jak dotąd najlepszy dla mnie. http://www.mit.edu/~andoni/LSH/ był świetnym źródłem informacji. Najbardziej przydatna okazała się praca z algorytmu z 2006 roku. –