2012-07-20 13 views
5

Próbuję wymyślić niejawny moduł sprawdzania pisowni, który użyje odwzorowania słów wejściowych do jakiejś bardziej ogólnej reprezentacji fonetycznej, aby uwzględnić literówki, które mogą wystąpić, w zasadzie dla paska wyszukiwania, który automatycznie poprawi twoją pisownię do pewnego stopnia. Dwie rzeczy, którymi się zajmuję to metafon, nysiis i soundex, ale tak naprawdę nie wiem, który byłby lepszy dla tej aplikacji.metaphone versus soundex versus NYSIIS

Chciałbym, aby preferencyjnie było więcej dopasowań niż mniej meczów, i chciałbym, aby dopasowanie było trochę bardziej ogólne i dlatego rozważałem udanie się z soundexem, który wydaje się bardziej przybliżonym odwzorowaniem niż oryginalna metafora, ale tak naprawdę nie wiem, jak duża jest różnica w niejasności. Wiem, że nysi jest dość podobna do soundex, ale nie mam pojęcia, jak są podobne, ani jak nysiis porównuje się do metafonu.

Szukam również rozwiązania, które jest najszybsze do wykonania. Wiem, że ci fonetyczni twórcy map są zazwyczaj dość szybcy, ale nie jestem pewien, który byłby najszybszy, biorąc pod uwagę, że chciałbym móc sprawdzać pisownię bez wzrostu czasu wyszukiwania, szybkość jest kwestią rozważną. Myśli?

Odpowiedz