myślę wykorzystaniu standardowego algorytmu fonetyczną byłoby dobrym pomysłem. Myślę, że Soundex może być nieco ograniczony, ale prawdopodobnie dobrym wyborem byłby model double metaphone.
Get reprezentacje Metaphone słów w pytaniu usunąć pierwsze znaki i sprawdzić, czy pozostała część krótszy z dwóch słów dopasowuje koniec dłuższy. Z podwójnym metafonem jest bardzo podobny, ale dokonaj czterech porównań: pierwotnej do pierwotnej, wtórnej do pierwotnej, pierwotnej do wtórnej i wtórnej do wtórnej.
Myślę, że byłby to dobry punkt wyjścia.
Uwaga na to i wiele innych algorytmów fonetycznych: To nie jest zaprojektowany, aby zapewnić precyzyjną definicję fonetyczną. Zróżnicowana wymowa geograficzna, wspólne błędne wypowiedzi i alternatywne wymowy sprawiają, że trudno jest uzyskać jednoznaczną i prawidłową wymowę, opartą wyłącznie na słowie. Nowatorska pisownia i użycie liter utrudniają algorytmiczne uzyskiwanie ścisłej wymowy (dbałość o niektóre przystawki?). Ponadto, głównym celem wielu takich algorytmów jest dopasowanie do siebie słów lub nazw słownych lub fałszywie brzmiących, tak więc wyniki są zazwyczaj niedokładne (prawdopodobnie jest to dobre, również w tym celu).
Powodzenia, nieskończenie trudne? – EricG
jaka jest definicja wierszyka? –
@AlexLynch http://en.wikipedia.org/wiki/Rhyme, nie wiem, czy twój język je zdefiniował, ale w moim rodzimym (polskim) również kategoryzujemy rymy. ;-) –