Załóżmy dwa komplety strun:Dopasowany odmienne ciągi
[ "Mr. Jones", "O'Flaherty", "Bob", "Rob Jenkins" ]
[ "Maxwell O'Flaherty", "Robert Jenkins", "Mrs. Smith" ]
Jest oczywiste, że te dwa zespoły mają Maxwell O'Flaherty i Robert Jenkins wspólnego.
Czy istnieje algorytm, który pozwoli nam na takie programowanie? Zastanawiam się nad napisaniem czegoś, co przejdzie przez każdy element w szeregu ciągów znaków i spróbuję znaleźć dowolny podciąg, który jest unikalny i nie jest zawarty w żadnym innym elemencie żadnego z zestawów, a następnie użyć go jako swego rodzaju hash każdego elementu aby dopasować dwa zestawy.
Należy ujawnić, jakie nazwy należy traktować tak samo. Ponieważ nie znam angielskich nazwisk, nie jest dla mnie oczywiste, że "te dwa zestawy mają wspólne cechy Maxwella O'Flaherty'ego i Roberta Jenkinsa". I nie oczywiste dla kompilatora C#. Jeśli chodzi o ciebie, to nie jest oczywiste, że "Sasha Iwanow" i "Aleksander Pietrowicz Iwanow" jest taki sam, ale nie taki sam jak "Aleksiej Iwanow". – Vovanium
Zgadzam się, komputer miałby najmniejszą szansę na dopasowanie Sashy i Alexandra, ponieważ pasowałoby do Richarda i Dicka. Problemem nie są nazwiska, ale po prostu dopasowanie podobnych ciągów. – devprog
Prawdopodobnie jest to duplikat: [http://stackoverflow.com/questions/83777/are-there-any-fuzzy-search-lub-symilar-functions-libraries-written-for-c](http:/ /stackoverflow.com/questions/83777/are-there-any-fuzzy-search- or-string-similarity-functions-libraries-written-for-c) –