Powiedzmy mam listę imion filmowych z pisowni i małych wahań takiego -Jaka jest dobra strategia grupowania podobnych słów?
"Pirates of the Caribbean: The Curse of the Black Pearl"
"Pirates of the carribean"
"Pirates of the Caribbean: Dead Man's Chest"
"Pirates of the Caribbean trilogy"
"Pirates of the Caribbean"
"Pirates Of The Carribean"
Jak grupa lub znaleźć takie zestawy słów, najlepiej przy użyciu Python i/lub Redis?
co chcesz uzyskać? chcesz odszukać wszystkie te odmiany w całym ciągu znaków? – JMax
Chciałbym pogrupować je w obiekt złożony i wykonać sprawdzenie przy dodawaniu do bazy danych. –