Od pewnego czasu borykam się z tym problemem, ale nie mogę tego rozgryźć.Deduplikacja SQL z dwóch kolumn
Mam tabelę z 3 kolumnami. 2 kolumny zawierające nazwy i trzecia zawierająca odległość Damerau Levensthein (http://en.wikipedia.org/wiki/Damerau%E2%80%93Levenshtein_distance) pomiędzy tymi nazwami.
każda kolumna zawiera wszystkie pojedyncze nazwy, co oznacza, że wszystkie nazwiska obecne w kolumnie autor1 są również obecne w kolumnie autor2. w rezultacie mam dwa razy potrzebne wiersze, po prostu z zamienionymi kolumnami autor1 i autor2.
jako przykład, wiersz 3 jest równy rzędowi 1, tylko z zamienionymi kolumnami autorki, to samo dotyczy 2-4. jak sformułować zapytanie pomijające te "duplikaty"?
id- | ------ autor1 ---- | ------ autor2 ----- | dld
1 - | Abel, Gustav - | Abel, Gustave | 1
2 - | Abel, Gustav - | Abele, Gustav | 1
3 - | Abel, Gustave | Abel, Gustav - | 1
4 - | Abele, Gustav | Abel, Gustav - | 1
do
| ------ autor1 ---- | ------ autor2 ----- | dld
| Abel, Gustav - | Abel, Gustave | 1
| Abel, Gustav - | Abele, Gustav | 1
jesteś geniuszem. chociaż obawiam się, że nie rozumiem w pełni, jak działa "większa niż" magia. – lightxx
@lightxx - Dodałem podział logiki za stwierdzeniem. Mam nadzieję, że trochę się rozjaśni. –
dzięki, znowu.rządzisz!! – lightxx