2010-04-24 9 views

Odpowiedz

32

Tak, zgadza się. UTF-8 to kodowanie zestawu znaków Unicode, który obsługuje niemal każdy język na świecie.

Myślę, że jedyną różnicą jest sortowanie wyników, różne litery mogą być w innej kolejności w innych językach (akcenty, umlauty itp.). Również porównanie w innym zestawieniu może się różnie zachowywać.

Sufiks _ci oznacza, że ​​podczas sortowania i porównywania wielkość liter jest niewrażliwa.

http://www.collation-charts.org/ może Cię zainteresować.

+1

Dziękuję bardzo, kolego :) jeszcze jedno pytanie: masz na myśli, jeśli wybiorę utf8_general sortowanie, to będzie problem z sortowaniem moich rekordów zarówno w języku angielskim i perskim lub innym języku Langs? –

+1

angielskie i francuskie powinny wyglądać tak samo, nie wiem o innych (perski, arabski, japoński, chiński), ponieważ nie używają normalnych angielskich znaków. jak ich lubisz sortować? po angielskich literach, między nimi, wcześniej? wiesz co mam na myśli? – knittl

+0

nie, mam na myśli sortowanie perskich znaków na ich drodze. oznacza to tak samo, jak sortowanie angielskich alfabetów takich jak A, B, C, ... czy to będzie działało źle z tym układaniem? –

Powiązane problemy