Pobieranie wiadomości e-mail z serwera poczty i przekształcanie wiadomości w zestaw znaków UTF-8 i zapisywanie jej w DB. Aby przekonwertować zestaw znaków używam mb_convert_encoding, ale nie można przekonwertować gb2312
i ks_c_5601-1987
. Podczas korzystania z google znalazłem, że zamiast gb2312
mogę używać CP936
i ks_c_5601-1987
używać CP949
.Jak znormalizować nazwy kodowania, takie jak ks_c_5601-1987 do CP949?
Przechodząc przez powyższe podejście, oznaczałoby to utrzymanie oddzielnej listy odwzorowań zestawu znaków w moim kodzie. Czy istnieje sposób na znormalizowanie nazw kodowań do nazw obsługiwanych wewnętrznie przez PHP, eliminując potrzebę lokalnej konserwacji?
Sugeruję yo u generalizujesz pytanie, aby poprosić o jakiś sposób na znormalizowanie nazw kodowań do nazw obsługiwanych wewnętrznie przez PHP. Byłoby to użyteczne, ogólnie obowiązujące pytanie. – deceze
Dzięki miłej sugestii zredagowano pytanie: –
'iconv' rozpoznaje' ks_c_5601-1987' ale nie może dokonać konwersji. 'mb_convert_encoding' w ogóle nie obsługuje' 949' ani 'ks_c_5601-1987'. 'iconv' rozpoznaje i może konwertować' gb2312' chociaż. – Esailija