Na naszej stronie niektórzy użytkownicy komputerów Mac mają problemy podczas kopiowania i wklejania tekstu z plików PDF do TextArea (obsługiwane przez TinyMCE). Wszystkie akcentowane znaki są uszkodzone i stały się na przykład e?
dla é
, i?
dla î
itd. Nie mogę odtworzyć tego problemu na komputerze z systemem Windows.PHP: Unikodowany znak i znaki diakrytyczne Unicode
Kiedy napisałem zawartość pliku TextArea na pliku (przed wstawieniem go do bazy danych), właśnie odkryłem, że początkowy é
różni się wizualnie od tradycyjnego é
(w Vim, patrz poniżej).
Rzeczywiście:
// the corrupted é - first line of the screenshot
echo bin2hex($char); // display 65cc81
// traditionnal é
echo bin2hex('é'); // display c3a9
Po wyszukaniu dużo, jestem tutaj: Wydaje się, że Mac OS kopie Unicode podkreślona znaków jako kombinacja dwóch znaków: w naszym przykładzie e + ́
. Do tej pory nie znalazłem żadnego rozwiązania, aby zastąpić uszkodzony é
prawdziwym, aby uniknąć e?
w bazie danych.
Jestem trochę zdesperowany.
http://unicode.org/reports/tr15/ – hakre