Interesuje mnie pisanie skryptu PHP (proszę o sugestie językowe), które będzie transliterować zdanie lub słowo napisane w języku angielskim (phoenetically) do skryptu innego języka. Ponieważ patrzę na angielski napisany fetycznie (tj. Przez ucho): musiałbym poradzić sobie z wariantowymi pisowniami tego samego słowa.Inteligentna transliteracja w PHP
Zakłada się, że nie istnieje norma dla latynizacji (na przykład w Chinach, masz Wade uproszczony, etc.)
Czy ktoś ma wszelkie wskazówki, gdzie mogę zacząć?
EDYCJA: Robię to wyłącznie w celach edukacyjnych i początkowo miałem wrażenie, że w celu ustalenia związku między wariantami pisowni (które można znaleźć w korpusie wiadomości IM, posty na Facebooku napisane w skolaryzowana forma języka), potrzebujesz jakiegoś narzędzia do uczenia maszynowego. Chciałbym jednak wiedzieć, czy jestem na dobrej drodze, i chciałbym pomóc w ustaleniu, co dalej powinienem sprawdzić, aby to zadziałało (na przykład: na jakie narzędzie do uczenia maszynowego powinienem zaglądać?) .
bez zbytniego mięsisty - pisownią wyrazu obcego (zwykle napisane w jego własnego scenariusza), takie jak " eheree "versus" ehery "lub" ei "vs" ey ". Rozumiem, że to niewiele: oczekiwałem rozwiązania, które wymagałoby nieco analizy statystycznej nad danym korpusem (np. Wiadomościami IM lub aktualizacjami Facebooka zapisanymi w zromanizowanej formie języka). – arkate