Istnieją trzy rodzaje znaków w wzorze dzielenia wyrazów TeX. Kropka .
jest kotwicą dla granicy słowa. Litera oznacza samą siebie, czyli literę w słowie, która ma być dzielona. Liczba oznacza potencjalny punkt dzielenia wyrazów, a liczba oznacza poziom dzielenia wyrazów. Istnieje pięć poziomów w sumie.
Podstawową ideą algorytmu jest dopasowanie słowa do wzorca i poziomu dzielenia wstawianego z każdego pasującego wzoru. Jeśli dwa poziomy z dwóch różnych wzorów pasują do tego samego punktu, wybierany jest wyższy poziom. Ostatnich wartości, tylko dziwne poziomy wskazują dozwolone punkty dzielenia wyrazów. Chodzi o to, aby móc określić zarówno możliwe punkty dzielenia wyrazów, jak i miejsca, w których łącznik nie powinien być wstawiany. Na przykład, jeśli określone miejsce w słowie pasuje do dwóch wzorców, które mają 1 i 2 w tym miejscu, dzielenie wyrazów w tym miejscu jest niedozwolone, ponieważ 2 przesłoniło wartość 1, a tylko wartość nieparzysta wskazuje dozwolony punkt dzielenia wyrazów.
Patrząc na swoich przykładach .ab4i
wskazuje abi
na początku słowa rzadko otrzymać łącznik między b
i i
ponieważ poziom 4, będąc nawet, jeżeli nie będzie hamować dzielenia przesłonięte przez 5. Z drugiej strony , słowo rozpoczynające się od activa
może zawsze być dzielone między c
i t
, ponieważ 5 zastąpi dowolną inną wartość, a będąc nieparzyste, zezwala na dzielenie wyrazów.
Po prostu zgaduję, ale ja obrazuję liczby, które są priorytetowym systemem wyboru najlepszych miejsc, w których można złamać słowo na podstawie otaczających go liter. Pozostaje tylko pytanie: czy system preferuje wysokie czy niskie wartości? – dmckee