2009-12-19 12 views
12

Jeśli przewinąć this page trochę, chcesz zobaczyć UK angielskich wzorców dzielenia wyrazów takich jak:TeX dzielenia wzory: Co one oznaczają

\patterns{ % just type <return> if you're not using INITEX 
.ab4i 
.ab3ol 
.ace4 
.acet3 
.ach4 
.ac5tiva 

Co te wzory jak .ab4i oznacza?

+1

Po prostu zgaduję, ale ja obrazuję liczby, które są priorytetowym systemem wyboru najlepszych miejsc, w których można złamać słowo na podstawie otaczających go liter. Pozostaje tylko pytanie: czy system preferuje wysokie czy niskie wartości? – dmckee

Odpowiedz

15

Istnieją trzy rodzaje znaków w wzorze dzielenia wyrazów TeX. Kropka . jest kotwicą dla granicy słowa. Litera oznacza samą siebie, czyli literę w słowie, która ma być dzielona. Liczba oznacza potencjalny punkt dzielenia wyrazów, a liczba oznacza poziom dzielenia wyrazów. Istnieje pięć poziomów w sumie.

Podstawową ideą algorytmu jest dopasowanie słowa do wzorca i poziomu dzielenia wstawianego z każdego pasującego wzoru. Jeśli dwa poziomy z dwóch różnych wzorów pasują do tego samego punktu, wybierany jest wyższy poziom. Ostatnich wartości, tylko dziwne poziomy wskazują dozwolone punkty dzielenia wyrazów. Chodzi o to, aby móc określić zarówno możliwe punkty dzielenia wyrazów, jak i miejsca, w których łącznik nie powinien być wstawiany. Na przykład, jeśli określone miejsce w słowie pasuje do dwóch wzorców, które mają 1 i 2 w tym miejscu, dzielenie wyrazów w tym miejscu jest niedozwolone, ponieważ 2 przesłoniło wartość 1, a tylko wartość nieparzysta wskazuje dozwolony punkt dzielenia wyrazów.

Patrząc na swoich przykładach .ab4i wskazuje abi na początku słowa rzadko otrzymać łącznik między b i i ponieważ poziom 4, będąc nawet, jeżeli nie będzie hamować dzielenia przesłonięte przez 5. Z drugiej strony , słowo rozpoczynające się od activa może zawsze być dzielone między c i t, ponieważ 5 zastąpi dowolną inną wartość, a będąc nieparzyste, zezwala na dzielenie wyrazów.

+0

@jk: Dzięki za wspaniałe wyjaśnienie. Ale nie dostałem tej części "Ostatnich wartości, tylko dziwne poziomy wskazują dozwolone punkty dzielenia wyrazów". – understack

+0

@understack: wartości nieparzyste określają miejsca, w których zachęty są zachęcane, a nawet wartości, w których są zniechęcane. Ponieważ algorytm może stwierdzić, że stosuje się kilka wzorców, ma on system precedensu, który mówi, która reguła hipenacji liczy się bardziej, na co wskazuje wyższa liczba. –

4

Te wzory są tworzone przy użyciu narzędzia o nazwie patgen2. Źródło TeX zawiera samouczek dotyczący tego narzędzia pod adresem patgen2.tutorial, a praca doktorska na ten temat jest dostępna pod numerem tug.org.

+0

Jest również dobre wytłumaczenie w The TeXbook Kutha. –

Powiązane problemy