Tytuł prawie podsumowuje pytanie. Zauważyłem, że w niektórych artykułach ludzie odwoływali się do schematu kodowania BILOU dla NER w przeciwieństwie do typowego schematu znakowania BIO (takiego jak ten dokument autorstwa Ratinova i Rotha w 2009 roku http://cogcomp.cs.illinois.edu/page/publication_view/199)Co oznaczają znaczniki BILOU w Rozpoznawaniu nazwanego?
Od pracy z danymi CoNLL z 2003 roku wiem, że
B stands for 'beginning' (signifies beginning of an NE)
I stands for 'inside' (signifies that the word is inside an NE)
O stands for 'outside' (signifies that the word is just a regular word outside of an NE)
Chociaż powiedziano mi, że słowa Bilou oznaczają
B - 'beginning'
I - 'inside'
L - 'last'
O - 'outside'
U - 'unit'
ja również widziałem ludzi odwołać kolejny tag
E - 'end'
i używać go jednocześnie z "ostatnim" tagiem.
Jestem całkiem nowy w literaturze NER, ale nie byłem w stanie znaleźć czegoś wyraźnie wyjaśniającego te znaczniki. Moje pytania dotyczą w szczególności różnicy między tagami "ostatni" i "końcowy" oraz oznaczeniem "jednostka".
można umieścić referencje na „Ja również widziałem ludzi odwołaj się do innego tagu "? – Daniel