2011-02-11 25 views

Odpowiedz

7

standard Unicode rozmowy na ten temat. Oto trochę the relevant section from 3.2.0, annex 28 (jestem pewien, że są nowsze wersje wokół; jest to pierwszy znalazłam):

znaków Unicode mogą być reprezentowane przez wielu różnych glifów, jak to opisano w rozdziale 2, General Struktura w standardzie Unicode, wersja 3.0. Czasami pojawia się potrzeba przetwarzania tekstu, aby ograniczyć lub zmienić zestaw glifów, które mają być używane do reprezentowania postaci. Zwykle zmiany takie są wskazywane przez wybór czcionki lub stylu w dokumentach tekstowych. W szczególnych okolicznościach taka zmiana w stosunku do normalnego zakresu wyglądu musi być wyrażana obok siebie w tym samym dokumencie w kontekstach tekstu jawnego, gdy wymiana tekstu sformatowanego jest niemożliwa lub niewygodna. Na przykład w językach posługujących się pismem mongolskim, czasami potrzebny jest określony zakres glifów dla określonego celu tekstowego, dla którego zakres "ogólnych" glifów jest uważany za niewłaściwy. Selektory zmienności są używane, gdy znaki mają zasadniczo tę samą semantykę.

Selektory zmienności udostępniają mechanizm określania ograniczenia zestawu glifów, które są używane do reprezentowania określonego znaku. Dostarczają również mechanizmu do określania wariantów, takich jak ideogramy CJK i mongolski, które mają zasadniczo tę samą semantykę, ale mają zasadniczo różne zakresy glifów. Sekwencja zmian, która zawsze składa się ze znaku podstawowego, a następnie selektora zmian, może być określona jako część standardu Unicode. Ta sekwencja jest nazywana wariantem podstawowego znaku. Selektor zmienności wpływa tylko na wygląd znaku bazowego, * i tylko w sekwencjach zmian zdefiniowanych w tym standardzie. Selektor zmian nie jest używany jako ogólny mechanizm rozszerzenia kodu.

(To idzie dalej ...)

Możesz być także zainteresowany w Standardized Variants (tym razem od 6.0.0).

+1

Czy tak naprawdę jest używany? –

+0

@MikeKeskinov: Nie mam pojęcia, obawiam się. –

+0

@MikeKeskinov W 2016 roku są używane. Wciąż przetwarzam te cholerne rzeczy, gdy przetwarzam dane zebrane z mediów społecznościowych. – sudo

1

Zakres selektorów wersji został wprowadzony w wersji 3.2 standardu Unicode i znajduje się w płaszczyźnie 0, podstawowej płaszczyźnie wielojęzycznej. Dalsze selektory można znaleźć w zakresie Variation Selectors Supplement.

Większość znaków Unicode może być reprezentowana przez szeroki wachlarz glifów, a w tekście pełnym można wskazać określony glif, wybierając konkretną czcionkę lub styl. Mechanizm ten nie jest dostępny w postaci zwykłego tekstu, więc wprowadzono selektory zmian, aby wskazać, że glify mające zastosowanie do określonego znaku powinny zostać zmienione lub ograniczone. Po znaku bazowym następuje selektor zmiany, kombinacja nazywana jest sekwencją zmian. Nie ma to być mechanizm ogólnego przeznaczenia, a jedynymi dozwolonymi sekwencjami zmian są te zdefiniowane w pliku Standardized Variants, który stanowi część bazy danych znaków Unicode.

Od http://www.alanwood.net/unicode/variation_selectors.html

3

Twoje przypuszczenie jest tak dobry jak mój .. ale według this source ...

enter image description here

ma go ...

Emotikon kodowania danych wskazówki: 1 W iOS 5/OSX 10.7, kod bazowy, że Apple OS generuje dla tego emotikonom został zmieniony. 2 Kod wygenerowany dla tego emoji został nieznacznie zmieniony w iOS 7/OSX 10.9 (dodano variation selector), aby ułatwić identyfikację tego emoji i pokazywanie go w systemie OSX i iOS. Nie mamy nic przeciwko Apple, dziękuję! Po prostu uwielbiamy nasze emotikony!

Ich wykres idzie zauważyć, że ten "nowy", po 10,9 wersja

ma z vs poprzedniego ... czy to pomaga.

+0

Strona zmieniła komunikat o selektorze zmian: "[Selektor zmian został dodany] doradzając systemowi wyświetlającemu styl emoji postaci zamiast tekstu czarno-białego, gdy jest dostępny." – im3r3k

+0

Dodali także dwa linki: http://www.unicode.org/L2/L2011/11438-emoji-var.pdf i http://unicode.org/reports/tr28/tr28-3.html#13_7_variation_selectors – im3r3k