Używam listadmin do zarządzania wieloma listami adresowymi opartymi na listach. Mam długą listę tematów i adresów skonfigurowanych do blokowania spamu. Niedawno otrzymał inteligentniejsze spamu w tym sensie, że wykorzystuje ładną znaków Unicode, np:Perl: Jak dopasować FULLWIDTH LATIN SMALL
Temat: Al l ad ULT mov y ty”ve zobaczyć nCzy nic c ompari- ng do naszej Exx xci ti ng kompilacja 13 000 mov mov ies w HD t h są dostępne dla ciebie teraz!
lub
Temat: HD qua świeci y vi d EOS z d pho na wykresie s o f ho tc hic ks
są tutaj u
Teraz chcę użyj sprytnego wyrażenia Perla, aby to zablokować. Rurowanie tych obiektów do heksowego dysku ujawniło wiele znaków: FULLWIDTH LATIN SMALL LETTER. Jednak \p{FULLWIDTH LATIN SMALL LETTER}
nie działa: Can't find Unicode property definition "FULLWIDTH LATIN SMALL LETTER"
Pytanie brzmi: czy istnieje \p{something}
, aby dopasować te znaki o pełnej szerokości? Alternatywnie: czy istnieje inny sposób na dopasowanie tych znaków?
Dziękujemy @ikegami za pouczającą edytować i zabawny modułu on połączony. – amon
To jedna z tchristów. 'unichars' może być użyty do odwrotu. na przykład 'unichars -au '\ p {InHalfwidthAndFullwidthForms}'' wyświetla znaki w bloku HalfwidthAndFullwidthForms. – ikegami