Używam tego regex:podzielonego String, słowa w tym znaków akcentowanych
x.split("[^a-zA-Z0-9']+");
ta zwraca tablicę ciągów liter i/lub cyfr.
Jeśli używam to:
String name = "CEN01_Automated_TestCase.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
mam:
CEN01
Automated
TestCase
Java
Ale jeśli mogę użyć tego:
String name = "CEN01_Automação_Caso_Teste.java";
String[] names = name.Split.split("[^a-zA-Z0-9']+");
mam:
CEN01
Automa
o
Caso
Teste
Java
Jak mogę zmodyfikować to wyrażenie regularne, aby zawierało znaki akcentowane? (á, ã, õ, etc ...)
Jeśli Java obsługuje właściwości Unicode, "[^ \ p {L}]" będzie dość odporne. Nie wiem, czy to prawda ... – Wrikken
@Wrikken: Tak. Java 7 obsługuje nawet '\ w' i' \ b' w sensie Unicode. –
Miło, byłem po prostu leniwy, aby to sprawdzić, ale należycie odnotowany;) – Wrikken