Próbuję wydobyć znaków przed i po znaku „/” za pomocą R.Wyciąg znaków aż do „/” za pomocą R
Na przykład, można uzyskać z następujących tagów:
s <- "hello/JJ world/NN"
# get the tags
sapply(s, function(x){gsub("([a-z].*?)/([A-z].*?)", "\\2", x)})
która zwraca
"JJ NN"
jednak, gdy staram się wydobyć znaki przed „/” lub „żetonów”, przy użyciu następujących:
sapply(s, function(x){gsub("([a-z].*?)/([A-z].*?)", "\\1", x)})
uzyskać
"helloJ worldN"
Jak mogę dostać "Hello World" i dlaczego jest pierwszą literą z tagiem poślizgu w środku?
używasz sapply na wektorze o długości jeden. dlaczego nie tylko 'gsub ('/ [az] +', '', s, ignore.case = TRUE)' i 'gsub ('[az] + /', '', s, ignore.case = TRUE)' ? – rawr
Spróbuj 'gsub ('/ \\ w +', '', s)' – akrun