2011-08-05 7 views
16

Próbuję zastąpić znaki w data.frame. Mam rozwiązanie dla tegoR: Zamień znaki używając gsub, jak utworzyć funkcję?

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) 
> df 
     var1 
1 aabbcdefg 
2 aabbcdefg 
> df$var1 <- gsub("a", "h", df$var1) 
> df$var1 <- gsub("b", "i", df$var1) 
> df$var1 <- gsub("c", "j", df$var1) 
> df$var1 <- gsub("d", "k", df$var1) 
> df$var1 <- gsub("e", "l", df$var1) 
> df$var1 <- gsub("f", "m", df$var1) 
> df 
     var1 
1 hhiijklmg 
2 hhiijklmg 
> 

ale chciałbym uniknąć stosując kilka gsub połączeń, byłoby o wiele ładniejszy produkować funkcję, aby to zrobić od razu? Jakieś pomysły na kontynuowanie?

Odpowiedz

20

Można tworzyć from i to wektory:

from <- c('a','b','c','d','e','f') 
to <- c('h','i','j','k','l','m') 

a następnie vectorialize się gsub funkcję:

gsub2 <- function(pattern, replacement, x, ...) { 
for(i in 1:length(pattern)) 
x <- gsub(pattern[i], replacement[i], x, ...) 
x 
} 

co daje:

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg")) 
> df$var1 <- gsub2(from, to, df$var1) 
> df 
     var1 
1 hhiijklmg 
2 hhiijklmg 
+1

@jrara Jak powinienem zmodyfikować kod, aby dokonać warunkowej wymiany? W poniższym przykładzie chcę zastąpić Mech, Oper i Eng, tylko wtedy, gdy są one skrócone i nie chcę ich zastąpić w pełnych słowach (tj. Nie Mech w mechanice lub Oper w operacjach) Oto przykład : 'from <- (" Mech "," Oper "," Eng ") do <- (" Mechanical "," Operations "," Engineer ") data.frame (var1 = c (" Mech "," Mechanical Engineer ") , "Oper", "Operacje")) ' – vatodorov

+0

Powinien być standardową funkcją, Świetnie! –

31

Chcesz chartr:

df$var1 <- chartr("abcdef", "hijklm", df$var1) 
df 
#  var1 
# 1 hhiijklmg 
# 2 hhiijklmg 
9

Jeśli nie chcesz używać chartr ponieważ podstawienia może być więcej niż jeden znak, a następnie innym rozwiązaniem jest użycie gsubfn z pakietu gsubfn (wiem, że to nie jest gsub, ale jest ekspansją na gsub). Oto jeden przykład:

> library(gsubfn) 
> tmp <- list(a='apple',b='banana',c='cherry') 
> gsubfn('.', tmp, 'a.b.c.d') 
[1] "apple.banana.cherry.d" 

Zamiennik może być również funkcją, która uwzględni mecz i zwróci wartość zastępczą dla tego meczu.