2012-10-29 14 views
11

Mam ramki danych tak:wyjątkowy/sort w data.frame

x=c("01","01","01","22","22","03","03","03","35","35") 
y=c("f","f","f","m","m","m","m","m","f","f") 
df=data.frame(spn=x, sex=y) 

Wygląda:

spn sex 
1 01 f 
2 01 f 
3 01 f 
4 22 m 
5 22 m 
6 03 m 
7 03 m 
8 03 m 
9 35 f 
10 35 f 

Co chciałbym zrobić, to uporządkować i df $ SPN niech pojawia się tylko raz. odpowiedni df $ sex, jak również:

spn sex 
1 01 f 
2 03 m 
3 22 m 
4 35 f 

Jak mogę to zrobić? wielkie dzięki!

Odpowiedz

9
df <- df[order(df$spn), ] 
> df[!duplicated(df), ] 
    spn sex 
1 01 f 
6 03 m 
4 22 m 
9 35 f 
9
df2 = df[!duplicated(df), ] # Remove duplicated rows. 
df3 = df2[order(df2$spn), ] # Sort by the spn column. 

df3 
# spn sex 
#1 01 f 
#6 03 m 
#4 22 m 
#9 35 f 
+2

z punktu widzenia efektywności jest istotnie szybciej, jeśli duplikatów najpierw usunięta. – flodel

2

Zastosowanie unikalny następnie zamówienie:

df <- unique(df) 
df[order(df$spn), ] 
Powiązane problemy