2009-11-12 11 views
9

Mam ramkę danych df.all, a ja kreślę ją na wykresie słupkowym z ggplot2, używając poniższego kodu. Chciałbym zrobić tak, aby kolejność unikanych taktów została odwrócona. Oznacza to, że słupki oznaczone jako "Szeregowy" pojawiają się przed słupkami oznaczonymi "Liczba mnoga".Zmiana kolejności unikanych słupków w ggplot2 barplot

ggplot(df.all, aes(gram, V1, fill=number)) + 
    geom_bar(stat="identity", position="dodge") + 
    scale_x_discrete(labels=c("Grammatical","Ungrammatical")) + 
    scale_y_continuous(formatter="percent", limits=c(0,1)) + 
    facet_grid(. ~ experiment) + 
    scale_fill_hue("Attractor", breaks=c("S","P"), labels=c("Singular","Plural")) 

Próbowałem robić levels(df.all$number) = c("S", "P") myśląc, że może ggplot wykorzystuje kolejność poziomów decydować kolejność kreślenia, ale to nie działa. Nie jestem pewien, co jeszcze mogę spróbować. Jakieś pomysły?

Zawartość df.all, w przypadku jest przydatny:

> df.all 
    number gram  experiment  V1 
1  S G BERIMBAU_AGR_A 0.8133333 
2  S G BERIMBAU_AGR_B 0.8658537 
3  S U BERIMBAU_AGR_A 0.5436242 
4  S U BERIMBAU_AGR_B 0.4597701 
5  P G BERIMBAU_AGR_A 0.8580645 
6  P G BERIMBAU_AGR_B 0.8536585 
7  P U BERIMBAU_AGR_A 0.3087248 
8  P U BERIMBAU_AGR_B 0.3975904 

> str(df.all) 
'data.frame': 8 obs. of 4 variables: 
$ number : Factor w/ 2 levels "S","P": 2 2 2 2 1 1 1 1 
    ..- attr(*, "scores")= num [1:2(1d)] 0 -1 
    .. ..- attr(*, "dimnames")=List of 1 
    .. .. ..$ : chr "P" "S" 
$ gram  : Factor w/ 2 levels "G","U": 1 1 2 2 1 1 2 2 
$ experiment: Factor w/ 4 levels "BERIMBAU_AGR_A",..: 1 4 1 4 1 4 1 4 
$ V1  : num 0.813 0.866 0.544 0.46 0.858 ... 
+3

Myślę, że jest to błąd w ggplot2 - powinien respektować porządek danych (lub estetykę zamówienia) podczas omijania taktów, ale myślę, że nie. Trudno powiedzieć bez odtwarzalnego przykładu. – hadley

+0

Hadley, czy mogę przesłać Ci trochę danych i kodu? Jestem bardzo dobry w odtwarzaniu tego błędu :) – pealco

Odpowiedz

4

Hadley dostarczył rozwiązanie. Oto replikacja problemu i rozwiązania.

Celem jest sprawienie, aby paski oznaczone literą "S" pojawiały się przed kreskami oznaczonymi "P". Nie dzieje się to domyślnie, ponieważ R porządkuje poziomy alfabetycznie.

df <- read.csv("http://pealco.net/code/ggplot_dodge/df.txt") 
ggplot(df, aes(gram, V1, fill=number)) 
    + geom_bar(stat="identity", position="dodge") 

alt text http://pealco.net/code/ggplot_dodge/wrongorder.png

Jak Hadley komentuje w innym odpowiedź, "trzeba zmienić kolejność na podstawie zmiennych x, a nie zmiennej y". Chociaż nie jestem pewien, dlaczego to działa.

Aby odwrócić kolejność czynników w tym przykładzie, można przekonwertować współczynnik na liczbę i pomnożyć przez -1.

df <- with(df, df[order(gram, -as.numeric(number)), ]) 

Drukowanie ponownie pokazuje, że jego prace.

alt text http://pealco.net/code/ggplot_dodge/rightorder.png

ja nadal jak tak więcej wyjaśnień dlaczego df <- with(df, df[order(gram, -as.numeric(number)), ]) prac.

4

myślę df.all$number musi być uporządkowana czynnikiem. Wypróbuj df.all$number <- ordered(df.all$number)

+1

Tak, a następnie można ręcznie zmienić kolejność, używając opcji 'levels = c()' –

4

W niektórych przypadkach nie sądzę, jest to możliwe:

layerCake<-data.frame(group=c(rep("normal",4),rep("tumor",4)), 
         class=factor(rep(c("exon","intron","intergenic","unmapped"),2),levels=rev(c("exon","intron","intergenic","unmapped")),ordered=TRUE), 
         fraction=c(.02,.25,.50,.23,.015,.20,.555,.23) 
) 
layerCake[layerCake$group=='normal',"reads"]<-130948403*layerCake[layerCake$group=='normal',"fraction"] 
layerCake[layerCake$group=='tumor',"reads"]<-200948403*layerCake[layerCake$group=='tumor',"fraction"] 
g<-ggplot(layerCake, aes(x=factor(group),y=reads, fill=factor(class),order = as.numeric(class)))+xlab("Group")+scale_fill_discrete(name="Anno Class",breaks=c("exon","intron","intergenic","unmapped")) 

prawidłowa kolejność ułożone:
g + geom_bar (stat = "tożsamość", pozycja = "stos") enter image description here

błędna kolejność unik:

g+geom_bar(stat="identity",position="dodge") 

enter image description here

spróbujmy odwrócić kolejność ggplot:

g<-ggplot(lc, aes(x=factor(group),y=reads, fill=factor(class),order = -as.numeric(class)))+xlab("Group")+scale_fill_discrete(name="Anno Class",breaks=c("exon","intron","intergenic","unmapped")) 
g+geom_bar(stat="identity",position="dodge") 

nie ma kości

spróbujmy uporządkować ramki danych

lc <- with(lc, lc[order(-as.numeric(class)), ]) 
g<-ggplot(lc, aes(x=factor(group),y=reads, fill=factor(class),order = -as.numeric(class)))+xlab("Group")+scale_fill_discrete(name="Anno Class",breaks=c("exon","intron","intergenic","unmapped")) 
g+geom_bar(stat="identity",position="dodge") 

nope

0

zmieniających się poziomów czynnika naprawdę zmień kolejność unikanych pasków! Powszechne pułapki: kolory nadal pozostają w określonej pozycji, więc szybkie sprawdzenie sprawia, że ​​wygląda tak, jakby kolejność się nie zmieniła. Ale jeśli spojrzysz na wartości, zobaczysz, że porządek naprawdę się zmienił.

Edytuj: Moja poprzednia odpowiedź poniżej zmienia jedynie kolejność schematów kolorów nadanych paskom. Jest to wciąż przydatne, ponieważ często możemy chcieć odwrócić schemat kolorów w tym samym czasie, co zmiana kolejności słupków:

Używałem scale_fill_manual, ponieważ chciałem ręcznie wypełnić kolory moich pasków.

ggplot(data, aes_string(x = "countries", y = "population", fill = "agegroups")) + 
scale_fill_manual(values = CustomColorFunction(), limits = (levels(data$agegroups))) 

spędzony 5 godzin majstrować przy zmieniających się poziomów czynnika i aranżacji dataframe nadzieję, że to pomoże ktoś!

Powiązane problemy