2013-07-18 15 views
7

Załóżmy, że mam tej działki:najprostszy sposób na dyskretyzację ciągłych skal dla skali kolorów ggplot2?

ggplot(iris) + geom_point(aes(x=Sepal.Width, y=Sepal.Length, colour=Sepal.Length)) + scale_colour_gradient()

co jest poprawny sposób discretize skali kolorów, jak działki pokazanej poniżej przyjętego odpowiedzi tutaj (gradient breaks in a ggplot stat_bin2d plot)?

ggplot poprawnie rozpoznaje dyskretne wartości i używa dla nich dyskretnych skal, ale moje pytanie brzmi, czy masz ciągłe dane i chcesz mieć dyskretny pasek kolorów (z każdym kwadratem odpowiadającym wartości, a kwadraty w kolorze w gradiencie)), jaki jest najlepszy sposób na zrobienie tego? Czy dyskretyzacja/binning ma miejsce poza ggplotem i zostać umieszczona w ramce danych jako osobna kolumna o wartości dyskretnej, czy jest jakiś sposób, aby to zrobić w ggplot? przykładem tego, co szukam jest podobna do skali przedstawionej tutaj: enter image description here

wyjątkiem Mam kreślenia wykres punktowy, a nie coś podobnego geom_tile/mapę cieplną.

dzięki.

Odpowiedz

9

Rozwiązanie jest nieco skomplikowane, ponieważ chcesz mieć dyskretną skalę. W przeciwnym razie możesz po prostu użyć round.

library(ggplot2) 

bincol <- function(x,low,medium,high) { 
    breaks <- function(x) pretty(range(x), n = nclass.Sturges(x), min.n = 1) 

    colfunc <- colorRampPalette(c(low, medium, high)) 

    binned <- cut(x,breaks(x)) 

    res <- colfunc(length(unique(binned)))[as.integer(binned)] 
    names(res) <- as.character(binned) 
    res 
} 

labels <- unique(names(bincol(iris$Sepal.Length,"blue","yellow","red"))) 
breaks <- unique(bincol(iris$Sepal.Length,"blue","yellow","red")) 
breaks <- breaks[order(labels,decreasing = TRUE)] 
labels <- labels[order(labels,decreasing = TRUE)] 


ggplot(iris) + 
    geom_point(aes(x=Sepal.Width, y=Sepal.Length, 
       colour=bincol(Sepal.Length,"blue","yellow","red")), size=4) + 
    scale_color_identity("Sepal.Length", labels=labels, 
         breaks=breaks, guide="legend") 

enter image description here

+0

Czy kolejność etykiet działać, jeśli istnieją liczby ujemne w zmiennej używane do barwienia? – gvrocha

5

Można wypróbować następujące, mam swoją przykładowy kod zmodyfikowany odpowiednio poniżej:

#I am not so great at R, so I'll just make a data frame this way 
#I am convinced there are better ways. Oh well. 
df<-data.frame() 
for(x in 1:10){ 
    for(y in 1:10){ 
    newrow<-c(x,y,sample(1:1000,1)) 
    df<-rbind(df,newrow) 
    } 
} 
colnames(df)<-c('X','Y','Val') 


#This is the bit you want 
p<- ggplot(df, aes(x=X,y=Y,fill=cut(Val, c(0,100,200,300,400,500,Inf)))) 
p<- p + geom_tile() + scale_fill_brewer(type="seq",palette = "YlGn") 
p<- p + guides(fill=guide_legend(title="Legend!")) 

#Tight borders 
p<- p + scale_x_continuous(expand=c(0,0)) + scale_y_continuous(expand=c(0,0)) 
p 

Uwaga strategicznego wykorzystania cięcia do dyskretyzacji danych stosowane przez wykorzystanie koloru piwowar, żeby wszystko było piękne.

Wynik wygląda następująco.

2D heatmap with discretized colour

+0

Podoba mi się to, ale zastanawiam się, czy istnieje sposób na oznaczenie skali, jak w przykładzie pokazanym w pytaniu. Dokładniej: w jaki sposób można uzyskać skrajności w punktach między "warstwami" koloru? – gvrocha

Powiązane problemy