2012-11-12 23 views
8

Mam plik, który zawiera dane szeregów czasowych dla wielu zmiennych od a do k.Wykreślanie średniej wielu zmiennych w szeregach czasowych przy użyciu ggplot

Chciałbym utworzyć wykres, który kreśli średnią ze zmiennych od a do k w czasie i powyżej oraz poniżej tej średniej linii, dodaje wygładzony obszar przedstawiający maksymalną i minimalną zmianę każdego dnia.

Coś w rodzaju przedziałów ufności, ale w wersji wygładzonej.

Oto zestaw danych: https://dl.dropbox.com/u/22681355/co.csv

i oto kod mam tak daleko:

library(ggplot2) 
library(reshape2) 
meltdf <- melt(df,id="Year") 
ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) + geom_line() 
+2

Czy możesz podać przykład starego zestawu danych? – jackb

Odpowiedz

8

This przedstawia bootstrapped 95% przedziały ufności:

ggplot(meltdf,aes(x=Year,y=value,colour=variable,group=variable)) + 
    stat_summary(fun.data = "mean_cl_boot", geom = "smooth") 

ggplot smoothed bootstrap confidence

Przedstawia to t miał na myśli wszystkich wartości wszystkich zmiennych + -1SD:

ggplot(meltdf,aes(x=Year,y=value)) + 
    stat_summary(fun.data ="mean_sdl", mult=1, geom = "smooth") 

enter image description here

może chcesz obliczyć rok przed obliczeniem oznacza środki i SD ciągu zmiennych, ale zostawiam to do ciebie.

Uważam jednak, że przedział ufności boostrob byłby bardziej sensowny, ponieważ rozkład wyraźnie nie jest symetryczny. Byłoby również węższe. ;)

Oczywiście możesz również przekształcić wartości w log.

+0

Roland dziękuję, może nie byłem jasny, ale to, co chciałbym zrobić, to narysować średnią wszystkich tych zmiennych, a zamiast przedziałów ufności ma zacienione obszary dla każdego dnia, które reprezentują wariację od a do k powyżej i poniżej średnia dla każdego dnia. – user1723765

+0

Nie wiem, co masz na myśli przez "wariację powyżej i poniżej średniej". – Roland

+0

1. bierzesz średnią a-k i spiskujesz ją dla każdego dnia. 2. każdego dnia będziesz mieć niektóre zmienne a-k powyżej i poniżej tej średniej. Chciałbym mieć zacieniony obszar pokazujący, ile wariacji jest wokół średniej. – user1723765

Powiązane problemy