2012-09-17 10 views
7

Właśnie zacząłem się uczyć R i potrzebuję pomocy w znalezieniu średniej i mediany reszty dla moich danych. I oblicza LM i w podsumowaniu mogę pozostałości jak następuje:średnia i mediana reszt z modelu liniowego

min  1Q  median 3Q  Max 
-111.86 -34.90  -7.6 33.46 182.58 

Pytanie: tak mediana reszt wynosi -7,6 ale która jest moją średnią? Czy istnieją obliczenia dotyczące znalezienia średniej i mediany reszty? miałem zamiar zrobić oznaczać (RESID (trees.lm), czy też powinna być wprowadzona jako średnią (trees.lm $ resid)

Proszę wyjaśnić, ponieważ moi koledzy wszystkie uzyskać różne odpowiedzi dla tego samego zestawu danych.

Odpowiedz

6

odpowiedź na jedno konkretne pytanie jest tutaj:.

mean(resid(trees.lm)) 

nie należy zagłębić wyposażonych obiektów modelowych, takich jak ten i rozebrać się dowolne komponenty Robi tak na coś nieco bardziej skomplikowanego jak GLM będzie gryźć odkładaj, gdy zdasz sobie sprawę, że właśnie wyodrębniłeś robocze pozostałości przez:

glm.mod.obj$residuals 

, które prawdopodobnie nie będą dla ciebie przydatne.

Nawet proste rzeczy jak lm() obiektów, co korzystających resid() lub dostępu $residuals mogą być różne w zależności od tego, jak model został wyposażony (co było ustawienie dla na.action argumentu na przykład?).

Ponadto model liniowy zakłada, że ​​reszty to i.i.d. Gaussowskie (lub normalne) zmienne losowe o średniej 0 i wariancji $ \ hat {\ sigma}^2} $, więc średnia powinna być bardzo bliska 0 (tj. Bardzo, bardzo, bardzo bliska 0, ale nie dokładnie, ponieważ jest to komputer w arytmetyce zmiennoprzecinkowej jest w grze).

+2

Bez względu na to, jak model będzie pasował, średnia z wartości rezydualnych będzie bliska zeru. To nie powinno dziwić w OLS. – Max

+0

Ups, miałem coś innego w głowie, kiedy to pisałem i masz rację. Edytuję moją głupotę. –

+0

W OLS suma wartości rezydualnych jest dokładnie równa zeru. Jest to właściwość minimalizowania kwadratów reszt. –