Przeprowadzam regresję danych spisowych, w których moją zmienną zależną jest długość życia i mam osiem zmiennych niezależnych. Dane są agregowane przez miasta, więc mam wiele tysięcy obserwacji.Jak ustawić ważone najmniejsze kwadraty w r dla danych heteroscedastycznych?
Mój model jest jednak nieco heterosecedastyczny. Chcę prowadzić ważone najmniejsze kwadraty, w których każda obserwacja jest ważona przez populację miasta. W tym przypadku oznaczałoby to, że chcę ważyć obserwacje przez odwrotność pierwiastka kwadratowego populacji. Nie jest dla mnie jasne, jaka byłaby najlepsza składnia. Obecnie mam:
Model=lm(…,weights=(1/population))
Czy to prawda? Czy powinno być:
Model=lm(…,weights=(1/sqrt(population)))
(znalazłem to pytanie tutaj. Weighted Least Squares - R ale to nie wyjaśnia w jaki sposób R interpretuje argument ciężary)
Jeśli chcesz waga według odwrotności pierwiastka kwadratowego populacji, jaki byłby argument dla opcji 1 względem opcji 2? – joran
Myślę, że to jest źródło tego pytania - czy R interpretuje argumenty wag dalej? –