Zostałem poproszony o opracowanie modelu regresji patrząc na zapisy uczniów w różnych programach. Jest to bardzo ładny, czysty zestaw danych, w którym liczenie rejestrów jest zgodne ze studnią dystrybucyjną Poissona. Dopasowuję model do R (używając zarówno GLM, jak i Zero Inflated Poisson). Wynikowe pozostałości wydawały się rozsądne.Regresja dla zmiennej Rate w R
Zostałem jednak poinstruowany, aby zmienić liczbę uczniów na "stawkę", która została obliczona jako liczba uczniów/uczniów (Każda szkoła ma własną populację).) Nie jest to już zmienna licząca, ale proporcja pomiędzy 0 a 1. Jest to uważane za "część rejestracji" w programie.
Ta "stopa" (studenci/populacja) nie jest już Poissonem, ale z pewnością nie jest normalna. Tak więc jestem trochę zagubiony co do odpowiedniej dystrybucji i kolejnego modelu, który ją reprezentuje.
Rozkład logarytmiczny wydaje się dobrze pasować do tego parametru szybkości, jednak mam wiele wartości 0, więc nie będzie on pasował.
Wszelkie sugestie dotyczące najlepszej formy dystrybucji dla tego nowego parametru i jak go zamodelować w R?
Dzięki!
Myślę, że jest to przypadek użycia zmiennej ekspozycji/offsetu (http://en.wikipedia.org/wiki/Poisson_regression#.22Exposure.22_and_offset). I, być może, pytanie do http://stats.stackexchange.com/ – Rcoster
przekierowane na r-help: http://thread.gmane.org/gmane.comp.lang.r.general/291112 –