Próbuję modelować czas życia klienta w subskrypcjach. Ponieważ dane są cenzurowane, będę używał pakietu przetrwania R, aby stworzyć krzywą przetrwania.Jak wprowadzić ocenzurowane dane do modelu przetrwania R?
Oryginalny subskrypcje zbiór danych wygląda następująco ..
id start_date end_date
1 2013-06-01 2013-08-25
2 2013-06-01 NA
3 2013-08-01 2013-09-12
Które manipulować wyglądać tak ..
id tenure_in_months status(1=cancelled, 0=active)
1 2 1
2 ? 0
3 1 1
..w aby nakarmić model przetrwania
obj <- with(subscriptions, Surv(time=tenure_in_months, event=status, type="right"))
fit <- survfit(obj~1, data=subscriptions)
plot(fit)
Co mam wstawić zmienną tenure_in_months dla przypadków konsorcjalnych, tj. Przypadków, w których subskrypcja jest nadal aktywna dzisiaj - czy powinna to być kadencja do dziś, czy powinna być NA?
Powinno to być do dnia, w którym zebrałeś swoje dane, myślę, że to "dzisiaj". – drevicko