Przeprowadzam regresję logistyczną za pomocą tego page. Mój kod jest jak poniżej.R regresja logistyczna pod krzywą
mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
mylogit <- glm(admit ~ gre, data = mydata, family = "binomial")
summary(mylogit)
prob=predict(mylogit,type=c("response"))
mydata$prob=prob
Po uruchomieniu tego kodu ramka danych mydata ma dwie kolumny - 'admit' i 'prob'. Czy te dwie kolumny nie powinny wystarczyć, aby uzyskać krzywą ROC?
Jak uzyskać krzywą ROC.
Po drugie, przez loooking w mydata, wydaje się, że model przewiduje prawdopodobieństwo admit=1
.
Czy to prawda?
Jak dowiedzieć się, które konkretne zdarzenie przewiduje model?
Dzięki
UPDATE: Wydaje się, że poniżej trzech komend są bardzo przydatne. Zapewniają odcięcie, które będzie miało maksymalną dokładność, a następnie pomoże uzyskać krzywą ROC.
coords(g, "best")
mydata$prediction=ifelse(prob>=0.3126844,1,0)
confusionMatrix(mydata$prediction,mydata$admit
Nie byłoby bardzo proste, aby sprawdzić swoją niepewność o tym, co jest przewidywane przy użyciu małego zestawu danych? Lub po prostu spójrz na wyniki 'with (mydata, table (admit, gre))? Regresja logistyczna jest tylko oszacowaniem na kilka stołów.) –
tak ... możemy to zrobić .. i zastosowałem tę samą metodę, aby dojść do wniosku, że w obecnym przypadku przewiduje się przyznanie = 1.. Ale myślałem, że R będzie miał skrót, który potwierdzi moje myślenie. Każdy komentarz na temat ustalenia progu, który da maksymalną dokładność z obiektu roc? – user2543622
w odniesieniu do "Jakiekolwiek uwagi dotyczące ustalenia progu, który da maksymalną dokładność z obiektu roc?": Myślę, że odpowiedź brzmi: coords (g, "best") ... – user2543622