Patrzę na ten samouczek: https://www.dataquest.io/mission/74/getting-started-with-kaggleCo dokładnie robi program KFold w python?
Mam do części 9, dzięki czemu prognozy. Tam nie ma pewnych danych w dataframe nazwie Titanic, który jest następnie dzielona w fałdach używając:
# Generate cross validation folds for the titanic dataset. It return the row indices corresponding to train and test.
# We set random_state to ensure we get the same splits every time we run this.
kf = KFold(titanic.shape[0], n_folds=3, random_state=1)
Nie jestem pewien, co to jest dokładnie to, co robi i rodzaj obiektu kf jest. Próbowałem czytać dokumentację, ale to nie pomogło. Ponadto są trzy fałdy (n_folds = 3), dlaczego w tym wierszu dostęp do pociągu i testu (a skąd wiem, że są one nazywane pociągiem i testem)?
for train, test in kf:
Rozumiem. Niezależnie od tego, czym jest n_folds, wciąż kończy się testowanie i zestaw treningowy. Jeśli n_folds wynosi 2, po prostu używasz połowę danych do szkolenia, a druga połowa do testowania, a następnie zamieniasz je. Czy rozumiem to poprawnie? – user
Tak. Otrzymasz fałd i'th (1 <= i <= n_fold) jako test, a pozostałe fałdy jako trening. – qmaruf