Przeczytałem uważnie dokumentację CARET pod adresem: http://caret.r-forge.r-project.org/training.html, winiety i wszystko jest całkiem jasne (przykłady na stronie bardzo pomagają!), Ale nadal jestem zakłopotany relacją między dwoma argumenty trainControl
:CARET. Relacja między dzieleniem danych a trainControl
method
index
i współgranie między trainControl
i przecinania danych funkcji w karetki (np createDataPartition
, createResample
, createFolds
i createMultiFolds
)
lepsze dopasowanie mój pytania, pozwól mi użyć poniższy przykład z dokumentacji:
data(BloodBrain)
set.seed(1)
tmp <- createDataPartition(logBBB,p = .8, times = 100)
trControl = trainControl(method = "LGOCV", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Moje pytania są następujące:
Jeśli używam
createDataPartition
(co zakładam, że nie stratyfikacji instalacji programów), jak w powyższym przykładzie, i przekazuję wynik jakoindex
dotrainControl
czy muszę używaćLGOCV
jako metody w moim wywołaniutrainControl
? Jeśli używam innego (np.cv
) Jaką różnicę spowodowałoby to? W mojej głowie, po naprawieniuindex
, zasadniczo wybierasz rodzaj sprawdzania krzyżowego, więc nie jestem pewien, jaką rolę odegramethod
, jeśli używaszindex
.Jaka jest różnica między
createDataPartition
icreateResample
? Czy tocreateDataPartition
ma stratyfikowane ładowanie początkowe, podczas gdycreateResample
nie?
3) Jak to zrobić warstwowy k-krotnie (na przykład 10-krotny) przekroju walidacji za pomocą daszka? Czy zrobią to następujące rzeczy?
tmp <- createFolds(logBBB, k=10, list=TRUE, times = 100)
trControl = trainControl(method = "cv", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Interesujące. Dzięki! Mam trudności z mapowaniem odpowiedzi na moje pytania. Na tej podstawie, jaką rolę odegra tu tutaj "indeks"? –
@ user273158 co masz na myśli rolę indeksu? index to tylko ty tmp vector ... twoje partycje .. – agstudy
Hmm, ale w jaki sposób metoda taka jak 'boot' (bootstrapping) używa partycji określonych w' index'? Rozumiem bootstrapę jako metodę dla CV (przykład z wymianą na pociąg i oceniam, co zostało), ale nie w jaki sposób używa się 'index' w ładowaniu. –