Próbuję zapisać tysiące modeli wyprodukowanych przez ML Pipeline. Jak wskazano w odpowiedzi here, modele można zapisać następująco:Jak zapisywać modele z ML Pipeline na S3 lub HDFS?
import java.io._
def saveModel(name: String, model: PipelineModel) = {
val oos = new ObjectOutputStream(new FileOutputStream(s"/some/path/$name"))
oos.writeObject(model)
oos.close
}
schools.zip(bySchoolArrayModels).foreach{
case (name, model) => saveModel(name, Model)
}
Próbowałem, używając s3://some/path/$name
i /user/hadoop/some/path/$name
jak chciałbym modele mają być zapisywane na Amazon S3 końcu jednak oboje nie z komunikatami wskazującymi ścieżka nie może zostać znaleziona.
Jak zapisywać modele w Amazon S3?
to działa, ale kiedy modelka reload z HDFS, niektóre informacje zostaną utracone, takich jak rodzica itp ... –