Spark zapewnia metodę saveAsTextFile
, która może przechowywać RDD[T]
na dysku lub hdfs łatwo.Jak załadować dane z zapisanego pliku za pomocą Spark
T jest dowolną klasą serializowalną.
Chcę cofnąć operację. Zastanawiam się, czy istnieje loadFromTextFile
, który może z łatwością załadować plik do RDD[T]
?
Pozwól mi jasno:
class A extends Serializable {
...
}
val path:String = "hdfs..."
val d1:RDD[A] = create_A
d1.saveAsTextFile(path)
val d2:RDD[A] = a_load_function(path) // this is the function I want
//d2 should be the same as d1
Ale to generuje RDD [ciąg], muszę RDD [T]. – worldterminator
Myślę, że Spark domyślnie nie obsługuje tego. Ale możesz przekonwertować oryginalny RDD na określony typ. Aktualizuję moją odpowiedź. Proszę zweryfikuj. – Ramana