19
Mam proste wiersz:Konwersja prosty jeden liniowy ciąg RDD w Spark
line = "Hello, world"
chciałbym, aby przekształcić go do RDD z tylko jednego elementu. Próbowałem
sc.parallelize(line)
Ale to dostać:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
pomysłów?
Faktycznie, używając sc.parallelize ([linia]) zbieranie() pracował. – poiuytrez
w moim env (scala 2.10.3 spark-1.0.0) sc.parallelize ([line]). Collect() nie działa – michaeltang
Zapomniałem określić, że używam Pythona API. – poiuytrez