Wiem, że jest oznaczony Scala, ale tylko dodać na stronie Pythona w przypadku gdy ktoś jest ciekawy. Tworzenie i zapisać jako RDD jest
rdd_of_tuples = sc.parallelize([('one',1),('two',2)])
rdd_of_tuples.saveAsTextFile('/user/cloudera/rdd_of_tuples')
to uratuje wiersze tak jak wspomniałeś
('one', 1)
Ale jeśli wykonaj następujące czynności powinno działać
rdd_of_text = rdd_of_tuples.map(lambda (x,y): x + ',' + str(y)).saveAsTextFile('/user/cloudera/rdd_of_text')
i powinieneś dostać
one,1
pamiętać, że w tym konkretnym przypadku trzeba zdawać sobie sprawę z typów na złączenie (sprawdź STR (y)), w przeciwnym razie uzyskasz następujący wyjątek:
TypeError: cannot concatenate 'str' and 'int' objects
@ Jeśli masz komentarz, użyj pola komentarza i nie edytuj odpowiedzi! Również kod, który zasugerowałeś w edycji, nie jest związany z pytaniem tutaj. Twój kod działa z RDD [Wiersz], co nie ma tu miejsca. – eliasah