Używam spark-1.3.1 (pyspark) i wygenerowałem tabelę za pomocą zapytania SQL. Mam teraz obiekt, który jest DataFrame. Chcę wyeksportować ten obiekt DataFrame (nazwałem go "table") do pliku csv, aby móc nim manipulować i narysować kolumny. Jak wyeksportować "tabelę" DataFrame do pliku csv?jak wyeksportować ramkę danych tabeli w pyspark do pliku CSV?
Dzięki!
Super odpowiedź. W przypadku pierwszej opcji, czy jest to możliwe, jeśli chcę pisać do pliku rozdzielanego potokami, a nie do pliku CSV z oddzielonymi przecinkami? –
Jeśli masz iskrowskie ramki danych, możesz użyć 'df.write.csv ('/ tmp/lookatme /')', co spowoduje upuszczenie zestawu plików csv w '/ tmp/lookatme' Używanie iskry jest znacznie szybsze niż serializowanie w pandach. Jedyną wadą jest to, że otrzymasz zestaw csv zamiast pojedynczego, a jeśli narzędzie docelowe nie wie, jak je łączyć, musisz to zrobić samodzielnie. – Txangel
Co za wielki problem, aby uzyskać csv z iskry. Coś interesującego w tym pierwszym rozwiązaniu polega na tym, że 'to_csv' działa bez potrzeby importowania Pand. '.toPandas' jest częścią Sparka, może to domyślnie importuje .. – cardamom