Jak mogę wyeksportować DataFrame Sparka do pliku csv za pomocą Scala?Jak wyeksportować DataFrame do csv w Scala?
7
A
Odpowiedz
8
Najprostszym i najlepszym sposobem, aby to zrobić, jest użycie biblioteki spark-csv
. Możesz sprawdzić dokumentację w podanym linku, a here
jest przykładowym sposobem ładowania i zapisywania danych z/do DataFrame.
Code (Spark 1.4+):
dataFrame.write.format("com.databricks.spark.csv").save("myFile.csv")
Edit:
Spark tworzy częściowe pliki podczas zapisywania danych csv, jeśli chcesz połączyć się z części plików w pojedynczy CSV można znaleźć następujące:
1
Powyższe rozwiązanie powoduje eksportowanie pliku csv jako wielu partycji. Znalazłem inne rozwiązanie zero323 w tym stackoverflow page, które eksportuje ramkę danych do jednego pliku CSV.
df.coalesce(1)
.write.format("com.databricks.spark.csv")
.option("header", "true")
.save("/your/location/mydata.csv")
Powiązane problemy
- 1. jak wyeksportować ramkę danych tabeli w pyspark do pliku CSV?
- 2. Jak wyeksportować listę tablic do pliku csv w języku Python?
- 3. Jak wyeksportować dynamicznie wygenerowany tymczasowy plik CSV?
- 4. Zeppelin: Scala Dataframe do Pythona
- 5. Jak wyeksportować do pliku CSV lub JSON Excel - kątowa 2
- 6. Jak wyeksportować plik Excela z chińskimi znakami do pliku CSV?
- 7. Należy odpowiednio wyeksportować ciąg w/przecinki do pliku CSV
- 8. Konwersja pandy dataframe do csv ciąg
- 9. Zdecydowanie wpisany dostęp do CSV w scala?
- 10. Scala DataFrame: Eksplodować macierz
- 11. Jak wyeksportować plik CSV w formacie utf-8?
- 12. Pandy Dataframe CSV, jak uniknąć dodatkowych znaków cudzysłowu
- 13. Jak wyeksportować historię wersji gdoc do git?
- 14. Opcja Redis-cli --csv (eksport do csv)
- 15. "Plik CSV nie istnieje" - Pandas DataFrame
- 16. Jak używać Scala do parsowania danych CSV z pustymi kolumnami?
- 17. Jak wyeksportować base64 do pliku?
- 18. Importowanie pliku CSV w pand w dataframe pandy
- 19. wyeksportować dane dotyczące pliku CSV z aplikacji android
- 20. Uzyskiwanie pliku CSV Arkusza Google w Pandas Dataframe
- 21. Tabela pytań do pandy DataFrame
- 22. Jak wyeksportować Ruby Array z mojej konsoli Heroku do pliku CSV?
- 23. Jak stopić Spark DataFrame?
- 24. W SPSS, czy można wyeksportować plik zestawu danych do .CSV z nazwami wartości zamiast numerów wartości?
- 25. Jak wyeksportować wiki trac do wiki Githuba?
- 26. Jak wyeksportować dziennik git do pliku tekstowego?
- 27. Jak wyeksportować pełną tabelę SQL do XML
- 28. Jak wyeksportować pole obrazu do pliku?
- 29. Jak wyeksportować numpy ndarray do zmiennej łańcuchowej?
- 30. Rozszerzenie Chrome: Lokalna pamięć masowa, jak wyeksportować