Czy istnieje lepszy sposób na prefiks lub zmianę nazwy wszystkich lub wielu kolumn w tym samym czasie danego SparkSQL DataFrame
niż wywołanie wiele razy dataFrame.withColumnRenamed()
?Spark DataFrame i zmiana nazwy wielu kolumn (Java)
Przykładem może być, jeśli chcę wykryć zmiany (używając pełnego sprzężenia zewnętrznego). Zostałem mi z dwoma DataFrame
s o tej samej strukturze.
To więcej o Java API i Spark. Jako przykład 'select' oczekuje albo jednego parametru String, a następnie varargs lub tablicy' Column's, która nie jest spójna, a także czasami nieco denerwująca w użyciu. Musiałem stworzyć kilka metod pomocniczych, aby poradzić sobie z tym problemem, ale lepiej byłoby, gdyby te metody były bezpośrednio dostępne w 'DataFrame'. – JiriS
Istnieje inny przykład [tutaj] (http://stackoverflow.com/questions/32535273/how-to-match-dataframe-column-names-to-scala-case-class-attributes) –
Czy wypróbowałeś swój kod z Spark 2.0? Mam do czynienia z 7000 kolumnami, zobacz https://github.com/ramhiser/datamicroarray/wiki/Golub-(1999). Trwa to wiecznie (= nigdy się nie skończyło, zanim skończy się moja cierpliwość). – Boern