Przetwarzam plik csv za pomocą ateny AWS z kodu Java. Niektóre kolumny w CSV są typu daty, a jedna kolumna ma przecinek w wartości.Przetwarzanie CSV za pomocą ats atsna
Jeśli Athena tabela jest tworzona z
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
to jest w stanie analizować kolumny z przecinkiem poprawnie
jednak analizuje poprawnie, jeśli mogę użyć
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
Ale problem z OpenCSVSerde
polega na tym, że wymaga on wszystkich kolumny, które mają być typu danych ciąg i muszę przeprowadzić operacje daty w kwerendzie, więc nie można użyć OpenCSVSerde
.
Jakieś inne rozwiązanie? Proszę o pomoc!
dowiedziałeś się rozwiązanie –