Interfejs API 1.6 (scala) SparkSQL
ma funkcje przecinające się i wykluczające różnicę. Oczywiście, kombinacja unii i oprócz może być użyta do wygenerowania różnicy:Jak uzyskać różnicę między dwoma elementami DataFrames?
df1.except(df2).union(df2.except(df1))
Ale wydaje się to trochę niezręczne. Z mojego doświadczenia, jeśli coś wydaje się niezręczne, jest lepszy sposób na zrobienie tego, szczególnie w Scali.
Dzięki. Gdyby tam był, i tak prawdopodobnie zrobiłby coś takiego pod kołdrą. – WillD