Więc moje dane wejściowe ma dwa pola/kolumny: ID1 & ID2, a mój kod jest następujący:Skalowanie: Jak zachować inne pole po grupie ("pole").
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
Wyniki uzyskane w (co zakładam) dwóch dziedzinach: ID2 size *. Trochę utknąłem na tym, aby dowiedzieć się, czy możliwe jest zachowanie wartości id1, która została również zgrupowana z id2 i dodać ją jako inne pole?
Proszę zobaczyć, czy to ma sens, czuję ten sam ból. http://stackoverflow.com/questions/25994879/scalding-flatten-fields-after-groupby – Sergey