5
Mając Dataset<Row>
z pojedynczej kolumny ciągów json:analizowania zestawu danych kolumnę JSON do DataSet <Row>
+--------------------+
| value|
+--------------------+
|{"Context":"00AA0...|
+--------------------+
Json próbki:
{"Context":"00AA00AA","MessageType":"1010","Module":"1200"}
Jak mogę najefektywniej dotrzeć Dataset<Row>
, który wygląda tak:
+--------+-----------+------+
| Context|MessageType|Module|
+--------+-----------+------+
|00AA00AA| 1010| 1200|
+--------+-----------+------+
Przetwarzam te dane w stre am, wiem, że iskra może to zrobić za niego siebie, gdy czytam go z pliku:
spark
.readStream()
.schema(MyPojo.getSchema())
.json("src/myinput")
ale teraz czytam dane z Kafki i to daje mi dane w innej formie. Wiem, że mogę używać niektórych parserów takich jak Gson, ale chciałbym, aby iskra zrobiła to za mnie.
ty za odpowiedź. Domyślam się, że to zadziała, ale naprawdę nie podoba mi się pomysł wysłania DF ponownie do czytnika :( –