Znalazłem metodę glom()
na RDD. Zgodnie z dokumentacjąCo to jest glom ?. Czym różni się od mapPartitions?
zwróci RDD stworzony przez koalescencyjny wszystkie elementy wewnątrz każdej partycji na tablicę
Czy glom
przetasować danych między partycjami czy też tylko zwrócić dane z partycji tablicy? W tym drugim przypadku uważam, że to samo można osiągnąć przy użyciu mapPartitions
.
Chciałbym również wiedzieć, czy istnieją przypadki użycia, które korzystają z glom
.
@ zero323 wyjaśnione w miły sposób ... chciałem dodać imp. przechylić tj 'glom' jest przydatna, gdy chcemy realizować operacje RDD użyciu biblioteki macierzy, które są zoptymalizowane do działania na macierzach –