Próbuję nauczyć się Sparka używając Pythona (Pyspark). Chcę wiedzieć, jak działa ta funkcja. To, co Input bierze i jaki wynik daje. Nie mogłem znaleźć odpowiedniego przykładu z internetu. Powiedzmy, mam obiekt RDD zawierający listy, takie jak poniżej.Jak działa funkcja Pyspark mapPartitions?
[ [1, 2, 3], [3, 2, 4], [5, 2, 7] ]
I chcę, aby usunąć element 2 ze wszystkich list, jaki chciałbym osiągnąć stosując mapPartitions
.
Dlaczego nie zwrócisz niczego w filterOut2FromPartition f namaszczenie. Po drugie, czy jest jakieś słowo kluczowe w pythonie? Myślę, że chciałeś powiedzieć final.iterator = [] zamiast final_iterator. – MetallicPriest
Naprawiono problemy – bearrito
Próbowałem zaimplementować to, ale dostaję błąd "obiekt listy nie jest iteratorem". Myślę również, że kiedy napisałeś [x dla x w linii, jeśli x! = 2], myślę, że chodziło ci o [x dla x na liście, jeśli x! = 2]. Użyłem tam listy. – MetallicPriest