używam wieprzowych do generowania grupy z krotek w następujący sposób:PIG: Zbierz wszystkie krotki z zgrupowane worka
a1, b1
a1, b2
a1, b3
...
->
a1, [b1, b2, b3]
...
Jest to łatwe i działa. Ale mój problem jest, aby co następuje: Z otrzymanych grup chciałbym wygenerować zbiór wszystkich krotek w worku grupy:
a1, [b1, b2, b3]
->
b1,b2
b1,b3
b2,b3
byłoby to łatwe, jeśli mogłem Gniazdo „foreach” i po pierwsze powtórzyć, nad każdą grupą, a następnie nad torbą.
Przypuszczam, że nie rozumiem tego pojęcia i doceniam twoje wyjaśnienie.
Dzięki.
Laurens ma rację. Ten UDF robi dokładnie to, czego potrzebujesz i jest także o wiele bardziej wydajny niż czysty roztwór oparty na świni przy użyciu kartezjańskiego produktu. Nawiasem mówiąc, adres URL został zmieniony: [UnorderedPairs] (http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/UnorderedPairs.html) – matterhayes