Próbuję wykonać operację związaną z przepływem danych. Czy istnieje przykładowy kod do łączenia dwóch PCollections w Dataflow?Jak wykonać połączenie w przepływie danych?
5
A
Odpowiedz
6
Prostym sposobem na zrobienie tego byłoby połączenie Flatten() z RemoveDuplicates() w taki sposób. W zależności od tego, czy chcesz unię odłączony lub set-teoretyczną unię, wywołanie RemoveDuplicates można pominąć:
PCollection<String> pc1 = ...;
PCollection<String> pc2 = ...;
PCollection<String> union = PCollectionList.of(pc1).and(pc2)
.apply(Flatten.<String>create())
.apply(RemoveDuplicates.<String>create());
-1
Jeśli masz więcej niż dwie kolekcje, wygodnym rozwiązaniem jest, aby wypełnić listę PCollection, zrób PCollectionList na podstawie tego i Spłaszczenia:
Mam nadzieję, że to pomoże.
Powiązane problemy
- 1. C# - Jak wykonać połączenie HTTP
- 2. Jak programowo wykonać połączenie telefoniczne?
- 3. Usuwanie duplikatów w przepływie danych SSIS
- 4. Jak wykonać połączenie weryfikacyjne OAuth Echo?
- 5. Jak wykonać/symulować trwałe połączenie TCP?
- 6. jak wykonać zewnętrzne połączenia z bazami danych?
- 7. Jak mogę wykonać połączenie telefoniczne w Celu C?
- 8. Jak wykonać fputcsv "echo" danych
- 9. Jak wpisać, sprawdź obiekt Date w przepływie?
- 10. Jak zdobyć $ Przyczyna w przepływie pracy
- 11. Jak napisać niestandardowy moduł warstwowy w przepływie tensora?
- 12. Prosta zmienna w przepływie sieciowym
- 13. Przekazywanie tablic zmiennych w przepływie
- 14. android - Jak wykonać połączenie telefoniczne z poziomu przeglądarki internetowej
- 15. Jak wykonać połączenie RTTI z interfejsem funkcji safeecall?
- 16. Cakephp Jak zmienić połączenie z bazą danych
- 17. Strumienie Akka. Stan stanowy w przepływie
- 18. Czy w Netbeans można wykonać połączenie SSH dla projektów PHP?
- 19. Ile danych powinno odzyskać jedno połączenie JSON?
- 20. Prowadzenie otworzyć połączenie z bazą danych MongoDB
- 21. połączenie bazy danych sqlite golang
- 22. ActiveRecord wykonać SQL należy zamknąć połączenie? DEPRECATION OSTRZEŻENIE: Połączenia z bazami danych nie zostaną automatycznie zamknięte.
- 23. połączenie bazy danych Oracle w web.config asp.net
- 24. jak wykonać wiele danych-NG-aplikację w sekwencji w angularjs
- 25. Rozszerzenie klasy żądania ekspresowego w Przepływie
- 26. Praktyki obsługi błędów w przepływie integracji wiosennej
- 27. Przełączanie fragmentów w przepływie nadrzędnym/szczegółowym
- 28. Jak długo utrzymuje się połączenie z bazą danych MySQL PHP?
- 29. Jak sprawdzić, czy połączenie z bazą danych w Laravel 4?
- 30. Jak przetestować połączenie z bazą danych w pythonie?
Zastanawiam się, czy dobrym pomysłem byłoby dodanie kolejnego RemoveDuplicates przed spłaszczeniem, na wypadek gdyby w każdej kolekcji pojawiły się również duplikaty? tj. PCollectionList.of (pc1.apply (RemoveDuplicates)) oraz (pc2.apply (RemoveDuplicates)) - czy optymalizator mógłby się tym zająć? – jkff
Myślę, że "Spłaszcz". Utwórz "powinien być" Spłaszcz. utworzyć " –
redtuna
@redtuna naprawione, dziękuję! –