Moje ograniczone rozumienie Redshift to mój plan radzenia sobie z moim problemem ...Jak używać danych wyjściowych zapytania RedShift jako wejścia do zadania EMR?
Chcę pobrać wyniki zapytania i wykorzystać je jako dane wejściowe dla zadania EMR. Jaki jest najlepszy sposób na to programowo.
Obecnie moje zadanie EMR przyjmuje płaski plik z S3 jako dane wejściowe, a ja używam zestawu SDK Amazon Java, aby ustawić to zadanie i wszystko.
Czy powinienem zapisać dane wyjściowe mojego zapytania RedShift do S3 i wskazać tam moje zadanie EMR, a następnie usunąć plik po zakończeniu zlecenia EMR?
A może RedShift i AWS SKD oferują bardziej pomysłowy sposób bezpośredniego przesłania zapytania z RedShift do EMR, wycinając krok S3?
Dzięki
Ostatnio rozmawiałem z memebers Amazonki redshifcie Team, mówili rozwiązanie tego jest w pracach.