Chcę skopiować plik test.tar.gz z S3 na HDFS. Można to zrobić za pomocą distcp lub s3distcp. Ale moim wymaganiem jest to, że podczas przesyłania plików do HDFS powinienem wyodrębnić je w locie, aw HDFS powinienem mieć tylko wyodrębnione pliki nie tar.gz.Skopiuj i rozpakuj pliki z s3 na HDFS
Wszelkie sugestie proszę.
To jest dobra opcja. Ale nie powinienem używać żadnego lokalnego systemu plików do umieszczania pliku tar.gz. Jest to plik tar.gz w S3 i wyodrębniona struktura katalogów z plikami tylko w HDFS. – Ilango
tak i nie jest to również skalowalne – mtariq