Mam plik danych i odpowiedni plik schematu przechowywany w oddzielnych lokalizacjach. Chciałbym załadować dane przy użyciu schematu w pliku schematu. Spróbowałem użyćPig: ładowanie pliku danych przy użyciu zewnętrznego pliku schematu
A= LOAD '<file path>' USING PigStorage('\u0001') as '<schema-file path>'
, ale otrzymałem błąd.
Jaka jest składnia poprawnego wczytywania pliku? Format pliku
Schemat jest coś takiego:
data1 - complex - - - - format - -
data1 event_type - - - - - long - "ends '\001'"
data1 event_id - - - - - varchar(50) - "ends '\001'"
data1 name_format - - - - - varchar(10) - "ends newline"