Wszystko działa prawidłowo lokalnie kiedy zrobić w następujący sposób: cat input | python mapper.py | sort | python reducer.py
Jednak gdy uruchamiam zadanie strumieniowe MapReduce na AWS Elastic Map
Utworzyłem Hive stolik poprzez interaktywną sesję Elastic MapReduce i zaludnionych go z pliku CSV tak: CREATE TABLE csvimport(id BIGINT, time STRING, log STRING)
ROW FORMAT DELIMITED
FIELDS TERMINAT