Próbuję włączyć złe pomijanie na wejściach w moich ofertach Amazon Elastic MapReduce. Śledzę wspaniały przepis opisany tutaj:Ustawianie parametrów hadoop za pomocą boto?
http://devblog.factual.com/practical-hadoop-streaming-dealing-with-brittle-code
Powyższy link mówi, że muszę się jakoś ustawić następujące parametry konfiguracyjne na pracy EMR:
mapred.skip.mode.enabled=true
mapred.skip.map.max.skip.records=1
mapred.skip.attempts.to.start.skipping=2
mapred.map.tasks=1000
mapred.map.max.attempts=10
Jak mogę ustawić te (i inne) parametry mapred.XXX w JobFlow za pomocą Boto?
Dzięki! To działało dla mnie. Czasami działa, gdy określam te same parametry za pomocą ["-D", "..."] dla tego samego zestawu wartości z "krokiem" zamiast z ładowaniem początkowym, ale dodanie tego kroku ładowania początkowego wydaje się powodować ten punkt dowód. – Suman