2009-09-29 14 views

Odpowiedz

11

Jeśli potrzebujesz unikatowy identyfikator dla pliku efekt uboczny w Hadoop, można wykorzystać próba unikatowy identyfikator w pracy z tym kodem:

public static String getAttemptId(Configuration conf) throws IllegalArgumentException 
    { 
     if (conf == null) { 
      throw new NullPointerException("conf is null"); 
     } 

     String taskId = conf.get("mapred.task.id"); 
     if (taskId == null) { 
      throw new IllegalArgumentException("Configutaion does not contain the property mapred.task.id"); 
     } 

     String[] parts = taskId.split("_"); 
     if (parts.length != 6 || 
       !parts[0].equals("attempt") || 
       (!"m".equals(parts[3]) && !"r".equals(parts[3]))) { 
      throw new IllegalArgumentException("TaskAttemptId string : " + taskId + " is not properly formed"); 
     } 

     return parts[4] + "-" + parts[5]; 
    } 
4

późno do partii, ale można użyć TaskAttemptID klasa do przeanalizowania właściwości mapred.task.id.

W moim przypadku chciałem liczbową wartość sama próba i stosowane następujące w moim Mapper:

int _attemptID; 

@Override 
public void configure(JobConf conf) { 
    TaskAttemptID attempt = TaskAttemptID.forName(conf.get("mapred.task.id")); 
    _attemptID = attempt.id(); 
} 
9

Dzięki nowej Hadoop API:

context.getTaskAttemptID().getTaskID().getId() 
Powiązane problemy