2011-07-09 11 views
5

Próbuję uruchomić prosty program MPI na 4 węzłach. Używam OpenMPI 1.4.3 na Centos 5.5. Kiedy przesyłam polecenie MPIRUN z plikiem host/plik maszyny, nie otrzymuję danych wyjściowych, otrzymuję pusty ekran. Stąd, Muszę zabić pracę..OpenMPI 1.4.3 Błąd pliku hosta mpirun

używam następujące polecenie Run:: mpirun --hostfile hostfile -np 4 new46

OUTPUT ON KILLING JOB: 
mpirun: killing job... 
-------------------------------------------------------------------------- 
    mpirun noticed that the job aborted, but has no info as to the process that caused 
    that situation. 
    -------------------------------------------------------------------------- 
    mpirun was unable to cleanly terminate the daemons on the nodes shown 
    below. Additional manual cleanup may be required - please refer to 
    the "orte-clean" tool for assistance. 
    -------------------------------------------------------------------------- 
    myocyte46 - daemon did not report back when launched 
    myocyte47 - daemon did not report back when launched 
    myocyte49 - daemon did not report back when launched 

Oto program MPI Próbuję wykonać na 4 węzłach

************************** 

    if (my_rank != 0) 
    { 
    sprintf(message, "Greetings from the process %d!", my_rank); 
    dest = 0; 
    MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD); 
    } 
    else 
    { 
    for (source = 1;source < p; source++) 
    { 
    MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status); 
    printf("%s\n", message); 
    } 

    **************************** 

Moja hostfile wygląda tak:

[[email protected] ~]$ cat hostfile 
    myocyte46 
    myocyte47 
    myocyte48 
    myocyte49 
    ******************************* 

Uruchomiłem powyższy program MPI niezależnie na każdym z węzłów i to compi prowadził i biegł dobrze. Mam ten numer "Daemon nie zgłosił się ponownie po uruchomieniu", gdy używam pliku hosta. Próbuję dowiedzieć się, jaki może być problem.

Dzięki!

Odpowiedz

1

Myślę, że te linie

myocyte46 - daemon did not report back when launched 

są dość jasne - masz problem albo uruchomienie demonów MPI lub komunikowania się z nimi później. Musisz zacząć szukać sieci. Czy możesz ssh bez hasła do tych węzłów? Czy możesz się wycofać? Pomijając program MPI, czy możesz uzyskać

mpirun -np 4 hostname 
i zdobyć coś?

+0

Dzięki. Tak, udało mi się ssh tam iz powrotem między węzłami. Wygląda na to, że administrator opuścił firewall i wyłączenie go wydaje się działać. Zauważyłem też na niektórych forach linuksowych, które sugerowały dodanie./etc/bashrc jako pierwszy element profilu bashrc. – Ashmohan

Powiązane problemy