MPI Fehler wegen Zeitüberschreitung bei der Herstellung von Verbindung zu einem entfernten Prozess
Frage
Ich versuche, ein NAS-UPC-Benchmark, um es auszuführen Profil zu studieren. UPC nutzt MPI mit Remote-Prozessen zu kommunizieren.
Wenn ich die Benchmark mit 64 Prozesse laufen lasse, erhalte ich folgende Fehlermeldung
upcrun -n 64 bt.C.64
"Timeout in making connection to remote process on <<machine name>>"
Kann jemand mir sagen, warum dieser Fehler auftritt?
Lösung
Das bedeutet wahrscheinlich, dass Sie es nicht die Remote-Prozesse, um laichen - upcrun Delegierten, dass auf einen Pro-Kanal-Mechanismus, der Ihre Scheduler beinhalten kann (falls vorhanden). Meine Vermutung ist, dass Sie auf sind abhängig ssh-Typ Remote-Zugriff, und das ist versagt, wahrscheinlich, weil Sie Schlüssel, Agenten oder hostbasierte nicht Vertrauen haben einrichten. können Sie ssh ohne Passwort zu Ihrem Remote-Knoten? sane Umgebung auf dem entfernten Knoten (Wege, usw.)?
"upcrun -v" kann das Problem beleuchten, auch ohne auf die man-Seite zurückzugreifen;)