MPI error debido al tiempo de espera en la toma de conexión a un proceso remoto
Pregunta
Estoy intentando ejecutar un punto de referencia NAS-UPC para estudiarlo de perfil. UPC utiliza MPI para comunicarse con procesos remotos.
Cuando funciono el punto de referencia con 64 procesos, i sale el siguiente error
upcrun -n 64 bt.C.64
"Timeout in making connection to remote process on <<machine name>>"
¿Alguien puede decirme por qué se produce este error?
Solución
Esto probablemente significa que usted está en su defecto para desovar los procesos remotos - upcrun delegados que a un mecanismo de per-conducto, que puede implicar su programador (si lo hay). Mi conjetura es que usted está en función de ssh-tipo de acceso remoto, y que está fallando, probablemente debido a que no tiene teclas, agente o la confianza basada en el host de configurar. se puede ssh a los nodos remotos sin la contraseña? ambiente sano en los nodos remotos (caminos, etc.)?
"upcrun -v" puede iluminar el problema, incluso sin recurrir a la página del manual;)