mpirun en la X
-
20-08-2019 - |
Pregunta
¿Hay alguna manera de ejecutar un trabajo local mpi localmente en os X leopard (10.5.6) con más de 62 procesos. Cuando ejecuto el trabajo con 62 procesos, muere
$mpirun -np 62 a.out
mpirun noticed that job rank 0 with PID 0 on node Macintosh-001D4F4BC6BC.private exited on signal 15 (Terminated).
60 additional processes aborted (not shown)
y cuando lo ejecuto con 61 procesos, funciona bien.
Solución
En respuesta a mi comentario, busqué en Google y sospecho que esto es causado por un límite de recursos establecido por el sistema operativo. Además, la proximidad de la falla a un múltiplo 2 es sospechosa. Mi mejor conjetura es que algo en la biblioteca mpi (MPI_Send quizás) está generando procesos adicionales, que exceden el límite de 266 (ver ulimit -a).
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow