<div dir="auto">This may be too technical, but I thought I would ask as someone might have seen something similar.<div dir="auto"><br></div><div dir="auto">On a supercomputer using slurm/srun I am seeing irreproducible crashes, some a Sigsev in lapw1_mpi/elpa, sometime a bus error in lapw2_mpi. These are large calculations (Matrix size ~94K) using hybrid omp/mpi of 2omp x 128mpi as hybrid is more memory efficient. Intel impi.</div><div dir="auto"><br></div><div dir="auto">According to <a href="https://slurm.schedmd.com/mpi_guide.html">https://slurm.schedmd.com/mpi_guide.html</a> I should use PMI2 with</div><div dir="auto">I_MPI_PMI_LIBRARY=/path/to/slurm/lib/libpmi2.so .  (Currently I_MPI_PMI_LIBRARY is not set.) Apparently PMI1 is not very thread safe. Has anyone come across anything similar?</div><div dir="auto"><br><div data-smartmail="gmail_signature" dir="auto">--<br>Emeritus Professor Laurence Marks (Laurie)<br>Northwestern University<br><a href="http://www.numis.northwestern.edu">www.numis.northwestern.edu</a><br><a href="https://scholar.google.com/citations?user=zmHhI9gAAAAJ&hl=en">https://scholar.google.com/citations?user=zmHhI9gAAAAJ&hl=en</a><br>"Research is to see what everybody else has seen, and to think what nobody else has thought" Albert Szent-Györgyi</div></div></div>