<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Arial,Helvetica,sans-serif;" dir="ltr">
<p></p>
<div>Hi Prof Blaha,</div>
<div><br>
</div>
<div>I am trying to run an MPI job in 2 nodes each with 20 cores. But the job crashes </div>
<div>with the following error messages. <span style="font-size: 12pt;">I </span><span style="font-size: 12pt;">have tried with both </span><span style="font-size: 12pt;">USE_REMOTE 0 and  </span></div>
<div><span style="font-size: 12pt;">USE_REMOTE 1 in </span><span style="font-size: 12pt;">parallel_options file but didn't make much of a deference.</span></div>
<div><span style="font-size: 12pt;">Our system administrator told me it is not probably not a hardware issue and </span></div>
<div><span style="font-size: 12pt;">suggested me to </span><span style="font-size: 12pt;">contact Wien2k. So c</span><span style="font-size: 12pt;">ould you please let me know if I need to </span></div>
<div><span style="font-size: 12pt;">make any </span><span style="font-size: 12pt;">change in </span><span style="font-size: 12pt;">MPI setting and </span><span style="font-size: 12pt;">re</span><span style="font-size: 12pt;">compile</span><span style="font-size: 12pt;">
 Wien2k.</span></div>
<div><span style="font-size: 12pt;"><br>
</span></div>
<div><span style="font-size: 12pt;">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", NotoColorEmoji, "Segoe UI Symbol", "Android Emoji", EmojiSymbols; font-size: 16px;">
By the way, the same job runs fine if I use only 1 node with 20 cores. </div>
<br>
</span></div>
<div><span style="font-size: 12pt;">Error message:</span></div>
<div><span style="font-size: 12pt;"><br>
</span></div>
<div><span style="font-size: 12pt;">case.dayfile</span><br>
</div>
<div><br>
</div>
<div>   cycle 1     (Thu Dec  8 15:44:06 CET 2016)  (100/99 to go)</div>
<div><br>
</div>
<div>>   lapw0 -p    (15:44:06) starting parallel lapw0 at Thu Dec  8 15:44:07 CET 2016</div>
<div>-------- .machine0 : 40 processors</div>
<div>9872.562u 20.276s 8:20.46 1976.7%       0+0k 220752+386840io 332pf+0w</div>
<div>>   lapw1  -up -p    -c         (15:52:27) starting parallel lapw1 at Thu Dec  8 15:52:27 CET 2016</div>
<div>->  starting parallel LAPW1 jobs at Thu Dec  8 15:52:27 CET 2016</div>
<div>running LAPW1 in parallel mode (using .machines)</div>
<div>1 number_of_parallel_jobs</div>
<div>     au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au039 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042 au042(1) --------------------------------------------------------------------------</div>
<div>MPI_ABORT was invoked on rank 8 in communicator MPI_COMM_WORLD</div>
<div>with errorcode -726817712.</div>
<div><br>
</div>
<div><br>
</div>
<div>Output error file:</div>
<div><br>
</div>
<div>
<div> LAPW0 END</div>
<div>w2k_dispatch_signal(): received: Terminated</div>
<div>w2k_dispatch_signal(): received: Terminated</div>
<div>forrtl: Interrupted system call</div>
<div>w2k_dispatch_signal(): received: Terminated</div>
<div>w2k_dispatch_signal(): received: Terminated</div>
<div><br>
</div>
<br>
</div>
<div>Thanks,</div>
<div>Fhokrul</div>
<br>
<p></p>
<div style="color: rgb(0, 0, 0);"></div>
</div>
</body>
</html>