<div dir="ltr"><div><div><div><div><div><div><div><div>Dear Prof. Marks,<br><br></div>   Many thanks for your help.<br></div>   The administrators said that everything is 0K, the software is the problem (the easy answer) : no zombies, no other jobs in the node, ... !! <br></div>   Let me give you more information to see if you can imagine other possibilities:<br><br>1) Intel Xeon Six Core 5680, 3.33GHz<br><br>2) Intel(R) Fortran/CC/OpenMPI Intel(R) 64 Compiler XE for applications running on Intel(R) 64, Version 12.1.1.256 Build 20111011<br><br></div>3) OpenMPI 1.6.5<br><br>4) <font size="-1"><font size="-1">PBS Pro 11.0.2<br><br></font></font></div><font size="-1"><font size="-1">5) OpenMPI built using  --with-tm  due to prohibited ssh among nodes  ( <a href="http://www.open-mpi.org/faq/?category=building#build-rte-tm">http://www.open-mpi.org/faq/?category=building#build-rte-tm</a> )<br><br></font></font></div><div><font size="-1"><font size="-1">6) Wien2k 14.2<br></font></font></div><div><font size="-1"><font size="-1"><br></font></font></div><div><font size="-1"><font size="-1">7) The mystery : two weeks ago, everything was working properly !!<br></font></font></div><div><font size="-1"><font size="-1"><br></font></font></div><font size="-1"><font size="-1">   Many thanks again !<br></font></font></div><font size="-1"><font size="-1">   All the best,<br></font></font></div><font size="-1"><font size="-1">                   Luis<br></font></font></div><div class="gmail_extra"><br><div class="gmail_quote">2015-09-18 23:24 GMT-03:00 Laurence Marks <span dir="ltr"><<a href="mailto:laurence.marks@gmail.com" target="_blank">laurence.marks@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr">Almost certainly one or more of:<br>
* Other jobs on the node<br>
* Zombie process(es)<br>
* Too many mpi<br>
* Bad memory<br>
* Full disc<br>
* Too hot</p>
<p dir="ltr">If you have it use ganglia, if not ssh in and use top/ps or whatever SGI has. If you cannot sudo get help from someone who can. </p><div class="HOEnZb"><div class="h5">
<div class="gmail_quote">On Sep 18, 2015 8:58 PM, "Luis Ogando" <<a href="mailto:lcodacal@gmail.com" target="_blank">lcodacal@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">



<div>
<div dir="ltr">
<div>
<div>
<div>
<div>
<div>Dear Wien2k community,<br>
<br>
</div>
   I am using Wien2k in a SGI cluster with 32 nodes. My calculation is running in 4 nodes that have the same characteristics and only my job is running in these 4 nodes.<br>
</div>
   I noticed that one of these 4 nodes is spending more than 20 times the time spent by the other 3 nodes in the run_lapw execution.<br>
</div>
   Could someone imagine a reason for this ? Any advice ?<br>
</div>
   All the best,<br>
</div>
            Luis<br>
 <br>
</div>
</div>

</blockquote></div>
</div></div><br>_______________________________________________<br>
Wien mailing list<br>
<a href="mailto:Wien@zeus.theochem.tuwien.ac.at">Wien@zeus.theochem.tuwien.ac.at</a><br>
<a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" rel="noreferrer" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
SEARCH the MAILING-LIST at:  <a href="http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html" rel="noreferrer" target="_blank">http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html</a><br>
<br></blockquote></div><br></div>