<div dir="ltr">Dear Prof. Marks,<div><br></div><div>   Could you, please, send me a template for the parallel_options file where this implementation was done ?</div><div>   I am sorry for that, but I am really far from being an expert.</div>
<div>   All the best,</div><div>                    Luis</div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/7/22 Laurence Marks <span dir="ltr">&lt;<a href="mailto:L-marks@northwestern.edu" target="_blank">L-marks@northwestern.edu</a>&gt;</span><br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">A brief followup which may be useful (or not) for others in the future<br>
with mpi problems. I have been able to work around a mysterious<br>
impi/ssh bug on NU&#39;s supercomputer by replacing ssh by the<br>
openmpi/mpirun launcher. The hack is gross, but very stable.<br>
<br>
Step 1:<br>
1) Add &quot;--bootstrap-exec=$WIENROOT/hopen&quot; to $WIENROOT/parallel_options.<br>
2) Create the executable file $WIENROOT/hopen containing<br>
#!/bin/bash<br>
a=`echo $@ | sed -e &#39;s/-x -q//&#39;`<br>
$OPENMPI/bin/mpirun -np 1 --host $a<br>
<br>
(change $OPENMPI to where it has been compiled).<br>
<div class="HOEnZb"><div class="h5"><br>
On Thu, Jul 18, 2013 at 10:38 AM, Laurence Marks<br>
&lt;<a href="mailto:L-marks@northwestern.edu">L-marks@northwestern.edu</a>&gt; wrote:<br>
&gt; On a cluster I am using I am having a problem with ssh connections as<br>
&gt; part of impi/mpirun about 0.1-0.2% of the time; what happens is that<br>
&gt; they fail to launch and become zombie&#39;s (ps shows &quot;[ssh] &lt;defunct&gt;&quot;).<br>
&gt; Since fiddling through all the options within mpirun can be hard<br>
&gt; (particularly for impi which is rather fast), I found (after a comment<br>
&gt; from someone on the openssh list) a useful hack. I am providing it<br>
&gt; here as it is a nice way around things, and might be useful to others<br>
&gt; in the future.<br>
&gt;<br>
&gt; The &quot;trick&quot; is to add --bootstrap-exec ~/bin/hssh or similar to the<br>
&gt; mpirun line in $WIENROOT/parallel_options, then create the executable<br>
&gt; ~/bin/hssh with something similar to:<br>
&gt;<br>
&gt; #!/bin/bash<br>
&gt; a=`echo $@ | sed -e &#39;s/-q/-v/&#39;`<br>
&gt; ssh $a<br>
&gt;<br>
&gt;<br>
&gt; The above allows me to turn verbose output on in the ssh command since<br>
&gt; impi insists on setting -q (quiet). For other cases something similar<br>
&gt; can be done.<br>
&gt;<br>
&gt; --<br>
&gt; Professor Laurence Marks<br>
&gt; Department of Materials Science and Engineering<br>
&gt; Northwestern University<br>
&gt; <a href="http://www.numis.northwestern.edu" target="_blank">www.numis.northwestern.edu</a> <a href="tel:1-847-491-3996" value="+18474913996">1-847-491-3996</a><br>
&gt; &quot;Research is to see what everybody else has seen, and to think what<br>
&gt; nobody else has thought&quot;<br>
&gt; Albert Szent-Gyorgi<br>
<br>
<br>
<br>
--<br>
Professor Laurence Marks<br>
Department of Materials Science and Engineering<br>
Northwestern University<br>
<a href="http://www.numis.northwestern.edu" target="_blank">www.numis.northwestern.edu</a> <a href="tel:1-847-491-3996" value="+18474913996">1-847-491-3996</a><br>
&quot;Research is to see what everybody else has seen, and to think what<br>
nobody else has thought&quot;<br>
Albert Szent-Gyorgi<br>
_______________________________________________<br>
Wien mailing list<br>
<a href="mailto:Wien@zeus.theochem.tuwien.ac.at">Wien@zeus.theochem.tuwien.ac.at</a><br>
<a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
SEARCH the MAILING-LIST at:  <a href="http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html" target="_blank">http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html</a><br>
</div></div></blockquote></div><br></div></div>