Well, bugging the poor sysadmin, we came up with a solution which, while not very advisable, will be a working patch for the moment: open the write permissions of my homedir on the afs system. At least now I can run my job on 45 processors :)<div>

<br></div><div>Cheers,</div><div><br></div><div>Marcos<br><br><div class="gmail_quote">2010/7/27 Marcos Veríssimo Alves <span dir="ltr">&lt;<a href="mailto:marcos.verissimo.alves@gmail.com">marcos.verissimo.alves@gmail.com</a>&gt;</span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Worse of all is that the disks are correctly mounted, and that from the command line I can do things like ls, even create and remove files. Only from within lapw1para it gives me an error. I am starting to insert lines with calls to unix utilities such as whoami in order to see what weird thing is going on there...<div>


<br></div><div>Thanks all for the suggestions. If I track this bug down I&#39;ll let you know.</div><div><br></div><div>Cheers,</div><div><br></div><div><font color="#888888">Marcos</font><div><div></div><div class="h5">

<br><br><div class="gmail_quote">On Tue, Jul 27, 2010 at 5:26 PM, Laurence Marks <span dir="ltr">&lt;<a href="mailto:L-marks@northwestern.edu" target="_blank">L-marks@northwestern.edu</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">It is a system problem. Maybe the relevant disc is not mounted on the<br>
remote node or something? Try doing a simple ssh to the node and test<br>
things like ls, cd etc. Too many possibilities to list here. Good<br>
luck, just try computer experiments until you track it down.....<br>
<div><div></div><div><br>
2010/7/27 Marcos Veríssimo Alves &lt;<a href="mailto:marcos.verissimo.alves@gmail.com" target="_blank">marcos.verissimo.alves@gmail.com</a>&gt;:<br>
&gt; Hi Laurence,<br>
&gt; I am not running mpi, only using rsh/ssh for the plain k-point<br>
&gt; parallelization. I couldn&#39;t really figure out how to make a .machines file<br>
&gt; to run parallel over k-points on mpi, with one processor per machine.<br>
&gt; However, I think Stefaan&#39;s tip has gone right to the point: in my job error<br>
&gt; file I get the following errors:<br>
&gt;  LAPW0 END<br>
&gt; .machinetmp222: No such file or directory<br>
&gt; bash: line 0: cd: /afs/<a href="http://atc.unican.es/u/m/mverissi/WIEN2k/sro1sto6" target="_blank">atc.unican.es/u/m/mverissi/WIEN2k/sro1sto6</a>:<br>
&gt; Permission denied<br>
&gt;  Cannot open error-file<br>
&gt; ERRFLG - couldn&#39;t open errorflag-file.<br>
&gt; The fact that from inside lapw1para the ssh command cannot cd to my home<br>
&gt; directory puzzles me... it seems to be a system problem, then. However, if<br>
&gt; you have any suggsestions, they will be more than welcome!<br>
&gt; Thanks,<br>
&gt; Marcos<br>
&gt;<br>
&gt; On Tue, Jul 27, 2010 at 4:27 PM, Laurence Marks &lt;<a href="mailto:L-marks@northwestern.edu" target="_blank">L-marks@northwestern.edu</a>&gt;<br>
&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; I doubt (although I may be wrong) that this has anything to do with<br>
&gt;&gt; the OS. Do you have -traceback in your compile options? This will give<br>
&gt;&gt; information as to which program this is happening in. Also, are you<br>
&gt;&gt; running mpi or not?<br>
&gt;&gt;<br>
&gt;&gt; 2010/7/27 Marcos Veríssimo Alves &lt;<a href="mailto:marcos.verissimo.alves@gmail.com" target="_blank">marcos.verissimo.alves@gmail.com</a>&gt;:<br>
&gt;&gt; &gt; Hi Stefaan and Laurence,<br>
&gt;&gt; &gt; @Stefaan: I will try it.<br>
&gt;&gt; &gt; @Laurence: it&#39;s the latest version, which I have downloaded about two<br>
&gt;&gt; &gt; weeks<br>
&gt;&gt; &gt; ago. Hope this helps.<br>
&gt;&gt; &gt; Thanks,<br>
&gt;&gt; &gt; Marcos<br>
&gt;&gt; &gt; On Tue, Jul 27, 2010 at 3:47 PM, Laurence Marks<br>
&gt;&gt; &gt; &lt;<a href="mailto:L-marks@northwestern.edu" target="_blank">L-marks@northwestern.edu</a>&gt;<br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; Is this the latest version, or an older one? Some changes were made in<br>
&gt;&gt; &gt;&gt; the error file access in the latest version for mpi reasons.<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; 2010/7/27 Marcos Veríssimo Alves &lt;<a href="mailto:marcos.verissimo.alves@gmail.com" target="_blank">marcos.verissimo.alves@gmail.com</a>&gt;:<br>
&gt;&gt; &gt;&gt; &gt; Hi all,<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; I am experiencing a problem in the execution in parallel over<br>
&gt;&gt; &gt;&gt; &gt; k-points.<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; I have compiled the code successfully in a cluster running Debian<br>
&gt;&gt; &gt;&gt; &gt; Linux<br>
&gt;&gt; &gt;&gt; &gt; and<br>
&gt;&gt; &gt;&gt; &gt; with SGEEE as the queue system using ssh as the means to launch the<br>
&gt;&gt; &gt;&gt; &gt; instances on the remote nodes, with /bin/bash as the shell. My script<br>
&gt;&gt; &gt;&gt; &gt; successfully creates a .machines file and when I run runsp_lapw -p<br>
&gt;&gt; &gt;&gt; &gt; -NI<br>
&gt;&gt; &gt;&gt; &gt; -cc<br>
&gt;&gt; &gt;&gt; &gt; 0.0001, the process dies. This is because, for some reason, lapw1para<br>
&gt;&gt; &gt;&gt; &gt; is<br>
&gt;&gt; &gt;&gt; &gt; not<br>
&gt;&gt; &gt;&gt; &gt; being able to write to the up(dn)lapw1_*.error files:<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; forrtl: severe (47): write to READONLY file, unit 99, file<br>
&gt;&gt; &gt;&gt; &gt; /afs/<a href="http://atc.unican.es/u/m/mverissi/WIEN2k/sro1sto6/uplapw1_1.error" target="_blank">atc.unican.es/u/m/mverissi/WIEN2k/sro1sto6/uplapw1_1.error</a><br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; And the same happens to the dnlapw1_*.error files.<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; lapw0, on the other hand, runs fine. I have set up parallel execution<br>
&gt;&gt; &gt;&gt; &gt; successfully on my dual-core desktop using ssh, using pretty much the<br>
&gt;&gt; &gt;&gt; &gt; same<br>
&gt;&gt; &gt;&gt; &gt; stuff, and it runs perfectly well.<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; Now, I have changed the write permissions of the directory (and all<br>
&gt;&gt; &gt;&gt; &gt; the<br>
&gt;&gt; &gt;&gt; &gt; files) with chmod -R ugo+rw /afs/<a href="http://atc.unican.es/u.." target="_blank">atc.unican.es/u..</a>., but to no avail.<br>
&gt;&gt; &gt;&gt; &gt; Has<br>
&gt;&gt; &gt;&gt; &gt; anyone experienced any problem like this before? Could there be any<br>
&gt;&gt; &gt;&gt; &gt; known<br>
&gt;&gt; &gt;&gt; &gt; (but obscure) reason why lapw1para would not be able to write to its<br>
&gt;&gt; &gt;&gt; &gt; files,<br>
&gt;&gt; &gt;&gt; &gt; but lapw0para would?<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; Best regards,<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; Marcos<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt;&gt; &gt; Wien mailing list<br>
&gt;&gt; &gt;&gt; &gt; <a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
&gt;&gt; &gt;&gt; &gt; <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt; &gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt;<br>
&gt;&gt; &gt;&gt; --<br>
&gt;&gt; &gt;&gt; Laurence Marks<br>
&gt;&gt; &gt;&gt; Department of Materials Science and Engineering<br>
&gt;&gt; &gt;&gt; MSE Rm 2036 Cook Hall<br>
&gt;&gt; &gt;&gt; 2220 N Campus Drive<br>
&gt;&gt; &gt;&gt; Northwestern University<br>
&gt;&gt; &gt;&gt; Evanston, IL 60208, USA<br>
&gt;&gt; &gt;&gt; Tel: (847) 491-3996 Fax: (847) 491-7820<br>
&gt;&gt; &gt;&gt; email: L-marks at northwestern dot edu<br>
&gt;&gt; &gt;&gt; Web: <a href="http://www.numis.northwestern.edu" target="_blank">www.numis.northwestern.edu</a><br>
&gt;&gt; &gt;&gt; Chair, Commission on Electron Crystallography of IUCR<br>
&gt;&gt; &gt;&gt; <a href="http://www.numis.northwestern.edu/" target="_blank">www.numis.northwestern.edu/</a><br>
&gt;&gt; &gt;&gt; Electron crystallography is the branch of science that uses electron<br>
&gt;&gt; &gt;&gt; scattering and imaging to study the structure of matter.<br>
&gt;&gt; &gt;&gt; _______________________________________________<br>
&gt;&gt; &gt;&gt; Wien mailing list<br>
&gt;&gt; &gt;&gt; <a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
&gt;&gt; &gt;&gt; <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; Wien mailing list<br>
&gt;&gt; &gt; <a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
&gt;&gt; &gt; <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Laurence Marks<br>
&gt;&gt; Department of Materials Science and Engineering<br>
&gt;&gt; MSE Rm 2036 Cook Hall<br>
&gt;&gt; 2220 N Campus Drive<br>
&gt;&gt; Northwestern University<br>
&gt;&gt; Evanston, IL 60208, USA<br>
&gt;&gt; Tel: (847) 491-3996 Fax: (847) 491-7820<br>
&gt;&gt; email: L-marks at northwestern dot edu<br>
&gt;&gt; Web: <a href="http://www.numis.northwestern.edu" target="_blank">www.numis.northwestern.edu</a><br>
&gt;&gt; Chair, Commission on Electron Crystallography of IUCR<br>
&gt;&gt; <a href="http://www.numis.northwestern.edu/" target="_blank">www.numis.northwestern.edu/</a><br>
&gt;&gt; Electron crystallography is the branch of science that uses electron<br>
&gt;&gt; scattering and imaging to study the structure of matter.<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; Wien mailing list<br>
&gt;&gt; <a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
&gt;&gt; <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; Wien mailing list<br>
&gt; <a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
&gt; <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
&gt;<br>
&gt;<br>
<br>
<br>
<br>
--<br>
Laurence Marks<br>
Department of Materials Science and Engineering<br>
MSE Rm 2036 Cook Hall<br>
2220 N Campus Drive<br>
Northwestern University<br>
Evanston, IL 60208, USA<br>
Tel: (847) 491-3996 Fax: (847) 491-7820<br>
email: L-marks at northwestern dot edu<br>
Web: <a href="http://www.numis.northwestern.edu" target="_blank">www.numis.northwestern.edu</a><br>
Chair, Commission on Electron Crystallography of IUCR<br>
<a href="http://www.numis.northwestern.edu/" target="_blank">www.numis.northwestern.edu/</a><br>
Electron crystallography is the branch of science that uses electron<br>
scattering and imaging to study the structure of matter.<br>
_______________________________________________<br>
Wien mailing list<br>
<a href="mailto:Wien@zeus.theochem.tuwien.ac.at" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
<a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" target="_blank">http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien</a><br>
</div></div></blockquote></div><br></div></div></div>
</blockquote></div><br></div>