<div dir="auto">Unfortunately the structure of *.error files which are zero length when the task runs correctly can easily be broken if there is remote execution/ssh/mpi which does not work. I think in the cases you sent there is sufficient information to debug; I suspect an issue with directory names and/or mount.<div dir="auto"><br></div><div dir="auto">Suggestion to Peter: perhaps add a "echo Startup Error > lapw1[0-2].error" in lapw1[0-2]para to catch this?<br><br><div data-smartmail="gmail_signature" dir="auto">_____<br>Professor Laurence Marks<br>"Research is to see what everybody else has seen, and to think what nobody else has thought", Albert Szent-Gyorgi<br><a href="http://www.numis.northwestern.edu" target="_blank" rel="noreferrer">www.numis.northwestern.edu</a></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Sep 9, 2020, 06:48 Lyudmila Dobysheva <<a href="mailto:lyuka17@mail.ru" target="_blank" rel="noreferrer">lyuka17@mail.ru</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">09.09.2020 00:01, Peter Blaha wrote:<br>
> alias   testerror       'if (! -z \!:1.error) goto error'<br>
> you can catch a problem.<br>
<br>
> Am 08.09.2020 um 20:38 schrieb Yundi Quan:<br>
>> The simplest way that I can think of is to check whether the <br>
>> lawp1.error file is empty or not after executing x lapw1.<br>
<br>
>> On Tue, Sep 8, 2020 at 2:23 PM Rubel, Oleg <<a href="mailto:rubelo@mcmaster.ca" rel="noreferrer noreferrer" target="_blank">rubelo@mcmaster.ca</a> <br>
>> <mailto:<a href="mailto:rubelo@mcmaster.ca" rel="noreferrer noreferrer" target="_blank">rubelo@mcmaster.ca</a>>> wrote:<br>
>>     I wonder if there is a _simple_ alternative way for sensing an<br>
>>     error? Also message is not always "XXXXX - Error". It can be<br>
<br>
Just now I try to make a calculation at supercomputer with a random <br>
structure for testing, I passed already some problems, but sometimes I <br>
still meet errors, and there is no nonzero files. I am attaching three <br>
files:<br>
1. slurm*out, where errors are shown, the first one before lapw0 didn't <br>
affect, do not know why?, lapw0 was calculated, all output files are <br>
good. lapw1 was not calculated.<br>
<br>
2. *.dayfile I can see that lapw1 was not calculated only by too small <br>
times:<br>
tesla46(6) 0.006u 0.010s 0.75 2.11%      0+0k 0+0io 0pf+0w<br>
(the next lines are my additional output inserted into lapw1para:<br>
1 t taskset0 exe def_loop.def time srun 0 lapw1 lapw1_1.def)<br>
<br>
3. ls-l.output shows that all the *.error files are zero, and the files <br>
that should be done by lapw1, are absent.<br>
<br>
Doesn't matter why the task didn't calculated, but why the <br>
lapw1*.error's are zero?<br>
I sent for testing run -e lapw1, otherwise it would have come to lapw2 <br>
without stopping.<br>
<br>
Best regards<br>
Lyudmila Dobysheva<br>
------------------<br>
<a href="https://urldefense.com/v3/__http://ftiudm.ru/content/view/25/103/lang,english/__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1JIo8uRXg$" rel="noreferrer noreferrer noreferrer" target="_blank">https://urldefense.com/v3/__http://ftiudm.ru/content/view/25/103/lang,english/__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1JIo8uRXg$</a> <br>
Physics-Techn.Institute,<br>
Udmurt Federal Research Center, Ural Br. of Rus.Ac.Sci.<br>
426000 Izhevsk Kirov str. 132<br>
Russia<br>
---<br>
Tel. +7 (34I2)43-24-59 (office), +7 (9I2)OI9-795O (home)<br>
Skype: lyuka18 (office), lyuka17 (home)<br>
E-mail: <a href="mailto:lyuka17@mail.ru" rel="noreferrer noreferrer" target="_blank">lyuka17@mail.ru</a> (office), <a href="mailto:lyuka17@gmail.com" rel="noreferrer noreferrer" target="_blank">lyuka17@gmail.com</a> (home)<br>
<br>
_______________________________________________<br>
Wien mailing list<br>
<a href="mailto:Wien@zeus.theochem.tuwien.ac.at" rel="noreferrer noreferrer" target="_blank">Wien@zeus.theochem.tuwien.ac.at</a><br>
<a href="https://urldefense.com/v3/__http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1L-bFCp3A$" rel="noreferrer noreferrer noreferrer" target="_blank">https://urldefense.com/v3/__http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1L-bFCp3A$</a> <br>
SEARCH the MAILING-LIST at:  <a href="https://urldefense.com/v3/__http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1IXddgg7w$" rel="noreferrer noreferrer noreferrer" target="_blank">https://urldefense.com/v3/__http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html__;!!Dq0X2DkFhyF93HkjWTBQKhk!Cc2li1FWPTknXFHo7SLSTcHwYxmAXYvt52a4_PqAO7th-nFUOo9Iemg70fG8N1IXddgg7w$</a> <br>
</blockquote></div>