<div dir="ltr"><div><div><div><div>Dear Prof. Marks,<br><br></div>   Thank you very much for your help !<br></div>   Unfortunately, I would like to understand why the  -s  option, designed to restart a calculation at the same point where it crashed, does not work. Without this, I am afraid that even your suggestion will not help.<br></div>   Thank you again,<br></div>                       Luis<br>  <br></div><div class="gmail_extra"><br><div class="gmail_quote">2017-05-18 14:39 GMT-03:00 Laurence Marks <span dir="ltr"><<a href="mailto:L-marks@northwestern.edu" target="_blank">L-marks@northwestern.edu</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I don't have the answer, but you may want to contemplate in the future<br>
doing something like a set of shorter runs saving the interim results<br>
<br>
for i in 1 2 3 4 ... XX<br>
do<br>
  mkdir Safety<br>
  runsp_lapw -hf ... -i 3 -NI<br>
  rm Safety/*bro*<br>
  mv *bro* Safety<br>
  save -f -d Safety<br>
  cp Safety/*bro* ./ ; cp Safety/*.scf ./<br>
done<br>
<br>
(It would be easier if save_lapw had an option to not delete the *bro*<br>
files and retain case.scf -- a simple hack.)<br>
<span class="im HOEnZb"><br>
On Thu, May 18, 2017 at 12:27 PM, Luis Ogando <<a href="mailto:lcodacal@gmail.com">lcodacal@gmail.com</a>> wrote:<br>
> Dear Gavin,<br>
><br>
>    Thank you very much for your answer.<br>
>    I am using Wien2k 14.2 and, unfortunately, that was the only message I<br>
> got from the standard output file (queuing system). The error files and<br>
> case.dayfile have no useful information.<br>
>    The interruption was during the  hf  execution, after lapw1, that<br>
> finished without a problem.<br>
>    It was not the first time I had to restart the calculation due to a shut<br>
> down. In the other cases, I restarted the calculation from scratch, but,<br>
> with a non parallel calculation, I have to solve this reinitialization issue<br>
> or the calculation will never end. So, I would be glad if someone else could<br>
> give me another hint.<br>
>    Thank you again.<br>
>    All the best,<br>
>                      Luis<br>
><br>
><br>
><br>
><br>
> 2017-05-18 11:35 GMT-03:00 Gavin Abo <<a href="mailto:gsabo@crimson.ua.edu">gsabo@crimson.ua.edu</a>>:<br>
>><br>
</span><div class="HOEnZb"><div class="h5">>> Sorry, those code line numbers are for WIEN2k 16.1.  For example, if you<br>
>> are using WIEN2k 14.2, the line numbers should be 998 instead of 1354 and<br>
>> 1006 instead of 1365 in SRC_hf/calc_h.F.<br>
>><br>
>><br>
>> On 5/18/2017 8:19 AM, Gavin Abo wrote:<br>
>><br>
>> Unfortunately, I think that error message can tell you "why" the<br>
>> calculation stopped, but it might not tell you the initial "cause" of it.<br>
>> That is likely because the issue that caused it happened earlier in the<br>
>> calculation (perhaps lapw1?).  The vector file size is smaller than the<br>
>> vectorhf_old.  I'm not sure if they should be the same size or not.  If so,<br>
>> perhaps you need to restart the calculation in the lapw1 step (-s lapw1) to<br>
>> regenerate the vector file instead of starting with the hf step (-s hf),<br>
>> which I believe comes later in the calculation from that of lapw1, or you<br>
>> might just have to start the calculation over from scratch.<br>
>><br>
>> In SRC_hf/calc_h_2.F, you should see:<br>
>><br>
>> line 1354:<br>
>> !_COMPLEX call<br>
>> zheev('V','U',nbf,ham,nbf,<wbr>enknew,workdiag,2*nbf-1,<wbr>rworkdiag,info)<br>
>><br>
>> line 1365:<br>
>>         if (info .ne. 0) then<br>
>>           print *, 'info=', info<br>
>>           stop 'error in calc_h_2: info not equal to 0'<br>
>>         endif<br>
>><br>
>> From the code above, you can see that there likely should be a little more<br>
>> error information available from the "print *, 'info=', info" statement that<br>
>> you did not report.  I believe this should have been printed to the standard<br>
>> output (terminal or std output file if you are using a queuing system).<br>
>><br>
>> Depending on the value of the info variable, the calculation seems to have<br>
>> stopped because it encountered an illegal value or there was a convergence<br>
>> problem [1]:<br>
>><br>
>>         INFO is INTEGER<br>
>>           = 0:  successful exit<br>
>>           < 0:  if INFO = -i, the i-th argument had an illegal value<br>
>>           > 0:  if INFO = i, the algorithm failed to converge; i<br>
>>                 off-diagonal elements of an intermediate tridiagonal<br>
>>                 form did not converge to zero.<br>
>><br>
>> Perhaps, the software developers of the hf code have further insight than<br>
>> I currently do into what could resolve the problem.<br>
>><br>
>> [1]<br>
>> <a href="http://www.netlib.org/lapack/explore-html/df/d9a/group__complex16_h_eeigen_ga70c041fd19635ff621cfd5d804bd7a30.html#ga70c041fd19635ff621cfd5d804bd7a30" rel="noreferrer" target="_blank">http://www.netlib.org/lapack/<wbr>explore-html/df/d9a/group__<wbr>complex16_h_eeigen_<wbr>ga70c041fd19635ff621cfd5d804bd<wbr>7a30.html#<wbr>ga70c041fd19635ff621cfd5d804bd<wbr>7a30</a><br>
>><br>
>> On 5/18/2017 5:52 AM, Luis Ogando wrote:<br>
>><br>
>>    I do not know if it is relevant, but my calculation is complex (-c).<br>
>>    Thank you again,<br>
>>                     Luis<br>
>><br>
>><br>
>> 2017-05-18 8:29 GMT-03:00 Luis Ogando <<a href="mailto:lcodacal@gmail.com">lcodacal@gmail.com</a>>:<br>
>>><br>
>>> Dear Wien2k community,<br>
>>><br>
>>>    I am trying to calculate the dielectric function for wurtzite GaP<br>
>>> using -hf and -so as previously discussed (<br>
>>> <a href="http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/msg14603.html" rel="noreferrer" target="_blank">http://www.mail-archive.com/<wbr>wien@zeus.theochem.tuwien.ac.<wbr>at/msg14603.html</a><br>
>>> ).<br>
>>>    There was a shut down of the machine during the  hf  execution in the<br>
>>> first step of the calculation  (  run_lapw -hf ...  ). When the machine came<br>
>>> back, I removed the case.vectorhf (case.vectorhf_old is still there) and<br>
>>> case.energyhf.  Then, I executed<br>
>>><br>
>>> run_lapw -hf -NI -s hf -ec 0.0001 -cc 0.0001 -i 200<br>
>>><br>
>>> trying to restart the calculation (non-parallel execution due to the HF x<br>
>>> SO issue discussed in the previous messages above).<br>
>>>    The calculation restarted without a problem, but when the the<br>
>>> case.vectorhf reached 187MB (less than a half of the expected size, see<br>
>>> below) I got an error.<br>
>>><br>
>>> -rw-r--r-- 1 luisoda luisoda 187M Mai 18 03:51 GaPwurtHSE-DielSO-1.vector<br>
>>> -rw-r--r-- 1 luisoda luisoda 187M Mai 18 00:14<br>
>>> GaPwurtHSE-DielSO-1.vectorhf<br>
>>> -rw-r--r-- 1 luisoda luisoda 565M Abr 23 21:33<br>
>>> GaPwurtHSE-DielSO-1.vectorhf_<wbr>old<br>
>>><br>
>>>    The only related error message I found it was:<br>
>>><br>
>>> error in calc_h: info not equal to 0<br>
>>><br>
>>>    I am probably making a mistake when restarting the calculation and I<br>
>>> would really appreciate any help with this issue.<br>
>>>    Many thanks in advance.<br>
>>>    All the best,<br>
>>>              Luis<br>
>><br>
>><br>
>><br>
</div></div><span class="im HOEnZb">>> ______________________________<wbr>_________________<br>
>> Wien mailing list<br>
>> <a href="mailto:Wien@zeus.theochem.tuwien.ac.at">Wien@zeus.theochem.tuwien.ac.<wbr>at</a><br>
>> <a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" rel="noreferrer" target="_blank">http://zeus.theochem.tuwien.<wbr>ac.at/mailman/listinfo/wien</a><br>
>> SEARCH the MAILING-LIST at:<br>
>> <a href="http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html" rel="noreferrer" target="_blank">http://www.mail-archive.com/<wbr>wien@zeus.theochem.tuwien.ac.<wbr>at/index.html</a><br>
>><br>
><br>
<br>
<br>
<br>
</span><span class="HOEnZb"><font color="#888888">--<br>
Professor Laurence Marks<br>
"Research is to see what everybody else has seen, and to think what<br>
nobody else has thought", Albert Szent-Gyorgi<br>
<a href="http://www.numis.northwestern.edu" rel="noreferrer" target="_blank">www.numis.northwestern.edu</a> ; Corrosion in 4D: <a href="http://MURI4D.numis.northwestern.edu" rel="noreferrer" target="_blank">MURI4D.numis.northwestern.edu</a><br>
Partner of the CFW 100% program for gender equity, <a href="http://www.cfw.org/100-percent
Co-Editor" rel="noreferrer" target="_blank">www.cfw.org/100-percent<br>
Co-Editor</a>, Acta Cryst A<br>
</font></span><div class="HOEnZb"><div class="h5">______________________________<wbr>_________________<br>
Wien mailing list<br>
<a href="mailto:Wien@zeus.theochem.tuwien.ac.at">Wien@zeus.theochem.tuwien.ac.<wbr>at</a><br>
<a href="http://zeus.theochem.tuwien.ac.at/mailman/listinfo/wien" rel="noreferrer" target="_blank">http://zeus.theochem.tuwien.<wbr>ac.at/mailman/listinfo/wien</a><br>
SEARCH the MAILING-LIST at:  <a href="http://www.mail-archive.com/wien@zeus.theochem.tuwien.ac.at/index.html" rel="noreferrer" target="_blank">http://www.mail-archive.com/<wbr>wien@zeus.theochem.tuwien.ac.<wbr>at/index.html</a><br>
</div></div></blockquote></div><br></div>