<html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"></head><body ><div>That is the yaml file. &nbsp;Reading and writing is not in yaml</div><div><br></div><div><br></div><div><div style="font-size:9px;color:#575757">Sent from my Samsung Galaxy S®4</div></div><br><br>-------- Original message --------<br>From: Dennis Weygand <weygand@jlab.org> <br>Date:01/15/2014  9:39 AM  (GMT-05:00) <br>To: clara@jlab.org <br>Subject: Re: [Clara] Overlimit Error Farm <br><br>No- there must be at least two other services in the chain: one for reading and one for writing: can you show the yaml file?<div>Dennis</div><div><br><div><div>On Jan 15, 2014, at 9:22 AM, Justin Ruger wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>these are the services i am using<br><br># Uncomment the line below to set a new container name for all services<br># container: Ruger_Reconstruction<br>services:<br> &nbsp;- class: org.jlab.clas12.ec.services.ECReconstruction<br> &nbsp;&nbsp;&nbsp;name: ECReconstruction<br> &nbsp;- class: org.jlab.clas12.ctof.services.CTOFReconstruction<br> &nbsp;&nbsp;&nbsp;name: CTOFReconstruction<br> &nbsp;- class: trac.services.centraltracker.BSTTrackCandFinder<br> &nbsp;&nbsp;&nbsp;name: BSTTrackCandFinder<br> &nbsp;- class: trac.services.forwardtracking.DCTrackCandFinder<br> &nbsp;&nbsp;&nbsp;name: DCTrackCandFinder<br><br><br><br>On Wednesday, January 15, 2014 9:19:07 AM, Vardan Gyurjyan wrote:<br><blockquote type="cite">This is most likely an error of the service that is managing shared-memory file cashing, and is nothing to do with the framework. It seems that that service is not removing files from the shared memory after the chain is done processing a file.<br></blockquote><blockquote type="cite">-vardan<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">----- Original Message -----<br></blockquote><blockquote type="cite">From: "Justin Ruger" &lt;<a href="mailto:jruger@jlab.org">jruger@jlab.org</a>&gt;<br></blockquote><blockquote type="cite">To: <a href="mailto:clara@jlab.org">clara@jlab.org</a><br></blockquote><blockquote type="cite">Sent: Wednesday, January 15, 2014 9:12:43 AM<br></blockquote><blockquote type="cite">Subject: [Clara] Overlimit Error Farm<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">So one of the reasons our farm jobs for clara dpe keep getting canceled<br></blockquote><blockquote type="cite">is because of this error:<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">=&gt;&gt; PBS: job killed: vmem 29235798016 exceeded limit 28991029248<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">This happens with or without -l flag.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">So how to recreate the error:<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">I have 20k event files. I said I wanted to do processing on 50 20k<br></blockquote><blockquote type="cite">files. I wrote a script that caches the files using jcache and then adds<br></blockquote><blockquote type="cite">the file name to the input.list so that it is all mandatory.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++=<br></blockquote><blockquote type="cite">#!/bin/bash<br></blockquote><blockquote type="cite">for((i=1;i&lt;=$1;i+=1)); do<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;echo "/cache/mss/clas/clas12/clas12-testing/gemc/sidis_$i.ev";<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if [ $i == 1 ]<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;then<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;echo "sidis_$i.ev" &gt; 'input.list';<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;echo "sidis_$i.ev" &gt;&gt; 'input.list';<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;fi<br></blockquote><blockquote type="cite"> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;jcache submit default<br></blockquote><blockquote type="cite">/mss/clas/clas12/clas12-testing/gemc/sidis_$i.ev<br></blockquote><blockquote type="cite">done<br></blockquote><blockquote type="cite">+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Then i ran the farm orch like:<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">java -cp "$CLARA_SERVICES/.:$CLARA_SERVICES/lib/*"<br></blockquote><blockquote type="cite">std.orchestrators.FarmOrchestrator -i<br></blockquote><blockquote type="cite">/cache/mss/clas/clas12/clas12-testing/gemc -o<br></blockquote><blockquote type="cite">/w/hallb/clas12/jruger/fiftyNode/output -s /tmp<br></blockquote><blockquote type="cite">/w/hallb/clas12/jruger/stress_test/services.yaml input.list<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">It ran fine for 5 files: so sidis_1.ev to sidis_5.ev but gets the job<br></blockquote><blockquote type="cite">canceled while processing the 6th file.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">I think this is something we should figure out how to solve ASAP while<br></blockquote><blockquote type="cite">they are allowing us to hold a node for development. If all I can do is<br></blockquote><blockquote type="cite">five files at a time this limits the robustness of clara in my opinion.<br></blockquote><blockquote type="cite">Let me know if you need anymore information.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Justin<br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">Clara mailing list<br></blockquote><blockquote type="cite"><a href="mailto:Clara@jlab.org">Clara@jlab.org</a><br></blockquote><blockquote type="cite"><a href="https://mailman.jlab.org/mailman/listinfo/clara">https://mailman.jlab.org/mailman/listinfo/clara</a><br></blockquote>_______________________________________________<br>Clara mailing list<br><a href="mailto:Clara@jlab.org">Clara@jlab.org</a><br>https://mailman.jlab.org/mailman/listinfo/clara<br></div></blockquote></div><br><div apple-content-edited="true">
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; -webkit-text-decorations-in-effect: none; text-indent: 0px; -webkit-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; -webkit-text-decorations-in-effect: none; text-indent: 0px; -webkit-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div>--</div><div>Dennis Weygand</div><div><a href="mailto:weygand@jlab.org">weygand@jlab.org</a></div><div>(757) 269-5926 (office)</div><div>(757) 870-4844 (cell)</div><div><br class="khtml-block-placeholder"></div><br class="Apple-interchange-newline"></span></div></span></span><br class="Apple-interchange-newline">
</div>
<br></div></body>