<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
  </head>
  <body text="#000000" bgcolor="#ffffff">
    FYI.<br>
    <br>
    -------- Original Message --------
    <table class="moz-email-headers-table" border="0" cellpadding="0"
      cellspacing="0">
      <tbody>
        <tr>
          <th nowrap="nowrap" valign="BASELINE" align="RIGHT">Subject: </th>
          <td>12 GeV computing requirements</td>
        </tr>
        <tr>
          <th nowrap="nowrap" valign="BASELINE" align="RIGHT">Date: </th>
          <td>Thu, 20 Jan 2011 09:30:05 -0500</td>
        </tr>
        <tr>
          <th nowrap="nowrap" valign="BASELINE" align="RIGHT">From: </th>
          <td>Heyes Graham <a class="moz-txt-link-rfc2396E" href="mailto:heyes@jlab.org"><heyes@jlab.org></a></td>
        </tr>
        <tr>
          <th nowrap="nowrap" valign="BASELINE" align="RIGHT">To: </th>
          <td>Weygand Dennis <a class="moz-txt-link-rfc2396E" href="mailto:weygand@jlab.org"><weygand@jlab.org></a></td>
        </tr>
        <tr>
          <th nowrap="nowrap" valign="BASELINE" align="RIGHT">CC: </th>
          <td>Mark Ito M. <a class="moz-txt-link-rfc2396E" href="mailto:marki@jlab.org"><marki@jlab.org></a>, Stephen Wood A.
            <a class="moz-txt-link-rfc2396E" href="mailto:saw@jlab.org"><saw@jlab.org></a>, Robert Michaels <a class="moz-txt-link-rfc2396E" href="mailto:rom@jlab.org"><rom@jlab.org></a>,
            Brad Sawatzky <a class="moz-txt-link-rfc2396E" href="mailto:brads@jlab.org"><brads@jlab.org></a></td>
        </tr>
      </tbody>
    </table>
    <br>
    <br>
    <pre>Here is the promised spreadsheet to try to capture computing requirements. There are probably other things that  I could have asked for but at least it's a start. 

The orange colored cells of the spreadsheet are calculated using data from the uncolored ones so I would like you to fill in as much of the white part of the spreadsheet as you can. 

In several places I ask for "time to process event", this needs a little bit of explaining. I am using our current generation 32-bit farm nodes as the standard. What processing time is required to process one event? 

With a single threaded job running on a multi-core machine this time will be constant and equal to the CPU time per event. The multiple computing cores allow you to run more jobs in parallel but any single job runs for a CPU time equal to the number of events in the data file multiplied by the CPU time per event. 

With the multi-threaded parallel architectures (CLARA and JENA) the CPU time per event decreases as the number of cores increases so the equivalent metric is the CPU time per event normalized by multiplying by the number of cores that part in the processing. If you can think of a better number feel free!

There are a couple of places where I ask for tape and disk estimates. Traditionally, based on experience with CLAS, we have assumed that the amount of work disk required is equal to 10% of the data taken in a year. With such large datasets in the 12 GeV era this simple minded calculation probably breaks down so feel free to estimate using a different method and let me know what that method is (educated guess is a good tool!). As far as tape estimate is concerned I assume that all the raw and all the analysis output will be stored but what about calibration and simulation? 

As I wrote earlier this is a first try and may take a little (or a lot of) tweaking. 

Thanks for your help,
        Graham


</pre>
  </body>
</html>