updates to jaba2 from jaba release branch
authorpvtroshin <pvtroshin@e3abac25-378b-4346-85de-24260fe3988d>
Thu, 19 Aug 2010 14:43:32 +0000 (14:43 +0000)
committerpvtroshin <pvtroshin@e3abac25-378b-4346-85de-24260fe3988d>
Thu, 19 Aug 2010 14:43:32 +0000 (14:43 +0000)
git-svn-id: link to svn.lifesci.dundee.ac.uk/svn/barton/ptroshin/JABA2@2921 e3abac25-378b-4346-85de-24260fe3988d

14 files changed:
dundee-conf/settings/ClustalLimits.xml [new file with mode: 0644]
dundee-conf/settings/ClustalParameters.xml [new file with mode: 0644]
dundee-conf/settings/ClustalPresets.xml [new file with mode: 0644]
dundee-conf/settings/MafftLimits.xml [new file with mode: 0644]
dundee-conf/settings/MafftParameters.xml [new file with mode: 0644]
dundee-conf/settings/MafftPresets.xml [new file with mode: 0644]
dundee-conf/settings/MuscleLimits.xml [new file with mode: 0644]
dundee-conf/settings/MuscleParameters.xml [new file with mode: 0644]
dundee-conf/settings/MusclePresets.xml [new file with mode: 0644]
dundee-conf/settings/ProbconsLimits.xml [new file with mode: 0644]
dundee-conf/settings/ProbconsParameters.xml [new file with mode: 0644]
dundee-conf/settings/TcoffeeLimits.xml [new file with mode: 0644]
dundee-conf/settings/TcoffeeParameters.xml [new file with mode: 0644]
dundee-conf/settings/TcoffeePresets.xml [new file with mode: 0644]

diff --git a/dundee-conf/settings/ClustalLimits.xml b/dundee-conf/settings/ClustalLimits.xml
new file mode 100644 (file)
index 0000000..ebbe206
--- /dev/null
@@ -0,0 +1,18 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<limits>\r
+ <runnerClassName>compbio.runner.clustal.ClustalW</runnerClassName>\r
+       <limit isDefault="false">\r
+               <preset>Disable gap weighting (Speed-oriented)</preset>\r
+               <seqNumber>2000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="true">\r
+               <seqNumber>1000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="false">\r
+               <preset># LocalEngineExecutionLimit #</preset>\r
+               <seqNumber>40</seqNumber>\r
+               <seqLength>500</seqLength>\r
+       </limit>\r
+</limits>\r
diff --git a/dundee-conf/settings/ClustalParameters.xml b/dundee-conf/settings/ClustalParameters.xml
new file mode 100644 (file)
index 0000000..7e8de1d
--- /dev/null
@@ -0,0 +1,195 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<runnerConfig>\r
+       <runnerClassName>compbio.runner.clustal.ClustalW</runnerClassName>\r
+       <options>\r
+               <name>NOPGAP</name>\r
+               <description>Residue-specific gaps off</description>\r
+               <optionNames>-NOPGAP</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+       </options>\r
+       <options>\r
+               <name>No transition weighting</name>\r
+               <description>Disable sequence weighting</description>\r
+               <optionNames>-NOWEIGHTS</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+       </options>\r
+       <options>\r
+               <name>NOHGAP</name>\r
+               <description>Hydrophilic gaps off</description>\r
+               <optionNames>-NOHGAP</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+       </options>\r
+       <prmSeparator>=</prmSeparator>\r
+       <parameters>\r
+               <name>Transition weighting</name>\r
+               <description>Type of the sequence (PROTEIN or DNA)</description>\r
+               <optionNames>-TRANSWEIGHT</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>0.5</defaultValue>\r
+               <validValue>\r
+                       <type>Float</type>\r
+                       <min>0</min>\r
+                       <max>10</max>\r
+               </validValue>\r
+       </parameters>\r
+       <parameters>\r
+               <name>Type</name>\r
+               <description>Type of the sequence (PROTEIN or DNA)</description>\r
+               <optionNames>-TYPE</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>PROTEIN</defaultValue>\r
+               <possibleValues>PROTEIN</possibleValues>\r
+               <possibleValues>DNA</possibleValues>\r
+       </parameters>\r
+       <parameters>\r
+               <name>OUTORDER</name>\r
+               <description>As per INPUT or ALIGNED</description>\r
+               <optionNames>-OUTORDER</optionNames>\r
+               <defaultValue>INPUT</defaultValue>\r
+               <possibleValues>INPUT</possibleValues>\r
+               <possibleValues>ALIGNED</possibleValues>\r
+       </parameters>\r
+       <parameters>\r
+               <name>MATRIX</name>\r
+               <description>Protein weight matrix</description>\r
+               <optionNames>-MATRIX</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>BLOSUM62</defaultValue>\r
+               <!-- Clustal build in matrices\r
+               <possibleValues>BLOSUM</possibleValues>\r
+               <possibleValues>PAM</possibleValues>\r
+               <possibleValues>ID</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+                -->\r
+               <possibleValues>BLOSUM100</possibleValues>\r
+               <possibleValues>BLOSUM30</possibleValues>\r
+               <possibleValues>BLOSUM35</possibleValues>\r
+               <possibleValues>BLOSUM40</possibleValues>\r
+               <possibleValues>BLOSUM45</possibleValues>\r
+               <possibleValues>BLOSUM50</possibleValues>\r
+               <possibleValues>BLOSUM55</possibleValues>\r
+               <possibleValues>BLOSUM60</possibleValues>\r
+               <possibleValues>BLOSUM62</possibleValues>\r
+               <possibleValues>BLOSUM65</possibleValues>\r
+               <possibleValues>BLOSUM70</possibleValues>\r
+               <possibleValues>BLOSUM75</possibleValues>\r
+               <possibleValues>BLOSUM80</possibleValues>\r
+               <possibleValues>BLOSUM85</possibleValues>\r
+               <possibleValues>BLOSUM90</possibleValues>\r
+               <possibleValues>BLOSUMN</possibleValues>\r
+               <possibleValues>DAYHOFF</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+               <possibleValues>IDENTITY</possibleValues>\r
+               <possibleValues>MATCH</possibleValues>\r
+               <possibleValues>NUC.4.2</possibleValues>\r
+               <possibleValues>NUC.4.4</possibleValues>\r
+               <possibleValues>PAM10</possibleValues>\r
+               <possibleValues>PAM100</possibleValues>\r
+               <possibleValues>PAM110</possibleValues>\r
+               <possibleValues>PAM120</possibleValues>\r
+               <possibleValues>PAM130</possibleValues>\r
+               <possibleValues>PAM140</possibleValues>\r
+               <possibleValues>PAM150</possibleValues>\r
+               <possibleValues>PAM160</possibleValues>\r
+               <possibleValues>PAM170</possibleValues>\r
+               <possibleValues>PAM180</possibleValues>\r
+               <possibleValues>PAM190</possibleValues>\r
+               <possibleValues>PAM20</possibleValues>\r
+               <possibleValues>PAM200</possibleValues>\r
+               <possibleValues>PAM210</possibleValues>\r
+               <possibleValues>PAM220</possibleValues>\r
+               <possibleValues>PAM230</possibleValues>\r
+               <possibleValues>PAM240</possibleValues>\r
+               <possibleValues>PAM250</possibleValues>\r
+               <possibleValues>PAM260</possibleValues>\r
+               <possibleValues>PAM270</possibleValues>\r
+               <possibleValues>PAM280</possibleValues>\r
+               <possibleValues>PAM290</possibleValues>\r
+               <possibleValues>PAM30</possibleValues>\r
+               <possibleValues>PAM300</possibleValues>\r
+               <possibleValues>PAM310</possibleValues>\r
+               <possibleValues>PAM320</possibleValues>\r
+               <possibleValues>PAM330</possibleValues>\r
+               <possibleValues>PAM340</possibleValues>\r
+               <possibleValues>PAM350</possibleValues>\r
+               <possibleValues>PAM360</possibleValues>\r
+               <possibleValues>PAM370</possibleValues>\r
+               <possibleValues>PAM380</possibleValues>\r
+               <possibleValues>PAM390</possibleValues>\r
+               <possibleValues>PAM40</possibleValues>\r
+               <possibleValues>PAM400</possibleValues>\r
+               <possibleValues>PAM410</possibleValues>\r
+               <possibleValues>PAM420</possibleValues>\r
+               <possibleValues>PAM430</possibleValues>\r
+               <possibleValues>PAM440</possibleValues>\r
+               <possibleValues>PAM450</possibleValues>\r
+               <possibleValues>PAM460</possibleValues>\r
+               <possibleValues>PAM470</possibleValues>\r
+               <possibleValues>PAM480</possibleValues>\r
+               <possibleValues>PAM490</possibleValues>\r
+               <possibleValues>PAM50</possibleValues>\r
+               <possibleValues>PAM500</possibleValues>\r
+               <possibleValues>PAM60</possibleValues>\r
+               <possibleValues>PAM70</possibleValues>\r
+               <possibleValues>PAM80</possibleValues>\r
+               <possibleValues>PAM90</possibleValues>\r
+       </parameters>\r
+       <parameters>\r
+               <name>GAPOPEN</name>\r
+               <description>Gap opening penalty</description>\r
+               <optionNames>-GAPOPEN</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>10</defaultValue>\r
+               <validValue>\r
+                       <type>Float</type>\r
+                       <min>0</min>\r
+                       <max>1000</max>\r
+               </validValue>\r
+       </parameters>\r
+       <parameters>\r
+               <name>-GAPEXT</name>\r
+               <description>Gap extension penalty</description>\r
+               <optionNames>-GAPEXT</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>0.1</defaultValue>\r
+               <validValue>\r
+                       <type>Float</type>\r
+                       <min>0</min>\r
+                       <max>10</max>\r
+               </validValue>\r
+       </parameters>\r
+       <parameters>\r
+               <name>ENDGAPS</name>\r
+               <description>End gap separation pen</description>\r
+               <optionNames>-ENDGAPS</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>0.5</defaultValue>\r
+               <validValue>\r
+                       <type>Float</type>\r
+                       <min>0</min>\r
+                       <max>10</max>\r
+               </validValue>\r
+       </parameters>\r
+       <parameters>\r
+               <name>GAPDIST</name>\r
+               <description>Gap separation pen. range</description>\r
+               <optionNames>-GAPDIST</optionNames>\r
+               <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html\r
+               </furtherDetails>\r
+               <defaultValue>1</defaultValue>\r
+               <validValue>\r
+                       <type>Integer</type>\r
+                       <min>0</min>\r
+                       <max>50</max>\r
+               </validValue>\r
+       </parameters>\r
+</runnerConfig>\r
diff --git a/dundee-conf/settings/ClustalPresets.xml b/dundee-conf/settings/ClustalPresets.xml
new file mode 100644 (file)
index 0000000..3115006
--- /dev/null
@@ -0,0 +1,13 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<presets>\r
+ <runnerClassName>compbio.runner.clustal.ClustalW</runnerClassName>\r
+       <preset>\r
+               <name>Disable gap weighting (Speed-oriented)</name>\r
+               <description></description>\r
+               <optlist>\r
+                       <option>-NOPGAP</option>\r
+                       <option>-NOWEIGHTS</option>\r
+                       <option>-NOHGAP</option>\r
+               </optlist>\r
+       </preset>\r
+</presets>\r
diff --git a/dundee-conf/settings/MafftLimits.xml b/dundee-conf/settings/MafftLimits.xml
new file mode 100644 (file)
index 0000000..7db541e
--- /dev/null
@@ -0,0 +1,13 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<limits>\r
+ <runnerClassName>compbio.runner.mafft.Mafft</runnerClassName>\r
+       <limit isDefault="true">\r
+               <seqNumber>1000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="false">\r
+               <preset># LocalEngineExecutionLimit #</preset>\r
+               <seqNumber>40</seqNumber>\r
+               <seqLength>500</seqLength>\r
+       </limit>\r
+</limits>\r
diff --git a/dundee-conf/settings/MafftParameters.xml b/dundee-conf/settings/MafftParameters.xml
new file mode 100644 (file)
index 0000000..74fc854
--- /dev/null
@@ -0,0 +1,237 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes" ?>\r
+<runnerConfig >\r
+ <runnerClassName>compbio.runner.mafft.Mafft</runnerClassName>\r
+    <options isRequired="false">\r
+        <name>Shared 6mers distance calculation</name>\r
+        <description>Distance is calculated based on the number of shared 6mers. Default: on</description>\r
+        <optionNames>--6merpair</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--6merpair</defaultValue>\r
+    </options>\r
+    <options isRequired="true">\r
+        <name>Output sequences order</name>\r
+        <description>--inputorder - Output order: same as input. \r
+        --reorder - Output order: aligned. Default: same as input</description>\r
+        <optionNames>--inputorder</optionNames>\r
+        <optionNames>--reorder</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--inputorder</defaultValue>\r
+    </options>\r
+       <options isRequired="false">\r
+        <name>Sequence type</name>\r
+        <description>\r
+        --nuc - Assume the sequences are nucleotide.\r
+        --amino - Assume the sequences are amino acid. </description>\r
+        <optionNames>--amino</optionNames>\r
+        <optionNames>--nuc</optionNames>\r
+        <optionNames>--auto</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--auto</defaultValue>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>Pairwise alignment computation method</name>\r
+        <description>\r
+        --globalpair\r
+               All pairwise alignments are computed with the Needleman-Wunsch algorithm. More accurate but slower than --6merpair. Suitable for a set of globally alignable sequences. Applicable to up to ~200 sequences. A combination with --maxiterate 1000 is recommended (G-INS-i). Default: off (6mer distance is used)\r
+        --genafpair \r
+        All pairwise alignments are computed with a local algorithm with the generalized affine gap cost (Altschul 1998). More accurate but slower than --6merpair. Suitable when large internal gaps are expected. Applicable to up to ~200 sequences. A combination with --maxiterate 1000 is recommended (E-INS-i). Default: off (6mer distance is used)\r
+        --fastapair\r
+        All pairwise alignments are computed with FASTA (Pearson and Lipman 1988). FASTA is required. Default: off (6mer distance is used)\r
+        --localpair\r
+        All pairwise alignments are computed with the Smith-Waterman algorithm. More accurate but slower than --6merpair. Suitable for a set of locally alignable sequences. Applicable to up to ~200 sequences. A combination with --maxiterate 1000 is recommended (L-INS-i). Default: off (6mer distance is used)\r
+        </description>\r
+        <optionNames>--fastapair</optionNames>\r
+        <optionNames>--genafpair</optionNames>\r
+        <optionNames>--localpair</optionNames>\r
+        <optionNames>--globalpair</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--localpair</defaultValue>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>FFT approximation</name>\r
+        <description>Use / Do not use FFT approximation in group-to-group alignment. Default: off</description>\r
+        <optionNames>--nofft</optionNames>\r
+        <optionNames>--fft</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--nofft</defaultValue>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>No score</name>\r
+        <description>Alignment score is not checked in the iterative refinement stage. Default: off (score is checked)</description>\r
+        <optionNames>--noscore</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+    </options>\r
+       <options isRequired="false">\r
+        <name>Part tree</name>\r
+               <description>\r
+        --parttree - Use a fast tree-building method (PartTree, Katoh and Toh 2007) with the 6mer distance. \r
+               --dpparttree - the PartTree algorithm is used with distances based on DP. \r
+               Slightly more accurate and slower than --parttree. \r
+        --fastaparttree - The PartTree algorithm is used with distances based on FASTA. \r
+        Slightly more accurate and slower than --parttree. \r
+        All methods recommended for a large number (> ~10,000) of sequences are input.\r
+        </description> \r
+        <optionNames>--dpparttree</optionNames>\r
+        <optionNames>--parttree</optionNames>\r
+        <optionNames>--fastaparttree</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>--fastaparttree</defaultValue>\r
+    </options>\r
+    <prmSeparator> </prmSeparator>\r
+        <parameters isRequired="false">\r
+        <name>Max iteration number</name>\r
+        <description>number cycles of iterative refinement are performed. Default: 0</description>\r
+        <optionNames>--maxiterate</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>1000</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Partsize</name>\r
+        <description>The number of partitions in the PartTree algorithm. Default: 50</description>\r
+        <optionNames>--partsize</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>50</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+               <min>1</min>\r
+        </validValue>\r
+     </parameters>\r
+       <parameters isRequired="false">\r
+        <name>Group size</name>\r
+        <description>Do not make alignment larger than number sequences. Valid only with the --*parttree options. Default: the number of input sequences</description>\r
+        <optionNames>--groupsize</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>20</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+               <min>0</min>\r
+        </validValue>\r
+      </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Guide tree rebuild</name>\r
+        <description>Guide tree is built number times in the progressive stage. Valid with 6mer distance. Default: 2</description>\r
+        <optionNames>--retree</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>2</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+               <min>1</min>\r
+               <max>100</max>\r
+        </validValue>\r
+     </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Gap opening penalty</name>\r
+        <description>Gap opening penalty at group-to-group alignment. Default: 1.53</description>\r
+        <optionNames>--op</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>1.53</defaultValue>\r
+         <validValue>\r
+               <type>Float</type>\r
+               <min>0</min>\r
+        </validValue>\r
+     </parameters> \r
+    <parameters isRequired="false">\r
+        <name>Group-to-group gap extension penalty</name>\r
+        <description>Offset value, which works like gap extension penalty, for group-to-group alignment. Deafult: 0.123</description>\r
+        <optionNames>--ep</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>0.123</defaultValue>\r
+         <validValue>\r
+               <type>Float</type>\r
+               <min>0</min>\r
+        </validValue>\r
+     </parameters> \r
+   <parameters isRequired="false">\r
+        <name>Gap opening penalty at local pairwise alignment</name>\r
+        <description>Gap opening penalty at local pairwise alignment. Valid when the --localpair or --genafpair option is selected. Default: -2.00</description>\r
+        <optionNames>--lop</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>-2.00</defaultValue>\r
+        <validValue>\r
+               <type>Float</type>\r
+               <max>0</max>\r
+        </validValue>\r
+   </parameters>  \r
+   <parameters isRequired="false">\r
+        <name>Matrix</name>\r
+        <description>Substitution Matrix to use</description>\r
+        <optionNames>--aamatrix</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>BLOSUM62</defaultValue>\r
+               <possibleValues>BLOSUM100</possibleValues>\r
+               <possibleValues>BLOSUM30</possibleValues>\r
+               <possibleValues>BLOSUM35</possibleValues>\r
+               <possibleValues>BLOSUM40</possibleValues>\r
+               <possibleValues>BLOSUM45</possibleValues>\r
+               <possibleValues>BLOSUM50</possibleValues>\r
+               <possibleValues>BLOSUM55</possibleValues>\r
+               <possibleValues>BLOSUM60</possibleValues>\r
+               <possibleValues>BLOSUM62</possibleValues>\r
+               <possibleValues>BLOSUM65</possibleValues>\r
+               <possibleValues>BLOSUM70</possibleValues>\r
+               <possibleValues>BLOSUM75</possibleValues>\r
+               <possibleValues>BLOSUM80</possibleValues>\r
+               <possibleValues>BLOSUM85</possibleValues>\r
+               <possibleValues>BLOSUM90</possibleValues>\r
+               <possibleValues>BLOSUMN</possibleValues>\r
+               <possibleValues>DAYHOFF</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+               <possibleValues>IDENTITY</possibleValues>\r
+               <possibleValues>MATCH</possibleValues>\r
+               <possibleValues>PAM10</possibleValues>\r
+               <possibleValues>PAM100</possibleValues>\r
+               <possibleValues>PAM110</possibleValues>\r
+               <possibleValues>PAM120</possibleValues>\r
+               <possibleValues>PAM130</possibleValues>\r
+               <possibleValues>PAM140</possibleValues>\r
+               <possibleValues>PAM150</possibleValues>\r
+               <possibleValues>PAM160</possibleValues>\r
+               <possibleValues>PAM170</possibleValues>\r
+               <possibleValues>PAM180</possibleValues>\r
+               <possibleValues>PAM190</possibleValues>\r
+               <possibleValues>PAM20</possibleValues>\r
+               <possibleValues>PAM200</possibleValues>\r
+               <possibleValues>PAM210</possibleValues>\r
+               <possibleValues>PAM220</possibleValues>\r
+               <possibleValues>PAM230</possibleValues>\r
+               <possibleValues>PAM240</possibleValues>\r
+               <possibleValues>PAM250</possibleValues>\r
+               <possibleValues>PAM260</possibleValues>\r
+               <possibleValues>PAM270</possibleValues>\r
+               <possibleValues>PAM280</possibleValues>\r
+               <possibleValues>PAM290</possibleValues>\r
+               <possibleValues>PAM30</possibleValues>\r
+               <possibleValues>PAM300</possibleValues>\r
+               <possibleValues>PAM310</possibleValues>\r
+               <possibleValues>PAM320</possibleValues>\r
+               <possibleValues>PAM330</possibleValues>\r
+               <possibleValues>PAM340</possibleValues>\r
+               <possibleValues>PAM350</possibleValues>\r
+               <possibleValues>PAM360</possibleValues>\r
+               <possibleValues>PAM370</possibleValues>\r
+               <possibleValues>PAM380</possibleValues>\r
+               <possibleValues>PAM390</possibleValues>\r
+               <possibleValues>PAM40</possibleValues>\r
+               <possibleValues>PAM400</possibleValues>\r
+               <possibleValues>PAM410</possibleValues>\r
+               <possibleValues>PAM420</possibleValues>\r
+               <possibleValues>PAM430</possibleValues>\r
+               <possibleValues>PAM440</possibleValues>\r
+               <possibleValues>PAM450</possibleValues>\r
+               <possibleValues>PAM460</possibleValues>\r
+               <possibleValues>PAM470</possibleValues>\r
+               <possibleValues>PAM480</possibleValues>\r
+               <possibleValues>PAM490</possibleValues>\r
+               <possibleValues>PAM50</possibleValues>\r
+               <possibleValues>PAM500</possibleValues>\r
+               <possibleValues>PAM60</possibleValues>\r
+               <possibleValues>PAM70</possibleValues>\r
+               <possibleValues>PAM80</possibleValues>\r
+               <possibleValues>PAM90</possibleValues>\r
+    </parameters>\r
+</runnerConfig>\r
diff --git a/dundee-conf/settings/MafftPresets.xml b/dundee-conf/settings/MafftPresets.xml
new file mode 100644 (file)
index 0000000..794d20c
--- /dev/null
@@ -0,0 +1,62 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<presets>\r
+       <runnerClassName>compbio.runner.mafft.Mafft</runnerClassName>\r
+       <preset>\r
+               <name>L-INS-i (Accuracy-oriented)</name>\r
+               <description>L-INS-i (probably most accurate; recommended for &lt;200\r
+                       sequences; iterative refinement method incorporating local pairwise\r
+                       alignment information)</description>\r
+               <optlist>\r
+                       <option>--localpair</option>\r
+                       <option>--maxiterate 1000</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>G-INS-i (Accuracy-oriented)</name>\r
+               <description>G-INS-i (suitable for sequences of similar lengths;\r
+                       recommended for &lt;200 sequences; iterative refinement method\r
+                       incorporating global pairwise alignment information)</description>\r
+               <optlist>\r
+                       <option>--globalpair</option>\r
+                       <option>--maxiterate 1000</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>E-INS-i (Accuracy-oriented)</name>\r
+               <description>E-INS-i (suitable for sequences containing large\r
+                       unalignable regions; recommended for &lt;200 sequences)</description>\r
+               <optlist>\r
+                       <option>--ep 0</option>\r
+                       <option>--genafpair</option>\r
+                       <option>--maxiterate 1000</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>FFT-NS-i (Speed oriented)</name>\r
+               <description>FFT-NS-i (iterative refinement method; two cycles only)</description>\r
+               <optlist>\r
+                       <option>--retree 2</option>\r
+                       <option>--maxiterate 2</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>FFT-NS-1 (Speed oriented)</name>\r
+               <description>FFT-NS-1 (very fast; recommended for &gt;2000 sequences;\r
+                       progressive method with a rough guide tree)</description>\r
+               <optlist>\r
+                       <option>--retree 1</option>\r
+                       <option>--maxiterate 0</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>NW-NS-PartTree-1 (Speed oriented)</name>\r
+               <description>NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000\r
+                       sequences; progressive method with the PartTree algorithm)</description>\r
+               <optlist>\r
+                       <option>--retree 1</option>\r
+                       <option>--maxiterate 0</option>\r
+                       <option>--nofft</option>\r
+                       <option>--parttree</option>\r
+               </optlist>\r
+       </preset>\r
+</presets>\r
diff --git a/dundee-conf/settings/MuscleLimits.xml b/dundee-conf/settings/MuscleLimits.xml
new file mode 100644 (file)
index 0000000..88cfc61
--- /dev/null
@@ -0,0 +1,13 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<limits>\r
+ <runnerClassName>compbio.runner.muscle.Muscle</runnerClassName>\r
+       <limit isDefault="true">\r
+               <seqNumber>1000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="false">\r
+               <preset># LocalEngineExecutionLimit #</preset>\r
+               <seqNumber>40</seqNumber>\r
+               <seqLength>500</seqLength>\r
+       </limit>\r
+</limits>\r
diff --git a/dundee-conf/settings/MuscleParameters.xml b/dundee-conf/settings/MuscleParameters.xml
new file mode 100644 (file)
index 0000000..11c36d8
--- /dev/null
@@ -0,0 +1,289 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<runnerConfig>\r
+ <runnerClassName>compbio.runner.muscle.Muscle</runnerClassName>\r
+    <options isRequired="false">\r
+        <name>Group sequences</name>\r
+        <description>Group sequences by similarity (this is the default) or preserve the input order</description>\r
+        <optionNames>-group</optionNames>\r
+        <optionNames>-stable</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>-stable</defaultValue>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>Anchor optimisation</name>\r
+        <description>Enable/disable anchor optimization in tree dependent refinement iterations</description>\r
+        <optionNames>-anchors</optionNames>\r
+        <optionNames>-noanchors</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>-anchors</defaultValue>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>Root alignment computation method</name>\r
+        <description>Use Steven Brenner's method for computing the root alignment.</description>\r
+        <optionNames>-brenner</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+    </options>\r
+       <!-- This option make sense only in conjunction with -tree which we do not currently support\r
+   <options isRequired="false">\r
+        <name>Fast clustering of input sequences</name>\r
+        <description>Perform fast clustering of input sequences.</description>\r
+        <optionNames>-cluster</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+   </options>\r
+   -->\r
+   <options isRequired="false">\r
+        <name>dimer</name>\r
+        <description>Use dimer approximation for the SP score (faster, slightly less accurate)</description>\r
+        <optionNames>-dimer</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+   </options>\r
+    <options isRequired="false">\r
+        <name>Diagonal</name>\r
+        <description>Use diagonal optimizations. Faster, especially for closely related sequences, but may be less accurate.</description>\r
+        <optionNames>-diags</optionNames>\r
+    </options>\r
+    <options isRequired="false">\r
+        <name>Diagonal 1</name>\r
+        <description>Use diagonal optimizations in first iteration (faster for similar sequences)</description>\r
+        <optionNames>-diags1</optionNames>\r
+    </options>\r
+   <options isRequired="false">\r
+        <name>Profile scoring method</name>\r
+        <description>le - use log-expectation profile score VTML240 (default for amino acid sequences.)\r
+                                sp - use sum-of-pairs protein profile score (PAM200).\r
+                                sv - use sum-of-pairs profile score (VTML240)</description>\r
+        <optionNames>-le</optionNames>\r
+        <optionNames>-sp</optionNames>\r
+        <optionNames>-sv</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>-le</defaultValue>\r
+    </options>\r
+    <prmSeparator> </prmSeparator>\r
+       <parameters isRequired="false">\r
+        <name>Sequence type</name>\r
+        <description>Sequence type - Amino acid/Nucleotide </description>\r
+        <optionNames>-seqtype</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>auto</defaultValue>\r
+        <possibleValues>auto</possibleValues>\r
+        <possibleValues>protein</possibleValues>\r
+        <possibleValues>nucleo</possibleValues>\r
+    </parameters>\r
+       <parameters isRequired="false">\r
+        <name>Maxiters</name>\r
+        <description>Maximum number of iterations (integer, default 16)</description>\r
+        <optionNames>-maxiters</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>16</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>1</min>\r
+            <max>100</max>\r
+        </validValue>\r
+    </parameters>\r
+       <parameters isRequired="false">\r
+        <name>Matrix</name>\r
+        <description>Substitution Matrix to use</description>\r
+        <optionNames>-matrix</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>BLOSUM62</defaultValue>\r
+               <possibleValues>BLOSUM100</possibleValues>\r
+               <possibleValues>BLOSUM30</possibleValues>\r
+               <possibleValues>BLOSUM35</possibleValues>\r
+               <possibleValues>BLOSUM40</possibleValues>\r
+               <possibleValues>BLOSUM45</possibleValues>\r
+               <possibleValues>BLOSUM50</possibleValues>\r
+               <possibleValues>BLOSUM55</possibleValues>\r
+               <possibleValues>BLOSUM60</possibleValues>\r
+               <possibleValues>BLOSUM62</possibleValues>\r
+               <possibleValues>BLOSUM65</possibleValues>\r
+               <possibleValues>BLOSUM70</possibleValues>\r
+               <possibleValues>BLOSUM75</possibleValues>\r
+               <possibleValues>BLOSUM80</possibleValues>\r
+               <possibleValues>BLOSUM85</possibleValues>\r
+               <possibleValues>BLOSUM90</possibleValues>\r
+               <possibleValues>BLOSUMN</possibleValues>\r
+               <possibleValues>DAYHOFF</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+               <possibleValues>IDENTITY</possibleValues>\r
+               <possibleValues>MATCH</possibleValues>\r
+               <possibleValues>NUC.4.2</possibleValues>\r
+               <possibleValues>NUC.4.4</possibleValues>\r
+               <possibleValues>PAM10</possibleValues>\r
+               <possibleValues>PAM100</possibleValues>\r
+               <possibleValues>PAM110</possibleValues>\r
+               <possibleValues>PAM120</possibleValues>\r
+               <possibleValues>PAM130</possibleValues>\r
+               <possibleValues>PAM140</possibleValues>\r
+               <possibleValues>PAM150</possibleValues>\r
+               <possibleValues>PAM160</possibleValues>\r
+               <possibleValues>PAM170</possibleValues>\r
+               <possibleValues>PAM180</possibleValues>\r
+               <possibleValues>PAM190</possibleValues>\r
+               <possibleValues>PAM20</possibleValues>\r
+               <possibleValues>PAM200</possibleValues>\r
+               <possibleValues>PAM210</possibleValues>\r
+               <possibleValues>PAM220</possibleValues>\r
+               <possibleValues>PAM230</possibleValues>\r
+               <possibleValues>PAM240</possibleValues>\r
+               <possibleValues>PAM250</possibleValues>\r
+               <possibleValues>PAM260</possibleValues>\r
+               <possibleValues>PAM270</possibleValues>\r
+               <possibleValues>PAM280</possibleValues>\r
+               <possibleValues>PAM290</possibleValues>\r
+               <possibleValues>PAM30</possibleValues>\r
+               <possibleValues>PAM300</possibleValues>\r
+               <possibleValues>PAM310</possibleValues>\r
+               <possibleValues>PAM320</possibleValues>\r
+               <possibleValues>PAM330</possibleValues>\r
+               <possibleValues>PAM340</possibleValues>\r
+               <possibleValues>PAM350</possibleValues>\r
+               <possibleValues>PAM360</possibleValues>\r
+               <possibleValues>PAM370</possibleValues>\r
+               <possibleValues>PAM380</possibleValues>\r
+               <possibleValues>PAM390</possibleValues>\r
+               <possibleValues>PAM40</possibleValues>\r
+               <possibleValues>PAM400</possibleValues>\r
+               <possibleValues>PAM410</possibleValues>\r
+               <possibleValues>PAM420</possibleValues>\r
+               <possibleValues>PAM430</possibleValues>\r
+               <possibleValues>PAM440</possibleValues>\r
+               <possibleValues>PAM450</possibleValues>\r
+               <possibleValues>PAM460</possibleValues>\r
+               <possibleValues>PAM470</possibleValues>\r
+               <possibleValues>PAM480</possibleValues>\r
+               <possibleValues>PAM490</possibleValues>\r
+               <possibleValues>PAM50</possibleValues>\r
+               <possibleValues>PAM500</possibleValues>\r
+               <possibleValues>PAM60</possibleValues>\r
+               <possibleValues>PAM70</possibleValues>\r
+               <possibleValues>PAM80</possibleValues>\r
+               <possibleValues>PAM90</possibleValues>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Gap open penalty</name>\r
+        <description>Gap opening penalty.  Must be negative</description>\r
+        <optionNames>-gapopen</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>-12.0</defaultValue>\r
+        <validValue>\r
+               <type>Float</type>\r
+            <min>-100</min>\r
+            <max>0</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Gap extension penalty</name>\r
+        <description>Gap extension penalty.  Must be negative</description>\r
+        <optionNames>-gapextend</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>-1.0</defaultValue>\r
+        <validValue>\r
+               <type>Float</type>\r
+            <min>-100</min>\r
+            <max>0</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Center</name>\r
+        <description>Center parameter. Should be negative.</description>\r
+        <optionNames>-center</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>0.0</defaultValue>\r
+        <validValue>\r
+               <type>Float</type>\r
+            <min>-100</min>\r
+            <max>0</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Hydro</name>\r
+        <description>Window size for determining whether a region is hydrophobic.</description>\r
+        <optionNames>-hydro</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>5</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>100</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Hydrofactor</name>\r
+        <description>Multiplier for gap open/close penalties in hydrophobic regions.</description>\r
+        <optionNames>-hydrofactor</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>1.2</defaultValue>\r
+        <validValue>\r
+               <type>Float</type>\r
+            <min>0</min>\r
+            <max>10</max>\r
+        </validValue>\r
+    </parameters>\r
+       <parameters isRequired="false">\r
+        <name>cluster1</name>\r
+        <description>Clustering method to use on the iteration 1</description>\r
+        <optionNames>-cluster1</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>upgma</defaultValue>\r
+        <possibleValues>upgma</possibleValues>\r
+    </parameters>\r
+       <parameters isRequired="false">\r
+        <name>cluster2</name>\r
+        <description>Clustering method to use on the iteration 2 and all subsequent itarations</description>\r
+        <optionNames>-cluster2</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>upgmb</defaultValue>\r
+        <possibleValues>upgmb</possibleValues>\r
+        <possibleValues>neighborjoining</possibleValues>\r
+    </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Sequence weighting scheme 1</name>\r
+        <description>Sequence weighting scheme to use on the iteration 1 and 2 \r
+               none=all sequences have equal weight.\r
+               henikoff=Henikoff &amp; Henikoff weighting scheme.\r
+               henikoffpb=Modified Henikoff scheme as used in PSI-BLAST.\r
+               clustalw=CLUSTALW method.\r
+               threeway=Gotoh three-way method</description>\r
+        <optionNames>-weight1</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>clustalw</defaultValue>\r
+        <possibleValues>none</possibleValues>\r
+        <possibleValues>henikoff</possibleValues>\r
+        <possibleValues>henikoffpb</possibleValues>\r
+        <possibleValues>gsc</possibleValues>\r
+        <possibleValues>clustalw</possibleValues>\r
+        <possibleValues>threeway</possibleValues>\r
+    </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Sequence weighting scheme 2</name>\r
+        <description>Sequence weighting scheme to use on the iteration 3 and all subsequent \r
+        iterations for tree-dependent refinement.\r
+               none=all sequences have equal weight.\r
+               henikoff=Henikoff &amp; Henikoff weighting scheme.\r
+               henikoffpb=Modified Henikoff scheme as used in PSI-BLAST.\r
+               clustalw=CLUSTALW method.\r
+               threeway=Gotoh three-way method</description>\r
+        <optionNames>-weight2</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>clustalw</defaultValue>\r
+        <possibleValues>none</possibleValues>\r
+        <possibleValues>henikoff</possibleValues>\r
+        <possibleValues>henikoffpb</possibleValues>\r
+        <possibleValues>gsc</possibleValues>\r
+        <possibleValues>clustalw</possibleValues>\r
+        <possibleValues>threeway</possibleValues>\r
+    </parameters>\r
+       <parameters isRequired="false">\r
+        <name>Distance1</name>\r
+        <description>Distance measure for iteration 1. Defaults Kmer6_6 (for amino ) or Kmer4_6 (for nucleo)</description>\r
+        <optionNames>-distance1</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>kmer6_6</defaultValue>\r
+        <possibleValues>kmer6_6</possibleValues>\r
+        <possibleValues>kmer20_3</possibleValues>\r
+        <possibleValues>kbit20_3</possibleValues>\r
+        <possibleValues>kmer20_4</possibleValues>\r
+        <possibleValues>kmer4_6</possibleValues>\r
+    </parameters>\r
+</runnerConfig>\r
diff --git a/dundee-conf/settings/MusclePresets.xml b/dundee-conf/settings/MusclePresets.xml
new file mode 100644 (file)
index 0000000..190adad
--- /dev/null
@@ -0,0 +1,31 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<presets>\r
+       <runnerClassName>compbio.runner.muscle.Muscle</runnerClassName>\r
+       <preset>\r
+               <name>Protein alignment(Fastest speed)</name>\r
+               <description>Fastest possible speed for protein sequences. Gives acceptable quality alignments for closely related sequences</description>\r
+               <optlist>\r
+                       <option>-maxiters 1</option>\r
+                       <option>-diags</option>\r
+                       <option>-sv</option>\r
+                       <option>-distance1 kbit20_3</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>Nucleotide alignment(Fastest speed)</name>\r
+               <description>Fastest possible speed for nucleotide sequences. Gives acceptable quality alignments for closely related sequences</description>\r
+               <optlist>\r
+                       <option>-maxiters 1</option>\r
+                       <option>-diags</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>Huge alignments (speed-oriented)</name>\r
+               <description>Very large number of sequences (several thousand), or they are very long, </description>\r
+               <optlist>\r
+                       <option>-maxiters 1</option>\r
+                       <option>-diags1</option>\r
+                       <option>-sv</option>\r
+               </optlist>\r
+       </preset>\r
+</presets>\r
diff --git a/dundee-conf/settings/ProbconsLimits.xml b/dundee-conf/settings/ProbconsLimits.xml
new file mode 100644 (file)
index 0000000..96c8b31
--- /dev/null
@@ -0,0 +1,13 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<limits>\r
+ <runnerClassName>compbio.runner.probcons.Probcons</runnerClassName>\r
+       <limit isDefault="true">\r
+               <seqNumber>1000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="false">\r
+               <preset># LocalEngineExecutionLimit #</preset>\r
+               <seqNumber>30</seqNumber>\r
+               <seqLength>500</seqLength>\r
+       </limit>\r
+</limits>\r
diff --git a/dundee-conf/settings/ProbconsParameters.xml b/dundee-conf/settings/ProbconsParameters.xml
new file mode 100644 (file)
index 0000000..aa8ef07
--- /dev/null
@@ -0,0 +1,147 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<runnerConfig>\r
+ <runnerClassName>compbio.runner.probcons.Probcons</runnerClassName>\r
+    <!-- This is requires training -t, but training output probabil file instead of the alignment   \r
+    <options>\r
+        <name>Reestimate EP</name>\r
+        <description>Reestimate emission probabilities.</description>\r
+        <optionNames>-e</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+    </options>\r
+    -->\r
+    <options>\r
+        <name>Output aligned</name>\r
+        <description>Output sequences in alignment order rather than input order</description>\r
+        <optionNames>-a</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+    </options>\r
+    <prmSeparator> </prmSeparator>\r
+       <!-- unsupported in practice \r
+       <parameters>\r
+        <name>MATRIX</name>\r
+        <description>Protein weight matrix. Specifies the emission probabilities that are to be used for scoring alignments.</description>\r
+        <optionNames>-m</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>BLOSUM62</defaultValue>\r
+               <possibleValues>BLOSUM100</possibleValues>\r
+               <possibleValues>BLOSUM30</possibleValues>\r
+               <possibleValues>BLOSUM35</possibleValues>\r
+               <possibleValues>BLOSUM40</possibleValues>\r
+               <possibleValues>BLOSUM45</possibleValues>\r
+               <possibleValues>BLOSUM50</possibleValues>\r
+               <possibleValues>BLOSUM55</possibleValues>\r
+               <possibleValues>BLOSUM60</possibleValues>\r
+               <possibleValues>BLOSUM62</possibleValues>\r
+               <possibleValues>BLOSUM65</possibleValues>\r
+               <possibleValues>BLOSUM70</possibleValues>\r
+               <possibleValues>BLOSUM75</possibleValues>\r
+               <possibleValues>BLOSUM80</possibleValues>\r
+               <possibleValues>BLOSUM85</possibleValues>\r
+               <possibleValues>BLOSUM90</possibleValues>\r
+               <possibleValues>BLOSUMN</possibleValues>\r
+               <possibleValues>DAYHOFF</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+               <possibleValues>IDENTITY</possibleValues>\r
+               <possibleValues>MATCH</possibleValues>\r
+               <possibleValues>NUC.4.2</possibleValues>\r
+               <possibleValues>NUC.4.4</possibleValues>\r
+               <possibleValues>PAM10</possibleValues>\r
+               <possibleValues>PAM100</possibleValues>\r
+               <possibleValues>PAM110</possibleValues>\r
+               <possibleValues>PAM120</possibleValues>\r
+               <possibleValues>PAM130</possibleValues>\r
+               <possibleValues>PAM140</possibleValues>\r
+               <possibleValues>PAM150</possibleValues>\r
+               <possibleValues>PAM160</possibleValues>\r
+               <possibleValues>PAM170</possibleValues>\r
+               <possibleValues>PAM180</possibleValues>\r
+               <possibleValues>PAM190</possibleValues>\r
+               <possibleValues>PAM20</possibleValues>\r
+               <possibleValues>PAM200</possibleValues>\r
+               <possibleValues>PAM210</possibleValues>\r
+               <possibleValues>PAM220</possibleValues>\r
+               <possibleValues>PAM230</possibleValues>\r
+               <possibleValues>PAM240</possibleValues>\r
+               <possibleValues>PAM250</possibleValues>\r
+               <possibleValues>PAM260</possibleValues>\r
+               <possibleValues>PAM270</possibleValues>\r
+               <possibleValues>PAM280</possibleValues>\r
+               <possibleValues>PAM290</possibleValues>\r
+               <possibleValues>PAM30</possibleValues>\r
+               <possibleValues>PAM300</possibleValues>\r
+               <possibleValues>PAM310</possibleValues>\r
+               <possibleValues>PAM320</possibleValues>\r
+               <possibleValues>PAM330</possibleValues>\r
+               <possibleValues>PAM340</possibleValues>\r
+               <possibleValues>PAM350</possibleValues>\r
+               <possibleValues>PAM360</possibleValues>\r
+               <possibleValues>PAM370</possibleValues>\r
+               <possibleValues>PAM380</possibleValues>\r
+               <possibleValues>PAM390</possibleValues>\r
+               <possibleValues>PAM40</possibleValues>\r
+               <possibleValues>PAM400</possibleValues>\r
+               <possibleValues>PAM410</possibleValues>\r
+               <possibleValues>PAM420</possibleValues>\r
+               <possibleValues>PAM430</possibleValues>\r
+               <possibleValues>PAM440</possibleValues>\r
+               <possibleValues>PAM450</possibleValues>\r
+               <possibleValues>PAM460</possibleValues>\r
+               <possibleValues>PAM470</possibleValues>\r
+               <possibleValues>PAM480</possibleValues>\r
+               <possibleValues>PAM490</possibleValues>\r
+               <possibleValues>PAM50</possibleValues>\r
+               <possibleValues>PAM500</possibleValues>\r
+               <possibleValues>PAM60</possibleValues>\r
+               <possibleValues>PAM70</possibleValues>\r
+               <possibleValues>PAM80</possibleValues>\r
+               <possibleValues>PAM90</possibleValues>\r
+       </parameters>\r
+        -->\r
+    <parameters>\r
+        <name>Rounds of pre-training before aligning the sequences</name>\r
+        <description>This specifies the number of rounds of EM to be applied on the set of sequences being\r
+aligned. This option is used in case the default parameters are not appropriate for the\r
+particular sequences being aligned; in general, this option is not recommended as it may\r
+lead to unstable alignment parameters.</description>\r
+        <optionNames>-pre</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>0</defaultValue>\r
+         <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>20</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Passes of iterative refinement</name>\r
+        <description>This specifies the number of iterations of iterative refinement to be performed. In each\r
+stage of iterative refinement, the set of sequences in the alignment is randomly\r
+partitioned into two groups. After projecting the alignments to these groups, the two\r
+groups are realigned, resulting in an alignment whose objective score is guaranteed to be\r
+at least that of the original alignment</description>\r
+        <optionNames>-ir</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+         <defaultValue>100</defaultValue>\r
+         <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>1000</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters>\r
+        <name>Passes of consistency transformation</name>\r
+        <description>Each pass applies one round of the consistency transformation on the set of sequences.\r
+       The consistency transformation is described in detail in the mentioned papers. In each\r
+       round, the aligner computes the consistency transformation for each pair of sequences\r
+       using all other sequences. The aligner then updates the posterior probability matrices of\r
+       the pairwise alignments.</description>\r
+        <optionNames>-c</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>2</defaultValue>\r
+         <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>5</max>\r
+        </validValue>\r
+    </parameters>\r
+</runnerConfig>\r
diff --git a/dundee-conf/settings/TcoffeeLimits.xml b/dundee-conf/settings/TcoffeeLimits.xml
new file mode 100644 (file)
index 0000000..f21fb03
--- /dev/null
@@ -0,0 +1,13 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<limits>\r
+ <runnerClassName>compbio.runner.tcoffee.Tcoffee</runnerClassName>\r
+       <limit isDefault="true">\r
+               <seqNumber>1000</seqNumber>\r
+               <seqLength>1000</seqLength>\r
+       </limit>\r
+       <limit isDefault="false">\r
+               <preset># LocalEngineExecutionLimit #</preset>\r
+               <seqNumber>40</seqNumber>\r
+               <seqLength>500</seqLength>\r
+       </limit>\r
+</limits>\r
diff --git a/dundee-conf/settings/TcoffeeParameters.xml b/dundee-conf/settings/TcoffeeParameters.xml
new file mode 100644 (file)
index 0000000..a18052f
--- /dev/null
@@ -0,0 +1,367 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<runnerConfig>\r
+ <runnerClassName>compbio.runner.tcoffee.Tcoffee</runnerClassName>\r
+  <options isRequired="false">\r
+        <name>Search sequences in PDB</name>\r
+        <description>\r
+               Forces t_coffee to run extract_from_pdb to check the pdb status of each sequence. \r
+               This can considerably slow down the program.    \r
+               </description>\r
+        <optionNames>-check_pdb_status</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+   </options>\r
+   <prmSeparator>=</prmSeparator>\r
+   <!-- ERROR: When using -evaluate, Provide a multiple sequence alignment via the -infile flag [FATAL:T-COFFEE] \r
+      mcoffee: compares alignmens obtained by different programmes\r
+   -->\r
+    <parameters isRequired="false">\r
+        <name>Preset Mode</name>\r
+        <description>It indicates that t_coffee will use some hard coded parameters. These include:\r
+   quickaln: Very fast, sequence type - all, accuracy - medium low \r
+   </description>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <optionNames>-mode</optionNames>\r
+        <defaultValue>quickaln</defaultValue>\r
+        <possibleValues>quickaln</possibleValues>\r
+    </parameters>\r
+    <!--\r
+    All the options below need proper installation!\r
+    rcoffee does not work as it fails to find the "templates" \r
+    <description>\r
+               This require blast to be setup properly see also Presets\r
+          dali: a mode used to combine dali pairwise alignments\r
+          3dcoffee: runs t_coffee with the 3dcoffee parameterization\r
+          accurate: slow, sequence type - protein, accuracy - high\r
+       expresso: slow, sequence type - all, accuracy - high\r
+          rcoffee: slow, sequence type - RNA, accuracy - high\r
+       </description>\r
+       <possibleValues>expresso</possibleValues>\r
+    <possibleValues>dali</possibleValues>\r
+    <possibleValues>3dcoffee</possibleValues>\r
+    <possibleValues>accurate</possibleValues>\r
+    <possibleValues>rcoffee</possibleValues>\r
+     -->\r
+<!-- Parameter with textual value \r
+    <parameters isRequired="false">\r
+        <name>Structures</name>\r
+        <description>Reads or fetch a pdb file. Please enter up to 200 pdb identifiers </description>\r
+        <optionNames>-pdb</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+    </parameters>\r
+    -->\r
+    <parameters isRequired="false">\r
+        <name>Distance matrix computation method</name>\r
+        <description>\r
+       This flag indicates the method used for computing the distance matrix (distance between every pair of sequences) required for the computation of the dendrogram. \r
+       Slow   The chosen dp_mode using the extended library, \r
+       fast:   The fasta dp_mode using the extended library.\r
+       very_fast          The fasta dp_mode using blosum62mt.\r
+       ktup    Ktup matching (Muscle kind) \r
+       aln     Read the distances on a precomputed MSA</description>\r
+        <optionNames>-distance_matrix_mode</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>very_fast</defaultValue>\r
+               <possibleValues>slow</possibleValues>\r
+        <possibleValues>fast</possibleValues>\r
+        <possibleValues>very_fast</possibleValues>\r
+        <possibleValues>ktup</possibleValues>\r
+        <possibleValues>aln</possibleValues>\r
+    </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Tree Computation method</name>\r
+        <description>\r
+       gotoh_pair_wise: implementation of the gotoh algorithm (quadratic in memory and time)\r
+       myers_miller_pair_wise: implementation of the Myers and Miller dynamic programming algorithm ( quadratic in time and linear in space). This algorithm is recommended for very long sequences. It is about 2 times slower than gotoh and only accepts tg_mode=1or 2 (i.e. gaps penalized for opening).\r
+       fasta_pair_wise: implementation of the fasta algorithm. The sequence is hashed, looking for ktuples words. Dynamic programming is only carried out on the ndiag best scoring diagonals. This is much faster but less accurate than the two previous. This mode is controlled by the parameters -ktuple, -diag_mode and -ndiag\r
+       cfasta_pair_wise: c stands for checked. It is the same algorithm. The dynamic programming is made on the ndiag best diagonals, and then on the 2*ndiags, and so on until the scores converge. Complexity will depend on the level of divergence of the sequences, but will usually be L*log(L), with an accuracy comparable to the two first mode ( this was checked on BaliBase). This mode is controlled by the parameters -ktuple, -diag_mode and -ndiag\r
+               </description>\r
+        <optionNames>-dp_mode</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>cfasta_pair_wise</defaultValue>\r
+               <possibleValues>gotoh_pair_wise</possibleValues>\r
+        <possibleValues>myers_miller_pair_wise</possibleValues>\r
+        <possibleValues>fasta_pair_wise</possibleValues>\r
+        <possibleValues>cfasta_pair_wise</possibleValues>\r
+    </parameters>\r
+<!-- This should be groupped with -dp_mode -->\r
+    <parameters isRequired="false">\r
+        <name>Number of diagonals used by the fasta_pair_wise algorithm</name>\r
+        <description>\r
+       Indicates the number of diagonals used by the fasta_pair_wise algorithm (cf -dp_mode). When  -ndiag=0, n_diag=Log (length of the smallest sequence)+1. \r
+       When -ndiag and -diag_threshold are set, diagonals are selected if and only if they fulfill both conditions.\r
+               </description>\r
+        <optionNames>-ndiag</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>1000</max>\r
+        </validValue>\r
+    </parameters>\r
+    <parameters isRequired="false">\r
+        <name>Number of diagonals used by the fasta_pair_wise algorithm</name>\r
+        <description>\r
+       Indicates the manner in which diagonals are scored during the fasta hashing. \r
+0: indicates that the score of a diagonal is equal to the sum of the scores of the exact matches it contains. \r
+1 indicates that this score is set equal to the score of the best uninterrupted segment (useful when dealing with fragments of sequences).\r
+               </description>\r
+        <optionNames>-diag_mode</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+               <possibleValues>0</possibleValues>\r
+               <possibleValues>1</possibleValues>\r
+    </parameters>\r
+ <parameters isRequired="false">\r
+        <name>Diagonal threshold</name>\r
+        <description>\r
+       Sets the value of the threshold when selecting diagonals. \r
+       0: indicates that -ndiag should be used to select the diagonals (cf -ndiag section).\r
+               </description>\r
+        <optionNames>-diag_threshold</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>1000</max>\r
+        </validValue>\r
+    </parameters>\r
+ <parameters isRequired="false">\r
+        <name>Alphabet degeneration method</name>\r
+        <description>\r
+       Indicates the manner in which the amino acid alphabet is degenerated when hashing in the \r
+       fasta_pairwise dynamic programming. Standard ClustalW matrices are all valid. \r
+       They are used to define groups of amino acids having positive substitution values. \r
+       In T-Coffee, the default is a 13 letter grouping named Vasiliky, with residues grouped as follows:\r
+       rk, de, qh, vilm, fy (other residues kept alone).\r
+       This alphabet is set with the flag -sim_matrix=vasiliky. \r
+       In order to keep the alphabet non degenerated, -sim_matrix=idmat can be used to retain \r
+       the standard alphabet.\r
+               </description>\r
+        <optionNames>-sim_matrix</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>vasiliky</defaultValue>\r
+               <possibleValues>vasiliky</possibleValues>\r
+               <possibleValues>idmat</possibleValues>\r
+  </parameters>\r
+ <parameters isRequired="false">\r
+        <name>Substitution Matrix</name>\r
+        <description>\r
+This flag sets the matrix that will be used by alignment methods within t_coffee (slow_pair, lalign_id_pair). It does not affect external methods (like clustal_pair, clustal_aln). \r
+Users can also provide their own matrices, using the matrix format described in the appendix.\r
+               </description>\r
+        <optionNames>-matrix</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <possibleValues>blosum62mt</possibleValues>\r
+       <!-- This option causes tcoffee to fail  \r
+       <parameters isRequired="false">\r
+        <name>Matrix</name>\r
+        <description>Substitution Matrix to use</description>\r
+        <optionNames>-matrix</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+        <defaultValue>BLOSUM62</defaultValue>\r
+               <possibleValues>BLOSUM100</possibleValues>\r
+               <possibleValues>BLOSUM30</possibleValues>\r
+               <possibleValues>BLOSUM35</possibleValues>\r
+               <possibleValues>BLOSUM40</possibleValues>\r
+               <possibleValues>BLOSUM45</possibleValues>\r
+               <possibleValues>BLOSUM50</possibleValues>\r
+               <possibleValues>BLOSUM55</possibleValues>\r
+               <possibleValues>BLOSUM60</possibleValues>\r
+               <possibleValues>BLOSUM62</possibleValues>\r
+               <possibleValues>BLOSUM65</possibleValues>\r
+               <possibleValues>BLOSUM70</possibleValues>\r
+               <possibleValues>BLOSUM75</possibleValues>\r
+               <possibleValues>BLOSUM80</possibleValues>\r
+               <possibleValues>BLOSUM85</possibleValues>\r
+               <possibleValues>BLOSUM90</possibleValues>\r
+               <possibleValues>BLOSUMN</possibleValues>\r
+               <possibleValues>DAYHOFF</possibleValues>\r
+               <possibleValues>GONNET</possibleValues>\r
+               <possibleValues>IDENTITY</possibleValues>\r
+               <possibleValues>MATCH</possibleValues>\r
+               <possibleValues>NUC.4.2</possibleValues>\r
+               <possibleValues>NUC.4.4</possibleValues>\r
+               <possibleValues>PAM10</possibleValues>\r
+               <possibleValues>PAM100</possibleValues>\r
+               <possibleValues>PAM110</possibleValues>\r
+               <possibleValues>PAM120</possibleValues>\r
+               <possibleValues>PAM130</possibleValues>\r
+               <possibleValues>PAM140</possibleValues>\r
+               <possibleValues>PAM150</possibleValues>\r
+               <possibleValues>PAM160</possibleValues>\r
+               <possibleValues>PAM170</possibleValues>\r
+               <possibleValues>PAM180</possibleValues>\r
+               <possibleValues>PAM190</possibleValues>\r
+               <possibleValues>PAM20</possibleValues>\r
+               <possibleValues>PAM200</possibleValues>\r
+               <possibleValues>PAM210</possibleValues>\r
+               <possibleValues>PAM220</possibleValues>\r
+               <possibleValues>PAM230</possibleValues>\r
+               <possibleValues>PAM240</possibleValues>\r
+               <possibleValues>PAM250</possibleValues>\r
+               <possibleValues>PAM260</possibleValues>\r
+               <possibleValues>PAM270</possibleValues>\r
+               <possibleValues>PAM280</possibleValues>\r
+               <possibleValues>PAM290</possibleValues>\r
+               <possibleValues>PAM30</possibleValues>\r
+               <possibleValues>PAM300</possibleValues>\r
+               <possibleValues>PAM310</possibleValues>\r
+               <possibleValues>PAM320</possibleValues>\r
+               <possibleValues>PAM330</possibleValues>\r
+               <possibleValues>PAM340</possibleValues>\r
+               <possibleValues>PAM350</possibleValues>\r
+               <possibleValues>PAM360</possibleValues>\r
+               <possibleValues>PAM370</possibleValues>\r
+               <possibleValues>PAM380</possibleValues>\r
+               <possibleValues>PAM390</possibleValues>\r
+               <possibleValues>PAM40</possibleValues>\r
+               <possibleValues>PAM400</possibleValues>\r
+               <possibleValues>PAM410</possibleValues>\r
+               <possibleValues>PAM420</possibleValues>\r
+               <possibleValues>PAM430</possibleValues>\r
+               <possibleValues>PAM440</possibleValues>\r
+               <possibleValues>PAM450</possibleValues>\r
+               <possibleValues>PAM460</possibleValues>\r
+               <possibleValues>PAM470</possibleValues>\r
+               <possibleValues>PAM480</possibleValues>\r
+               <possibleValues>PAM490</possibleValues>\r
+               <possibleValues>PAM50</possibleValues>\r
+               <possibleValues>PAM500</possibleValues>\r
+               <possibleValues>PAM60</possibleValues>\r
+               <possibleValues>PAM70</possibleValues>\r
+               <possibleValues>PAM80</possibleValues>\r
+               <possibleValues>PAM90</possibleValues>\r
+   </parameters>\r
+    -->\r
+    \r
+   </parameters>\r
+ <parameters isRequired="false">\r
+        <name>Match penalty</name>\r
+        <description>\r
+                       Indicates the penalty to associate with a match. When using a library, \r
+                       all matches are positive or equal to 0. Matches equal to 0 are unsupported by the \r
+                       library but non-penalized. Setting nomatch to a non-negative value makes it possible \r
+                       to penalize these null matches and prevent unrelated sequences from being aligned \r
+                       (this can be useful when the alignments are meant to be used for structural modeling)</description>\r
+        <optionNames>-nomatch</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>0</min>\r
+            <max>1000</max>\r
+        </validValue>\r
+   </parameters>\r
+ <parameters isRequired="false">\r
+        <name>Gap opening penalty</name>\r
+        <description>\r
+               Indicates the penalty applied for opening a gap. The penalty must be negative. \r
+               If no value is provided when using a substitution matrix, a value will be automatically computed.\r
+               Here are some guidelines regarding the tuning of gapopen and gapext. \r
+               In T-Coffee matches get a score between 0 (match) and 1000 (match perfectly consistent with the library).\r
+               The default cosmetic penalty is set to -50 (5% of a perfect match). \r
+               If you want to tune -gapoen and see a strong effect, you should therefore consider values between 0 \r
+               and -1000. \r
+               </description>\r
+        <optionNames>-gapopen</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>-1000</min>\r
+            <max>0</max>\r
+        </validValue>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Gap extension penalty</name>\r
+        <description>\r
+               Indicates the penalty applied for extending a gap. The penalty must be negative. \r
+               </description>\r
+        <optionNames>-gapext</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>-1000</min>\r
+            <max>0</max>\r
+        </validValue>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Cosmetic penalty</name>\r
+        <description>\r
+       Indicates the penalty applied for opening a gap. The penalty must be negative and is set to a very low value by default.\r
+       It will only have an influence on the portions of the alignment that are unalignable. \r
+       It will not make them more correct, but only more pleasing to the eye ( i.e. Avoid stretches \r
+       of lonely residues). The cosmetic penalty is automatically turned off if a substitution matrix is \r
+       used rather than a library.\r
+               </description>\r
+        <optionNames>-cosmetic_penalty</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>-50</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>-1000</min>\r
+            <max>0</max>\r
+        </validValue>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Terminal gaps penalty</name>\r
+        <description>\r
+               0: terminal gaps penalized with -gapopen + -gapext*len\r
+               1: terminal gaps penalized with a -gapext*len\r
+               2: terminal gaps unpenalized.\r
+               </description>\r
+        <optionNames>-tg_mode</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>1</defaultValue>\r
+               <possibleValues>0</possibleValues>\r
+               <possibleValues>1</possibleValues>\r
+               <possibleValues>2</possibleValues>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Number of iterations</name>\r
+        <description>\r
+                       Sequences are extracted in turn and realigned to the MSA. \r
+                       If iterate is set to -1, each sequence is realigned, otherwise the number of iterations is \r
+                       set by -iterate.\r
+               </description>\r
+        <optionNames>-iterate</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>0</defaultValue>\r
+        <validValue>\r
+               <type>Integer</type>\r
+            <min>-1</min>\r
+            <max>100</max>\r
+        </validValue>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Output order</name>\r
+        <description>\r
+               Sets the order of the sequences in the output alignment: -outorder=input means the sequences \r
+               are kept in the original order. -outorder=aligned means the sequences come in the order \r
+               indicated by the tree. This order can be seen as a one-dimensional projection of the tree distances. \r
+               </description>\r
+        <optionNames>-outorder</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>input</defaultValue>\r
+               <possibleValues>input</possibleValues>\r
+               <possibleValues>aligned</possibleValues>\r
+   </parameters>\r
+  <parameters isRequired="false">\r
+        <name>Input order</name>\r
+        <description>\r
+               Multiple alignments based on dynamic programming depend slightly on the order in which \r
+               the incoming sequences are provided. To prevent this effect sequences are arbitrarily \r
+               sorted at the beginning of the program (-inorder=aligned). \r
+               However, this affects the sequence order within the library. \r
+               You can switch this off by setting -inorder=input\r
+               </description>\r
+        <optionNames>-inorder</optionNames>\r
+        <furtherDetails>http://www.compbio.dundee.ac.uk/users/pvtroshin/ws/Index.html</furtherDetails>\r
+               <defaultValue>aligned</defaultValue>\r
+               <possibleValues>input</possibleValues>\r
+               <possibleValues>aligned</possibleValues>\r
+   </parameters>\r
+</runnerConfig>\r
diff --git a/dundee-conf/settings/TcoffeePresets.xml b/dundee-conf/settings/TcoffeePresets.xml
new file mode 100644 (file)
index 0000000..585bb21
--- /dev/null
@@ -0,0 +1,54 @@
+<?xml version="1.0" encoding="US-ASCII" standalone="yes"?>\r
+<presets>\r
+       <runnerClassName>compbio.runner.tcoffee.Tcoffee</runnerClassName>\r
+       <preset>\r
+               <name>Quick align. Very fast approximate (Speed-oriented)</name>\r
+               <description>quickaln: Very fast, sequence type - all, accuracy - medium low</description>\r
+               <optlist>\r
+                       <option>-mode quickaln</option>\r
+               </optlist>\r
+       </preset>\r
+       <!-- does not work\r
+       <preset>\r
+               <name>Dali (Speed-oriented)</name>\r
+               <description>dali: a mode used to combine dali pairwise alignments</description>\r
+               <optlist>\r
+                       <option>-mode dali</option>\r
+               </optlist>\r
+       </preset>\r
+       -->\r
+       <!-- This requires Blast to operate, however i do not know how to plug it to t-coffee. \r
+       The build in one does not work.  \r
+       <preset>\r
+               <name>3dcoffee (Accuracy-oriented)</name>\r
+               <description>3dcoffee: runs t_coffee with the 3dcoffee  parameterization</description>\r
+               <optlist>\r
+                       <option>-mode 3dcoffee</option>\r
+               </optlist>\r
+       </preset>\r
+       <preset>\r
+               <name>Accurate (Accuracy-oriented)</name>\r
+               <description>accurate: slow, sequence type - protein, accuracy - high</description>\r
+               <optlist>\r
+                       <option>-mode accurate</option>\r
+               </optlist>\r
+       </preset>\r
+       could not find templates(?)\r
+       <preset>\r
+               <name>Rcoffee for RNA only (accuracy-oriented)</name>\r
+               <description> rcoffee: slow, sequence type - RNA, accuracy - high</description>\r
+               <optlist>\r
+                       <option>-mode rcoffee</option>\r
+               </optlist>\r
+       </preset>\r
+        -->\r
+        <!-- This needs blast\r
+       <preset>\r
+               <name>Expresso (accuracy-oriented)</name>\r
+               <description> expresso: slow, sequence type - all, accuracy - high</description>\r
+               <optlist>\r
+                       <option>-mode expresso</option>\r
+               </optlist>\r
+       </preset>\r
+        --> \r
+</presets>\r