Jalview 2.6 source licence
[jalview.git] / help / html / features / annotationsFormat.html
1 <html>
2 <!--
3  * Jalview - A Sequence Alignment Editor and Viewer (Version 2.6)
4  * Copyright (C) 2010 J Procter, AM Waterhouse, G Barton, M Clamp, S Searle
5  * 
6  * This file is part of Jalview.
7  * 
8  * Jalview is free software: you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License 
10  * as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version.
11  * 
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
18 -->
19 <head>
20 <title>The Alignment Annotations File</title>
21 </head>
22
23 <body>
24 <p><strong>The Alignment Annotations File</strong></p>
25 <p>Alignment annotations can be imported onto an alignment since
26 version 2.08 of Jalview, via an annotations file. It is a simple ASCII
27 text file consisting of tab delimited records similar to the <a
28         href="featuresFormat.html">Sequence Features File</a>, and introduced
29 primarily for use with the Jalview applet.</p>
30 <p>Alignment annotations files are imported into Jalview in the
31 following ways:<br>
32 <ul>
33         <li>from the command line<strong><pre>
34  -annotations &lt;<em>Annotations filename</em>&gt;</pre></strong></li>
35         <li>Dragging an annotations file onto an alignment window</li>
36         <li>Via the &quot;Load Features / Annotations&quot; entry in the <strong>File</strong>
37         menu of an alignment window.</li>
38 </ul>
39 </p>
40 <p><strong>Annotations File Format</strong></p>
41 <p>The File consists of lines containing an instruction followed by
42 tab delimited fields, and any lines starting with &quot;#&quot; are
43 ignored. The first non-commented out line of a valid Annotations file
44 must begin with :<strong><pre>JALVIEW_ANNOTATION</pre></strong></p>
45 <p>A row of annotation is added with a line like <strong><pre><em>GRAPH_TYPE</em>&#9;<em>Label</em>&#9;<em>Values</em></pre></strong></p>
46 <p>The <em>GRAPH_TYPE</em> field, which appears first, defines the
47 appearance of the annotation row when rendered by Jalview. The next field is the row label for the annotation. The final <em>Values</em> field contains a series of &quot;|&quot;
48 separated value fields. Each value field is itself a comma separated list of fields of a particular type defined by the annotation row's
49 GRAPH_TYPE. The allowed values of GRAPH_TYPE and the format of their respective value fields (with the trailing &quot;<strong>|</strong>&quot; symbol) are shown below:<ul>
50         <li>BAR_GRAPH<br>
51         Plots a histogram with labels below each bar.<br>
52         <em>number</em>,<em>text character</em>,<em>Tooltip text</em></li>
53         <li>LINE_GRAPH<br>
54         Draws a line between values on the annotation row.<br>
55         <em>number</em></li>
56         <li>NO_GRAPH<br>
57         For a row consisting of text labels and/or secondary structure symbols.<br>
58         <em>{Secondary Structure Symbol}</em>,<em>text label</em>,<em>Tooltip text</em><br>
59         Currently supported secondary structure structure symbols are <em>H</em> (for   helix) and <em>E</em> (for strand)</li>
60 </ul>
61 Any or all value fields may be left empty, as well as the BAR_GRAPH's
62 text character field, and either or both of the text-label and secondary
63 structure symbol fields of the NO_GRAPH type annotation rows.</p>
64 <p>Color strings can be embedded in a value field by enclosing an RGB triplet in square brackets to colour that position in an annotation row.  
65 </p>
66 <p>You can associate an annotation with a sequence by preceding its
67 definition with the line: 
68 <pre>SEQUENCE_REF&#9;<em>seq_name</em>&#9;<em>[startIndex]</em></pre>
69 All Annotations defined after a SEQUENCE_REF command will then be
70 associated with that sequence, and the first field in the Value field
71 list will (optionally) be placed at the <em>startIndex</em>'th column.</p>
72 <ul><em>New in Jalview 2.4</em>: the tooltip displayed when the mouse is moved over the row 
73 label for sequence associated annotation  gives the associated 
74 sequence's name followed by the annotation row's description.<br/>
75 <em>New in Jalview 2.5 Desktop</em>: Clicking on a sequence or group associated annotation row's label will highlight the sequence or sequence group in the alignment, and double clicking the annotation row label will select the associated sequence or group.</ul> 
76 <p>Sequence associations are turned off for subsequent annotation
77 definitions by: 
78 <pre>SEQUENCE_REF&#9;ALIGNMENT</pre>
79 </p>
80 <p>Since version 2.5, Jalview allows annotation rows to be associated with a group defined on the alignment, by preceding the annotation row with the line:
81 <pre>GROUP_REF&#9;<em>group_name</em></pre>
82 Group association is turned off for subsequent annotation rows by 
83 <pre>GROUP_REF&#9;<em>ALIGNMENT</em></pre>
84 Annotations may be associated with both a sequence and a group, however - group annotations are still experimental and unexpected behaviour may be observed when editing alignments containing both group and sequence associated annotation rows.</p>
85 <p><em>LINE_GRAPH</em> type annotations can be given a colour
86 (specified as 24 bit RGB triplet in hexadecimal or comma separated
87 values), combined onto the same vertical axis, and have ordinate lines
88 (horizontal lines at a particular vertical axis value) using the
89 following commands (respectively): 
90 <pre>COLOUR&#9;<em>graph_name</em>&#9;<em>colour</em>
91 COMBINE&#9;<em>graph_1_name</em>&#9;<em>graph_2_name</em>
92 GRAPHLINE&#9;<em>graph_name</em>&#9;<em>value</em>&#9;<em>label</em>&#9;<em>colour</em><strong><em>
93 </em></strong></pre>
94 <h3><font face="Arial, Helvetica, sans-serif">(Since Jalview 2.5) ROWPROPERTIES</font></h3>
95 <p>The visual display properties for a set of annotation rows can be modified using the following tab-delimited line:</p>
96 <pre>ROWPROPERTIES&#9;<em>Row label</em>&#9;<em>centrelabs=true( or false)</em>&#9;<em>showalllabs=true(default is false)</em>&#9;<em>scaletofit=true (default is false)</em></pre>
97 <p>This sets the visual display properties according to the given values for all the annotation rows with labels matching <em>Row label</em>. The properties mostly affect the display of multi-character column labels, and are as follows:
98 <ul><li><em>centrelabs</em> Centre each label on its column.</li>
99 <li><em>showalllabs</em> Show every column label rather than only the first of a run of identical labels (setting this to true can have a drastic effect on secondary structure rows).</li>
100 <li><em>scaletofit</em> Shrink each label's font size so that the label fits within the column. Useful when annotating an alignment with a specific column numbering system. (<em>Not available in Jalview applet due to AWT 1.1 limitations</em>)</li>
101 </ul></p>
102 <h3><font face="Arial, Helvetica, sans-serif">(Since Jalview 2.2.1) SEQUENCE_GROUP</font></h3>
103 <p>Groups of sequences can be defined using the tab delimited line</p>
104 <pre>SEQUENCE_GROUP     Group_Name      Group_Start     Group_End       Sequences</pre>
105 <p>The sequences can be defined by alignment index and a range of sequences can 
106   be defined in a comma delimited field such as</p>
107 <p>2-5,8-15,20,22</p>
108 <p>Enter * to select all groups. </p>
109 <p>If the alignment indices are not known, enter -1 then a tab delimited list 
110   of sequence ids. </p>
111 <p>If the SEQUENCE_REF has been defined, the group_start and group_end will be 
112   relative to the sequence residue numbering, otherwise the group_start and group_end 
113   will be the alignment column indices. </p>
114 <p>The group can (optionally) be assigned various visualisation properties via 
115   another tab delimited line thus:</p>
116 <pre>PROPERTIES Group_name      tab_delimited_key_value_pairs
117 </pre>
118 <p>The key_value_pairs allow you to define a description and to colour the group 
119   in various ways. All, none or some of the following values could be used for 
120   a group:</p>
121 <p>description=Text <br>
122   colour=Helix Propensity<br>
123   pidThreshold=0<br>
124   consThreshold=0<br>
125   outlineColour=red <br>
126   displayBoxes=true<br>
127   displayText=false<br>
128   colourText=false<br>
129   textCol1=black<br>
130   textCol2=black<br>
131   textColThreshold=0<br>
132   idColour=ff3322<br>
133  <!-- Not yet implemented in 2.5 release 
134   hide=false<br>
135   hidecols=false<br> -->
136   showunconserved=false</p>
137 <ul><li><em>New Features in 2.4:</em><br>if the <strong>idColour</strong> property
138 is given without specifying a colour scheme with the <strong>colour</strong>
139 property, then the idColour will also be used to colour the sequence.</li>
140 <li>the <strong>colour</strong> property can take either a colour scheme name,
141  or a single colour specification (either a colour name like 'red' or an RGB
142  triplet like 'ff0066'). If a single colour is specified, then the group
143  will be coloured with that colour.</li>
144  <!--  <li><em>New Features in 2.5</em></li>
145  <li>hide and hidecols instruct jalview to hide the sequences or columns covered by the group.</li> -->
146   <li>Sequence associated Groups<br>If a group is defined after a valid
147  <em>SEQUENCE_REF</em> sequence reference statement, the sequence representative
148  for the group will be set to the referenced sequence.<!-- <br><strong>Note:</strong> if the <em>hide</em> 
149  property is set then only the representative sequence for the group will be shown in the alignment.--></li>
150 </ul>
151 <p> </p>
152 <p>An example Annotation file is given below:
153 <pre>#Comment lines follow the hash symbol
154 JALVIEW_ANNOTATION
155 SEQUENCE_REF&#9;FER1_MESCR&#9;5
156 BAR_GRAPH&#9;Bar Graph 1&#9;||-100,-|-200,-|-300,-|-400,-|200,+|300,+|150,+
157 LINE_GRAPH&#9;Green Values&#9;1.1|2.2|1.3|3.4|0.7|1.4|3.3|2.2|2.1|-1.1|3.2
158 LINE_GRAPH&#9;Red Values&#9;2.1|3.2|1.3|-1.4|5.5|1.4|1.3|4.2|-1.1|1.1|3.2
159 BAR_GRAPH&#9;Bar Graph&#9;2 1,.|2,*|3,:|4,.|5,*|4,:|3,.|2|1|1|2|3|4|5|4
160 NO_GRAPH&#9;Icons &#9;||||E,Sheet1|E|E||||H,Sheet 2|H|H|H||||||
161 NO_GRAPH&#9;Purple Letters&#9;m|y|p|r|o|t|e|i|n
162 COLOUR&#9;Bar Graph 2&#9;blue
163 COLOUR&#9;Red Values&#9;255,0,0
164 COLOUR&#9;Green Values&#9;green
165 COLOUR&#9;Purple Letters&#9;151,52,228
166 COMBINE&#9;Green Values&#9;Red Values
167 GRAPHLINE&#9;Red Values&#9;2.6&#9;threshold&#9;black
168
169 SEQUENCE_GROUP Group_A 30 50 *
170 SEQUENCE_GROUP Group_B 1 351 2-5
171 SEQUENCE_GROUP Group_C 12 14 -1 seq1    seq2    seq3
172 PROPERTIES Group_A description=This is the description colour=Helix Propensity pidThreshold=0 outlineColour=red displayBoxes=true displayText=false     colourText=false textCol1=black textCol2=black textColThreshold=0
173 PROPERTIES Group_B outlineColour=red
174 PROPERTIES Group_C colour=Clustal
175 </pre>
176 </p>
177 </body>
178 </html>