JAL-1432 updated copyright notices
[jalview.git] / help / html / features / annotationsFormat.html
1 <html>
2 <!--
3  * Jalview - A Sequence Alignment Editor and Viewer (Version 2.8.0b1)
4  * Copyright (C) 2014 The Jalview Authors
5  * 
6  * This file is part of Jalview.
7  * 
8  * Jalview is free software: you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License 
10  * as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
18  * The Jalview Authors are detailed in the 'AUTHORS' file.
19 -->
20 <head>
21 <title>The Alignment Annotations File</title>
22 </head>
23
24 <body>
25 <p><strong>The Alignment Annotations File</strong></p>
26 <p>Alignment annotations can be imported onto an alignment since
27 version 2.08 of Jalview, via an annotations file. It is a simple ASCII
28 text file consisting of tab delimited records similar to the <a
29         href="featuresFormat.html">Sequence Features File</a>, and introduced
30 primarily for use with the Jalview applet.</p>
31 <p>Alignment annotations files are imported into Jalview in the
32 following ways:<br>
33 <ul>
34         <li>from the command line<strong><pre>
35  -annotations &lt;<em>Annotations filename</em>&gt;</pre></strong></li>
36         <li>Dragging an annotations file onto an alignment window</li>
37         <li>Via the &quot;Load Features / Annotations&quot; entry in the <strong>File</strong>
38         menu of an alignment window.</li>
39 </ul>
40 </p>
41 <p><h3><font face="Arial, Helvetica, sans-serif">Format of an Annotations File</font></h3>
42 <p>The file consists of lines containing an instruction followed by
43 tab delimited fields, and any lines starting with &quot;#&quot; are
44 ignored. The first non-commented out line of a valid Annotations file
45 must begin with :<strong><pre>JALVIEW_ANNOTATION</pre></strong></p>
46 <p>A row of annotation is added with a line like <strong><pre><em>GRAPH_TYPE</em>&#9;<em>Label</em>&#9;<em>Description</em> (optional)&#9;<em>Values</em></pre></strong></p>
47         <p>
48                 The <em>GRAPH_TYPE</em> field, which appears first, defines the
49                 appearance of the annotation row when rendered by Jalview. The next
50                 field is the row <em>label</em> for the annotation. This may be
51                 followed by a <em>description</em> for the row, which is shown in a
52                 tooltip when the user mouses over the annotation row's label. Since
53                 Jalview 2.7, the description field may also contain html in the same
54                 way as a <a href="featuresFile.html">sequence feature's</a> label,
55                 providing the html is enclosed in an &lt;html/&gt; tag.
56         
57         <ul><em>Please note: URL links embedded in HTML descriptions will
58                                 be supported in a future release of Jalview</em>
59         </ul>
60         </p>
61                 <p>The final <em>Values</em>
62                 field contains a series of &quot;|&quot; separated value fields. Each
63                 value field is itself a comma separated list of fields of a particular
64                 type defined by the annotation row's GRAPH_TYPE. The allowed values of
65                 GRAPH_TYPE and the format of their respective value fields (with the
66                 trailing &quot;<strong>|</strong>&quot; symbol) are shown below:
67         
68         <ul>
69                 <li>BAR_GRAPH<br> Plots a histogram with labels below each
70                         bar.<br> <em>number</em>,<em>text character</em>,<em>Tooltip
71                                 text</em>
72                 </li>
73                 <li>LINE_GRAPH<br> Draws a line between values on the
74                         annotation row.<br> <em>number</em>
75                 </li>
76                 <li>NO_GRAPH<br> For a row consisting of text labels and/or
77                         secondary structure symbols.<br> <em>{Secondary Structure
78                                 Symbol}</em>,<em>text label</em>,<em>Tooltip text</em><br> Currently
79                         supported secondary structure structure symbols are <em>H</em> (for
80                         helix) and <em>E</em> (for strand)</li>
81         </ul>
82         Any or all value fields may be left empty, as well as the BAR_GRAPH's
83 text character field, and either or both of the text-label and secondary
84 structure symbol fields of the NO_GRAPH type annotation rows.</p>
85 <p>Color strings can be embedded in a value field by enclosing an RGB triplet in square brackets to colour that position in an annotation row.  
86 </p>
87 <p><h3><font face="Arial, Helvetica, sans-serif">SEQUENCE_REF and GROUP_REF</font></h3>
88         By
89                 default, annotation is associated with the alignment as a whole.
90                 However, it is also possible to have an annotation row associated with
91                 a specific sequence, or a sequence group. Clicking the annotation
92                 label for sequence or group associated annotation will highlight the
93                 associated rows in the alignment, and double clicking will select
94                 those rows, allowing further analysis. While group associated
95                 annotation remains associated with a particular alignment, sequence
96                 associated annotation can move with a sequence - so copying a sequence
97                 to another alignment will also copy its associated annotation.
98         </p>
99         <p>You can associate an annotation with a sequence by preceding its
100 definition with the line: 
101 <pre>SEQUENCE_REF&#9;<em>seq_name</em>&#9;<em>[startIndex]</em></pre>
102 All Annotations defined after a SEQUENCE_REF command will then be
103 associated with that sequence, and the first field in the Value field
104 list will (optionally) be placed at the <em>startIndex</em>'th column.</p>
105
106 <p>Sequence associations are turned off for subsequent annotation
107 definitions by: 
108 <pre>SEQUENCE_REF&#9;ALIGNMENT</pre>
109 </p>
110 <p>Similarly, since Jalview 2.5, group associated annotation can be defined by preceding the row definitions with the line:
111 <pre>GROUP_REF&#9;<em>group_name</em></pre>
112 Group association is turned off for subsequent annotation rows by: 
113 <pre>GROUP_REF&#9;<em>ALIGNMENT</em></pre>
114 </p>
115 <h3><font face="Arial, Helvetica, sans-serif">LINE_GRAPH Grouping</font></h3>
116 <p><em>LINE_GRAPH</em> type annotations can be given a colour
117 (specified as 24 bit RGB triplet in hexadecimal or comma separated
118 values), combined onto the same vertical axis, and have ordinate lines
119 (horizontal lines at a particular vertical axis value) using the
120 following commands (respectively): 
121 <pre>COLOUR&#9;<em>graph_name</em>&#9;<em>colour</em>
122 COMBINE&#9;<em>graph_1_name</em>&#9;<em>graph_2_name</em>
123 GRAPHLINE&#9;<em>graph_name</em>&#9;<em>value</em>&#9;<em>label</em>&#9;<em>colour</em><strong><em>
124 </em></strong></pre>
125 </p>
126 <h3><font face="Arial, Helvetica, sans-serif">(Since Jalview 2.5) ROWPROPERTIES</font></h3>
127 <p>The visual display properties for a set of annotation rows can be modified using the following tab-delimited line:</p>
128 <pre>ROWPROPERTIES&#9;<em>Row label</em>&#9;<em>centrelabs=true( or false)</em>&#9;<em>showalllabs=true(default is false)</em>&#9;<em>scaletofit=true (default is false)</em></pre>
129 <p>This sets the visual display properties according to the given values for all the annotation rows with labels matching <em>Row label</em>. The properties mostly affect the display of multi-character column labels, and are as follows:
130 <ul><li><em>centrelabs</em> Centre each label on its column.</li>
131 <li><em>showalllabs</em> Show every column label rather than only the first of a run of identical labels (setting this to true can have a drastic effect on secondary structure rows).</li>
132 <li><em>scaletofit</em> Shrink each label's font size so that the label fits within the column. Useful when annotating an alignment with a specific column numbering system. (<em>Not available in Jalview applet due to AWT 1.1 limitations</em>)</li>
133 </ul></p>
134 <h3><font face="Arial, Helvetica, sans-serif">(Since Jalview 2.2.1) SEQUENCE_GROUP</font></h3>
135 <p>Groups of sequences can be defined using the tab delimited line</p>
136 <pre>SEQUENCE_GROUP     Group_Name      Group_Start     Group_End       <em>Sequences</em></pre>
137 <p>The sequences can be defined by alignment index and a range of sequences can 
138   be defined in a comma delimited field such as</p>
139 <p>2-5,8-15,20,22</p>
140 <p>Enter * to select all groups. </p>
141 <p><strong>Note:</strong> If the alignment indices are not known, enter -1, followed by a tab and then a tab delimited list 
142 specifying the sequence ids. </p>
143 <p>If the SEQUENCE_REF has been defined, the group_start and group_end will be 
144   relative to the sequence residue numbering, otherwise the group_start and group_end 
145   will be the alignment column indices. </p>
146 <p>The group can (optionally) be assigned various visualisation properties via 
147   another tab delimited line thus:</p>
148 <pre>PROPERTIES Group_name      tab_delimited_key_value_pairs
149 </pre>
150 <p>The key_value_pairs allow you to define a description and to colour the group 
151   in various ways. All, none or some of the following values could be used for 
152   a group:</p>
153 <p>description=Text <br>
154   colour=Helix Propensity<br>
155   pidThreshold=0<br>
156   consThreshold=0<br>
157   outlineColour=red <br>
158   displayBoxes=true<br>
159   displayText=false<br>
160   colourText=false<br>
161   textCol1=black<br>
162   textCol2=black<br>
163   textColThreshold=0<br>
164   idColour=ff3322<br>
165  <!-- Not yet implemented in 2.5 release 
166   hide=false<br>
167   hidecols=false<br> -->
168   showunconserved=false</p>
169 <ul><li><em>New Features in 2.4:</em><br>if the <strong>idColour</strong> property
170 is given without specifying a colour scheme with the <strong>colour</strong>
171 property, then the idColour will also be used to colour the sequence.</li>
172 <li>the <strong>colour</strong> property can take either a colour scheme name,
173  or a single colour specification (either a colour name like 'red' or an RGB
174  triplet like 'ff0066'). If a single colour is specified, then the group
175  will be coloured with that colour.</li>
176  <!--  <li><em>New Features in 2.5</em></li>
177  <li>hide and hidecols instruct jalview to hide the sequences or columns covered by the group.</li> -->
178   <li>Sequence associated Groups<br>If a group is defined after a valid
179  <em>SEQUENCE_REF</em> sequence reference statement, the sequence representative
180  for the group will be set to the referenced sequence.<!-- <br><strong>Note:</strong> if the <em>hide</em> 
181  property is set then only the representative sequence for the group will be shown in the alignment.--></li>
182  <li>The interpretation of the COMBINE statement in <em>Version 2.8.1</em> was refined
183  so that only annotation line graphs with the given names ands the same 
184  <strong>SEQUENCE_REF</strong> and <strong>GROUP_REF</strong> scope are grouped.</li>
185 </ul>
186 <p> </p>
187 <p>An example Annotation file is given below:
188 <pre>#Comment lines follow the hash symbol
189 JALVIEW_ANNOTATION
190 SEQUENCE_REF&#9;FER1_MESCR&#9;5
191 BAR_GRAPH&#9;Bar Graph 1&#9;&lt;html&gt;an &lt;em&gt;html tooltip&lt;/em&gt; for Bar graph 1.&lt;/html&gt;&#9;||-100,-|-200,-|-300,-|-400,-|200,+|300,+|150,+
192 LINE_GRAPH&#9;Green Values&#9;1.1|2.2|1.3|3.4|0.7|1.4|3.3|2.2|2.1|-1.1|3.2
193 LINE_GRAPH&#9;Red Values&#9;2.1|3.2|1.3|-1.4|5.5|1.4|1.3|4.2|-1.1|1.1|3.2
194 BAR_GRAPH&#9;Bar Graph&#9;2 1,.|2,*|3,:|4,.|5,*|4,:|3,.|2|1|1|2|3|4|5|4
195 NO_GRAPH&#9;Icons &#9;||||E,Sheet1|E|E||||H,Sheet 2|H|H|H||||||
196 NO_GRAPH&#9;Purple Letters&#9;m|y|p|r|o|t|e|i|n
197 COLOUR&#9;Bar Graph 2&#9;blue
198 COLOUR&#9;Red Values&#9;255,0,0
199 COLOUR&#9;Green Values&#9;green
200 COLOUR&#9;Purple Letters&#9;151,52,228
201 COMBINE&#9;Green Values&#9;Red Values
202 GRAPHLINE&#9;Red Values&#9;2.6&#9;threshold&#9;black
203
204 SEQUENCE_GROUP&#9;Group_A&#9;30&#9;50&#9;*
205 SEQUENCE_GROUP&#9;Group_B&#9;1&#9;351&#9;2-5
206 SEQUENCE_GROUP&#9;Group_C&#9;12&#9;14&#9;-1&#9;seq1&#9;seq2&#9;seq3
207 PROPERTIES&#9;Group_A&#9;description=This is the description&#9;colour=Helix Propensity&#9;pidThreshold=0&#9;outlineColour=red&#9;displayBoxes=true&#9;displayText=false&#9;colourText=false&#9;textCol1=black&#9;textCol2=black&#9;textColThreshold=0
208 PROPERTIES&#9;Group_B&#9;outlineColour=red
209 PROPERTIES&#9;Group_C&#9;colour=Clustal
210 </pre>
211 </p>
212 <p><em>Last updated for version 2.8.1</em></p>
213 </body>
214 </html>