1fc5f39e4cb3beb7bf52632aa80f30c414d0e711
[jalview.git] / help / html / io / modellerpir.html
1 <html>
2 <!--
3  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
4  * Copyright (C) $$Year-Rel$$ The Jalview Authors
5  * 
6  * This file is part of Jalview.
7  * 
8  * Jalview is free software: you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License 
10  * as published by the Free Software Foundation, either version 3
11  * of the License, or (at your option) any later version.
12  *  
13  * Jalview is distributed in the hope that it will be useful, but 
14  * WITHOUT ANY WARRANTY; without even the implied warranty 
15  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
16  * PURPOSE.  See the GNU General Public License for more details.
17  * 
18  * You should have received a copy of the GNU General Public License
19  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
20  * The Jalview Authors are detailed in the 'AUTHORS' file.
21  -->
22 <head>
23 <title>Modeller PIR Format IO</title>
24 </head>
25 <body>
26   <p>
27     <strong>Modeller PIR Format IO</strong>
28   </p>
29   <p>
30     The homology modelling program, <a
31       href="http://salilab.org/modeller/"
32     >Modeller</a> uses a special form of the PIR format where information
33     about sequence numbering and chain codes are written into the
34     'description' line between the PIR protein tag and the protein
35     alignment entry:
36   </p>
37   <pre>&gt;P1;Q93Z60_ARATH
38 sequence:Q93Z60_ARATH:1:.:118:.:.
39 ----MASTALSSAIVSTSFLRRQQTPISLRSLPFANT-QSLFGLKS-STARGGRVTAMATYKVKFITPEGEQ
40 EVECEEDVYVLDAAEEAGLDLPYSCRAGSCSSCAGKVVSGSIDQSD------QSFLD-D-------------
41 ---------------------*
42 &gt;P1;PDB|1FER|_
43 structureX:1FER:1:.:105:.:.
44 ----------------------------------------------------AFVVTDNCIKCKY---TDCV
45 EV-CPVDCFY----EGPNFLVIHPDECIDCALCEPECPAQAIFSEDEVPEDMQEFIQLNAELAEVWPNITEK
46 KDPLPDAEDWDGVKGKLQHLE*
47 </pre>
48   <p>Jalview will attempt to parse any PIR entries conforming to the
49     Modeller/PIR format, in order to extract the sequence start and end
50     numbering and (possibly) a PDB file reference. The description line
51     information is always stored in the sequence description string - so
52     no information is lost if this parsing process fails.</p>
53   <p>
54     The 'Modeller Output' flag in the 'Output' tab of the Jalview <a
55       href="../features/preferences.html"
56     >Preferences dialog box</a> controls whether Jalview will also output
57     MODELLER style PIR files. In this case, any existing 'non-modeller
58     PIR' header information in the description string of an alignment is
59     appended to an automatically generated modeller description line for
60     that sequence.
61   </p>
62   <p>The general format used for generating the Modeller/PIR
63     sequence description line is shown below :
64   <pre>&gt;P1;<em>Primary_Sequence_ID</em>
65 <em>sequence or structureX</em>:<em>pdb-reference if
66   available</em>:<em>start residue</em>:<em>start chain code</em>:<em>end
67   residue</em>:<em>end chain code</em>:. <em>description text</em>
68   </pre>
69   The first field is either sequence or structureX, depending upon the
70   presence of a PDB database ID for the sequence. If the protein has no
71   PDB reference, then the chain code is not specified, unless one
72   already existed when the sequence was imported into Jalview.
73 </body>
74 </html>