Links
[jalview.git] / help / html / io / modellerpir.html
1 <html>
2 <head>
3 <title>Modeller PIR Format IO</title>
4 </head>
5 <body>
6 <p><strong>Modeller PIR Format IO</strong></p>
7 <p>The homology modelling program, <a
8 href="http://salilab.org/modeller/">Modeller</a> uses a special form
9 of the PIR format where information about sequence numbering and chain
10 codes are written into the 'description' line between the PIR protein
11 tag and the protein alignment entry:</p>
12 <pre>&gt;P1;Q93Z60_ARATH
13 sequence:Q93Z60_ARATH:1:.:118:.:.
14 ----MASTALSSAIVSTSFLRRQQTPISLRSLPFANT-QSLFGLKS-STARGGRVTAMATYKVKFITPEGEQ
15 EVECEEDVYVLDAAEEAGLDLPYSCRAGSCSSCAGKVVSGSIDQSD------QSFLD-D-------------
16 ---------------------*
17 &gt;P1;PDB|1FER|_
18 structureX:1FER:1:.:105:.:.
19 ----------------------------------------------------AFVVTDNCIKCKY---TDCV
20 EV-CPVDCFY----EGPNFLVIHPDECIDCALCEPECPAQAIFSEDEVPEDMQEFIQLNAELAEVWPNITEK
21 KDPLPDAEDWDGVKGKLQHLE*
22 </pre>
23 <p>Jalview will attempt to parse any PIR entries conforming to the
24 Modeller/PIR format, in order to extract the sequence start and end
25 numbering and (possibly) a PDB file reference. The description line
26 information is always stored in the sequence description string - so
27 no information is lost if this parsing process fails.</p>
28 <p>The 'Modeller Output' flag in the 'Output' tab of the Jalview <a href="../features/preferences.html">Preferences dialog
29 box</a> controls whether Jalview will also output MODELLER style PIR
30 files. In this case, any existing 'non-modeller PIR' header
31 information in the description string of an alignment is appended to
32 an automatically generated modeller description line for that
33 sequence.</p>
34 <p>The general format used for generating the Modeller/PIR sequence
35 description line is shown below :
36 <pre>&gt;P1;<em>Primary_Sequence_ID</em>
37 <em>sequence or structureX</em>:<em>pdb-reference if
38   available</em>:<em>start residue</em>:<em>start chain code</em>:<em>end
39   residue</em>:<em>end chain code</em>:. <em>description text</em></pre>
40 The first field is either sequence or structureX, depending upon the
41 presence of a PDB database ID for the sequence. If the protein has no
42 PDB reference, then the chain code is not specified, unless one
43 already existed when the sequence was imported into Jalview.
44 </body>
45 </html>