Any character non aa or nucleotide is a space
[jalview.git] / src / jalview / io / PIRFile.java
1 /*\r
2  * Jalview - A Sequence Alignment Editor and Viewer\r
3  * Copyright (C) 2006 AM Waterhouse, J Procter, G Barton, M Clamp, S Searle\r
4  *\r
5  * This program is free software; you can redistribute it and/or\r
6  * modify it under the terms of the GNU General Public License\r
7  * as published by the Free Software Foundation; either version 2\r
8  * of the License, or (at your option) any later version.\r
9  *\r
10  * This program is distributed in the hope that it will be useful,\r
11  * but WITHOUT ANY WARRANTY; without even the implied warranty of\r
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the\r
13  * GNU General Public License for more details.\r
14  *\r
15  * You should have received a copy of the GNU General Public License\r
16  * along with this program; if not, write to the Free Software\r
17  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301, USA\r
18  */\r
19 package jalview.io;\r
20 \r
21 import java.io.*;\r
22 import java.util.*;\r
23 \r
24 import jalview.datamodel.*;\r
25 \r
26 public class PIRFile\r
27     extends AlignFile\r
28 {\r
29   public static boolean useModellerOutput = false;\r
30 \r
31   Vector words = new Vector(); //Stores the words in a line after splitting\r
32 \r
33   public PIRFile()\r
34   {\r
35   }\r
36 \r
37   public PIRFile(String inFile, String type)\r
38       throws IOException\r
39   {\r
40     super(inFile, type);\r
41   }\r
42 \r
43   public void parse() throws IOException\r
44   {\r
45       StringBuffer sequence;\r
46       String line = null;\r
47       ModellerDescription md;\r
48 \r
49       while ( (line = nextLine()) != null)\r
50       {\r
51         if (line.length() == 0)\r
52         {\r
53           //System.out.println("blank line");\r
54           continue;\r
55         }\r
56         if (line.indexOf("C;") == 0 || line.indexOf("#") == 0)\r
57         {\r
58           continue;\r
59         }\r
60         Sequence newSeq = parseId(line.substring(line.indexOf(";") + 1));\r
61 \r
62         sequence = new StringBuffer();\r
63 \r
64         newSeq.setDescription(nextLine()); // this is the title line\r
65 \r
66         boolean starFound = false;\r
67 \r
68         while(!starFound)\r
69         {\r
70           line = nextLine();\r
71           sequence.append(line);\r
72 \r
73           if (line == null)\r
74             break;\r
75 \r
76           if (line.indexOf("*") > -1)\r
77           {\r
78             starFound = true;\r
79           }\r
80         }\r
81 \r
82         if (sequence.length() > 0)\r
83         {\r
84           sequence.setLength(sequence.length() - 1);\r
85           newSeq.setSequence(sequence.toString());\r
86 \r
87           seqs.addElement(newSeq);\r
88 \r
89           md = new ModellerDescription(newSeq.\r
90                 getDescription());\r
91           md.updateSequenceI(newSeq);\r
92         }\r
93       }\r
94   }\r
95 \r
96   public String print()\r
97   {\r
98     return print(getSeqsAsArray());\r
99   }\r
100 \r
101   public String print(SequenceI[] s)\r
102   {\r
103     boolean is_NA = jalview.util.Comparison.isNucleotide(s);\r
104     int len = 72;\r
105     StringBuffer out = new StringBuffer();\r
106     int i = 0;\r
107     ModellerDescription md;\r
108 \r
109     while ( (i < s.length) && (s[i] != null))\r
110     {\r
111       String seq = s[i].getSequenceAsString();\r
112       seq = seq + "*";\r
113 \r
114 \r
115       if (is_NA)\r
116       {\r
117           // modeller doesn't really do nucleotides, so we don't do anything fancy\r
118           // Official tags area as follows, for now we'll use P1 and DL\r
119           // Protein (complete) P1\r
120           // Protein (fragment) F1\r
121           // DNA (linear) Dl\r
122           // DNA (circular) DC\r
123           // RNA (linear) RL\r
124           // RNA (circular) RC\r
125           // tRNA N3\r
126           // other functional RNA N1\r
127 \r
128         out.append(">N1;" + s[i].getName() + "\n");\r
129         if (s[i].getDescription() == null)\r
130         {\r
131           out.append(s[i].getName() + " " +\r
132                      (s[i].getEnd() - s[i].getStart() + 1));\r
133           out.append(is_NA ? " bases\n" : " residues\n");\r
134         }\r
135         else\r
136         {\r
137           out.append(s[i].getDescription()+"\n");\r
138         }\r
139       }\r
140       else\r
141       {\r
142 \r
143        if(useModellerOutput)\r
144        {\r
145          out.append(">P1;" + s[i].getName() + "\n");\r
146          md = new ModellerDescription(s[i]);\r
147          out.append(md.getDescriptionLine() + "\n");\r
148        }\r
149        else\r
150        {\r
151          out.append(">P1;" + printId(s[i]) + "\n");\r
152          if (s[i].getDescription() != null)\r
153            out.append(s[i].getDescription() + "\n");\r
154          else\r
155            out.append(s[i].getName() + " "\r
156                       + (s[i].getEnd() - s[i].getStart() + 1)\r
157                       + " residues\n");\r
158        }\r
159       }\r
160       int nochunks = (seq.length() / len) + 1;\r
161 \r
162       for (int j = 0; j < nochunks; j++)\r
163       {\r
164         int start = j * len;\r
165         int end = start + len;\r
166 \r
167         if (end < seq.length())\r
168         {\r
169           out.append(seq.substring(start, end) + "\n");\r
170         }\r
171         else if (start < seq.length())\r
172         {\r
173           out.append(seq.substring(start) + "\n");\r
174         }\r
175       }\r
176 \r
177       i++;\r
178     }\r
179 \r
180     return out.toString();\r
181   }\r
182 \r
183 }\r