file format enum wip changes
[jalview.git] / test / jalview / ext / jmol / JmolParserTest.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.ext.jmol;
22
23 import static org.testng.AssertJUnit.assertEquals;
24 import static org.testng.AssertJUnit.assertTrue;
25
26 import jalview.bin.Cache;
27 import jalview.datamodel.Alignment;
28 import jalview.datamodel.AlignmentI;
29 import jalview.datamodel.SequenceI;
30 import jalview.gui.AlignFrame;
31 import jalview.io.AppletFormatAdapter;
32 import jalview.io.DataSourceType;
33 import jalview.io.FileLoader;
34 import jalview.structure.StructureImportSettings;
35
36 import java.util.Vector;
37
38 import org.jmol.c.STR;
39 import org.testng.annotations.BeforeMethod;
40 import org.testng.annotations.Test;
41
42 import MCview.PDBfile;
43
44 /**
45  * @author jimp
46  * 
47  */
48 public class JmolParserTest
49 {
50   /*
51    * 1GAQ has been reduced to alpha carbons only
52    * 1QCF is the full PDB file including headers, HETATM etc
53    */
54   String[] testFile = new String[] { "./examples/1GAQ.txt",
55       "./test/jalview/ext/jmol/1xyz.pdb",
56       "./test/jalview/ext/jmol/1qcf.pdb" };
57
58   //@formatter:off
59   // a modified and very cut-down extract of 4UJ4
60   String pastePDBDataWithChainBreak =
61      "HEADER    TRANSPORT PROTEIN                       08-APR-15   4UJ4\n" +
62      // chain B has missing residues; these should all go in the same sequence:
63      "ATOM   1909  CA  VAL B 358      21.329 -19.739 -67.740  1.00201.05           C\n" +
64      "ATOM   1916  CA  GLY B 359      21.694 -23.563 -67.661  1.00198.09           C\n" +
65      "ATOM   1920  CA  LYS B 367      32.471 -12.135 -77.100  1.00257.97           C\n" +
66      "ATOM   1925  CA  ALA B 368      31.032  -9.324 -74.946  1.00276.01           C\n" +
67      // switch to chain C; should be a separate sequence
68      "ATOM   1930  CA  SER C 369      32.589  -7.517 -71.978  1.00265.44           C\n" +
69      "ATOM   1936  CA  ALA C 370      31.650  -6.849 -68.346  1.00249.48           C\n";
70   //@formatter:on
71
72   //@formatter:off
73   // a very cut-down extract of 1ejg
74   String pdbWithAltLoc =
75      "HEADER    TRANSPORT PROTEIN                       08-APR-15   1EJG\n" +
76      "ATOM    448  CA  ALA A  24       6.619  16.195   1.970  1.00  1.65           C\n" +
77      "ATOM    458  CA ALEU A  25       3.048  14.822   1.781  0.57  1.48           C\n" +
78      // alternative residue 25 entries (with ILE instead of LEU) should be ignored:
79      "ATOM    478  CA BILE A  25       3.048  14.822   1.781  0.21  1.48           C\n" +
80      // including the next altloc causes the unit test to fail but it works with the full file
81      // not sure why!
82      //     "ATOM    479  CA CILE A  25       3.048  14.822   1.781  0.22  1.48           C\n" +
83      "ATOM    512  CA  CYS A  26       4.137  11.461   3.154  1.00  1.52           C\n";
84   //@formatter:on
85
86   @BeforeMethod(alwaysRun = true)
87   public void setUp()
88   {
89     Cache.applicationProperties.setProperty("STRUCT_FROM_PDB",
90             Boolean.TRUE.toString());
91     Cache.applicationProperties.setProperty("ADD_SS_ANN",
92             Boolean.TRUE.toString());
93   }
94
95   @Test(groups = { "Functional" })
96   public void testAlignmentLoader() throws Exception
97   {
98     for (String f : testFile)
99     {
100       FileLoader fl = new jalview.io.FileLoader(false);
101       AlignFrame af = fl
102               .LoadFileWaitTillLoaded(f, DataSourceType.FILE);
103       validateSecStrRows(af.getViewport().getAlignment());
104     }
105   }
106
107   @Test(groups = { "Functional" })
108   public void testFileParser() throws Exception
109   {
110     StructureImportSettings.setProcessHETATMs(false);
111     for (String pdbStr : testFile)
112     {
113       PDBfile mctest = new PDBfile(false, false, false, pdbStr,
114               DataSourceType.FILE);
115       JmolParser jtest = new JmolParser(false, false, false, pdbStr,
116               jalview.io.DataSourceType.FILE);
117       Vector<SequenceI> seqs = jtest.getSeqs(), mcseqs = mctest.getSeqs();
118
119       assertTrue(
120               "No sequences extracted from testfile\n"
121                       + (jtest.hasWarningMessage() ? jtest.getWarningMessage()
122                               : "(No warnings raised)"), seqs != null
123                       && seqs.size() > 0);
124       for (SequenceI sq : seqs)
125       {
126         assertEquals("JMol didn't process " + pdbStr
127                 + " to the same sequence as MCView",
128                 sq.getSequenceAsString(), mcseqs.remove(0)
129                         .getSequenceAsString());
130         AlignmentI al = new Alignment(new SequenceI[] { sq });
131         validateSecStrRows(al);
132       }
133     }
134     StructureImportSettings.setProcessHETATMs(true);
135     for (String pdbStr : testFile)
136     {
137       PDBfile mctest = new PDBfile(false, false, false, pdbStr,
138               DataSourceType.FILE);
139       JmolParser jtest = new JmolParser(false, false, false, pdbStr,
140               jalview.io.DataSourceType.FILE);
141       Vector<SequenceI> seqs = jtest.getSeqs(), mcseqs = mctest.getSeqs();
142
143       assertTrue(
144               "No sequences extracted from testfile\n"
145                       + (jtest.hasWarningMessage() ? jtest.getWarningMessage()
146                               : "(No warnings raised)"), seqs != null
147                       && seqs.size() > 0);
148       for (SequenceI sq : seqs)
149       {
150         assertEquals("JMol didn't process " + pdbStr
151                 + " to the same sequence as MCView",
152                 sq.getSequenceAsString(), mcseqs.remove(0)
153                         .getSequenceAsString());
154         AlignmentI al = new Alignment(new SequenceI[] { sq });
155         validateSecStrRows(al);
156       }
157     }
158   }
159
160   private void validateSecStrRows(AlignmentI al)
161   {
162     if (!al.isNucleotide())
163     {
164       for (SequenceI asq : al.getSequences())
165       {
166         SequenceI sq = asq;
167         boolean hasDs = false;
168         while (sq.getDatasetSequence() != null
169                 && sq.getAnnotation() == null)
170         {
171           sq = sq.getDatasetSequence();
172           hasDs = true;
173         }
174         checkFirstAAIsAssoc(sq);
175         if (hasDs)
176         {
177           // also verify if alignment sequence has annotation on it
178           // that is correctly mapped
179           checkFirstAAIsAssoc(asq);
180         }
181       }
182     }
183   }
184
185   private void checkFirstAAIsAssoc(SequenceI sq)
186   {
187     assertTrue("No secondary structure assigned for protein sequence.",
188             sq.getAnnotation() != null && sq.getAnnotation().length >= 1
189                     && sq.getAnnotation()[0].hasIcons);
190     assertTrue(
191             "Secondary structure not associated for sequence "
192                     + sq.getName(), sq.getAnnotation()[0].sequenceRef == sq);
193   }
194
195   /**
196    * Test parsing a chain with missing residues
197    * 
198    * @throws Exception
199    */
200   @Test(groups = { "Functional" })
201   public void testParse_missingResidues() throws Exception
202   {
203     PDBfile mctest = new PDBfile(false, false, false,
204             pastePDBDataWithChainBreak,
205             DataSourceType.PASTE);
206     boolean annotFromStructure = false;
207     boolean localSecondaryStruct = false;
208     boolean serviceSecondaryStruct = false;
209     JmolParser jtest = new JmolParser(annotFromStructure,
210             localSecondaryStruct, serviceSecondaryStruct,
211             pastePDBDataWithChainBreak,
212             jalview.io.DataSourceType.PASTE);
213     Vector<SequenceI> seqs = jtest.getSeqs();
214     Vector<SequenceI> mcseqs = mctest.getSeqs();
215
216     assertEquals("Failed to find 2 sequences\n", 2, seqs.size());
217     assertEquals("Failed to find 2 sequences\n", 2, mcseqs.size());
218     assertEquals("VGKA", seqs.get(0).getSequenceAsString());
219     assertEquals("VGKA", mcseqs.get(0).getSequenceAsString());
220     assertEquals("SA", seqs.get(1).getSequenceAsString());
221     assertEquals("SA", mcseqs.get(1).getSequenceAsString());
222   }
223
224   /**
225    * Test parsing a chain with 'altloc' residues
226    * 
227    * @throws Exception
228    */
229   @Test(groups = { "Functional" })
230   public void testParse_alternativeResidues() throws Exception
231   {
232     PDBfile mctest = new PDBfile(false, false, false, pdbWithAltLoc,
233             DataSourceType.PASTE);
234     boolean annotFromStructure = false;
235     boolean localSecondaryStruct = false;
236     boolean serviceSecondaryStruct = false;
237     JmolParser jtest = new JmolParser(annotFromStructure,
238             localSecondaryStruct, serviceSecondaryStruct, pdbWithAltLoc,
239             jalview.io.DataSourceType.PASTE);
240     Vector<SequenceI> seqs = jtest.getSeqs();
241     Vector<SequenceI> mcseqs = mctest.getSeqs();
242   
243     assertEquals("Failed to find 1 sequence\n", 1, seqs.size());
244     assertEquals("Failed to find 1 sequence\n", 1, mcseqs.size());
245     assertEquals("ALC", seqs.get(0).getSequenceAsString());
246     assertEquals("ALC", mcseqs.get(0).getSequenceAsString());
247   }
248
249   @Test(groups = "Functional")
250   public void testSetSecondaryStructure()
251   {
252     JmolParser testee = new JmolParser();
253     char[] struct = new char[10];
254     char[] structCode = new char[10];
255     struct[0] = '1';
256     structCode[0] = '1';
257
258     testee.setSecondaryStructure(STR.NONE, 0, struct, structCode);
259     testee.setSecondaryStructure(STR.HELIX, 1, struct, structCode);
260     testee.setSecondaryStructure(STR.HELIX310, 2, struct, structCode);
261     testee.setSecondaryStructure(STR.HELIXALPHA, 3, struct, structCode);
262     testee.setSecondaryStructure(STR.HELIXPI, 4, struct, structCode);
263     testee.setSecondaryStructure(STR.SHEET, 5, struct, structCode);
264
265     assertEquals(0, struct[0]);
266     assertEquals('H', struct[1]);
267     assertEquals('3', struct[2]);
268     assertEquals('H', struct[3]);
269     assertEquals('P', struct[4]);
270     assertEquals('E', struct[5]);
271
272     assertEquals(0, structCode[0]);
273     assertEquals('H', structCode[1]);
274     assertEquals('H', structCode[2]);
275     assertEquals('H', structCode[3]);
276     assertEquals('H', structCode[4]);
277     assertEquals('E', structCode[5]);
278   }
279 }