JAL-674 - avoid java.util.ConcurrentModificationException on the pdbfile list
[jalview.git] / src / jalview / ws / dbsources / Pdb.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer (Version 2.8)
3  * Copyright (C) 2012 J Procter, AM Waterhouse, LM Lui, J Engelhardt, G Barton, M Clamp, S Searle
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version.
10  *  
11  * Jalview is distributed in the hope that it will be useful, but 
12  * WITHOUT ANY WARRANTY; without even the implied warranty 
13  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
14  * PURPOSE.  See the GNU General Public License for more details.
15  * 
16  * You should have received a copy of the GNU General Public License along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
17  */
18 package jalview.ws.dbsources;
19
20 import jalview.datamodel.Alignment;
21 import jalview.datamodel.DBRefEntry;
22 import jalview.datamodel.DBRefSource;
23 import jalview.datamodel.PDBEntry;
24 import jalview.datamodel.SequenceI;
25
26 import java.util.ArrayList;
27 import java.util.List;
28 import java.util.Vector;
29
30 import MCview.PDBChain;
31 import MCview.PDBfile;
32
33 import com.stevesoft.pat.Regex;
34
35 import jalview.datamodel.AlignmentI;
36 import jalview.io.FormatAdapter;
37 import jalview.ws.ebi.EBIFetchClient;
38 import jalview.ws.seqfetcher.DbSourceProxy;
39
40 /**
41  * @author JimP
42  * 
43  */
44 public class Pdb extends EbiFileRetrievedProxy implements DbSourceProxy
45 {
46   public Pdb()
47   {
48     super();
49     addDbSourceProperty(DBRefSource.PROTSEQDB);
50   }
51
52   /*
53    * (non-Javadoc)
54    * 
55    * @see jalview.ws.DbSourceProxy#getAccessionSeparator()
56    */
57   public String getAccessionSeparator()
58   {
59     // TODO Auto-generated method stub
60     return null;
61   }
62
63   /*
64    * (non-Javadoc)
65    * 
66    * @see jalview.ws.DbSourceProxy#getAccessionValidator()
67    */
68   public Regex getAccessionValidator()
69   {
70     return new Regex("([1-9][0-9A-Za-z]{3}):?([ _A-Za-z0-9]?)");
71   }
72
73   /*
74    * (non-Javadoc)
75    * 
76    * @see jalview.ws.DbSourceProxy#getDbSource()
77    */
78   public String getDbSource()
79   {
80     return DBRefSource.PDB;
81   }
82
83   /*
84    * (non-Javadoc)
85    * 
86    * @see jalview.ws.DbSourceProxy#getDbVersion()
87    */
88   public String getDbVersion()
89   {
90     return "0";
91   }
92
93   /*
94    * (non-Javadoc)
95    * 
96    * @see jalview.ws.DbSourceProxy#getSequenceRecords(java.lang.String[])
97    */
98   public AlignmentI getSequenceRecords(String queries) throws Exception
99   {
100     AlignmentI pdbfile = null;
101     Vector result = new Vector();
102     String chain = null;
103     String id = null;
104     if (queries.indexOf(":") > -1)
105     {
106       chain = queries.substring(queries.indexOf(":") + 1);
107       id = queries.substring(0, queries.indexOf(":"));
108     }
109     else
110     {
111       id = queries;
112     }
113     if (queries.length() > 4 && chain == null)
114     {
115       chain = queries.substring(4, 5);
116       id = queries.substring(0, 4);
117     }
118     if (!isValidReference(id))
119     {
120       System.err.println("Ignoring invalid pdb query: '" + id + "'");
121       stopQuery();
122       return null;
123     }
124     EBIFetchClient ebi = new EBIFetchClient();
125     file = ebi.fetchDataAsFile("pdb:" + id, "pdb", "raw").getAbsolutePath();
126     stopQuery();
127     if (file == null)
128     {
129       return null;
130     }
131     try
132     {
133
134       pdbfile = new FormatAdapter().readFile(file,
135               jalview.io.AppletFormatAdapter.FILE, "PDB");
136       if (pdbfile != null)
137       {
138         List<SequenceI> toremove=new ArrayList<SequenceI>();
139         for (SequenceI pdbcs : pdbfile.getSequences())
140         {
141           String chid = null;
142           // Mapping map=null;
143           for (PDBEntry pid : (Vector<PDBEntry>) pdbcs.getPDBId())
144           {
145             if (pid.getFile() == file)
146             {
147               chid = (String) pid.getProperty().get("CHAIN");
148
149             }
150             ;
151
152           }
153           if (chain == null
154                   || (chid != null && (chid.equals(chain)
155                           || chid.trim().equals(chain.trim()) || (chain
156                           .trim().length() == 0 && chid.equals("_")))))
157           {
158             pdbcs.setName(jalview.datamodel.DBRefSource.PDB + "|" + id
159                     + "|" + pdbcs.getName());
160             // Might need to add more metadata to the PDBEntry object
161             // like below
162             /*
163              * PDBEntry entry = new PDBEntry(); // Construct the PDBEntry
164              * entry.setId(id); if (entry.getProperty() == null)
165              * entry.setProperty(new Hashtable());
166              * entry.getProperty().put("chains", pdbchain.id + "=" +
167              * sq.getStart() + "-" + sq.getEnd());
168              * sq.getDatasetSequence().addPDBId(entry);
169              */
170             // Add PDB DB Refs
171             // We make a DBRefEtntry because we have obtained the PDB file from
172             // a
173             // verifiable source
174             // JBPNote - PDB DBRefEntry should also carry the chain and mapping
175             // information
176             DBRefEntry dbentry = new DBRefEntry(getDbSource(),
177                     getDbVersion(), (chid == null ? id : id + chid));
178             // dbentry.setMap()
179             pdbcs.addDBRef(dbentry);
180           }
181           else
182           {
183             // mark this sequence to be removed from the alignment 
184             // - since it's not from the right chain
185             toremove.add(pdbcs);
186           }
187         }
188         // now remove marked sequences 
189         for (SequenceI pdbcs:toremove) {
190           pdbfile.deleteSequence(pdbcs);
191         }
192       }
193       
194       if (pdbfile == null || pdbfile.getHeight() < 1)
195       {
196         throw new Exception("No PDB Records for " + id + " chain "
197                 + ((chain == null) ? "' '" : chain));
198       }
199
200     } catch (Exception ex) // Problem parsing PDB file
201     {
202       stopQuery();
203       throw (ex);
204     }
205     return pdbfile;
206   }
207
208   /*
209    * (non-Javadoc)
210    * 
211    * @see jalview.ws.DbSourceProxy#isValidReference(java.lang.String)
212    */
213   public boolean isValidReference(String accession)
214   {
215     Regex r = getAccessionValidator();
216     return r.search(accession.trim());
217   }
218
219   /**
220    * obtain human glyoxalase chain A sequence
221    */
222   public String getTestQuery()
223   {
224     return "1QIPA";
225   }
226
227   public String getDbName()
228   {
229     return "PDB"; // getDbSource();
230   }
231
232   @Override
233   public int getTier()
234   {
235     return 0;
236   }
237 }