JAL-2089 patch broken merge to master for Release 2.10.0b1
[jalview.git] / src / jalview / ws / seqfetcher / ASequenceFetcher.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.ws.seqfetcher;
22
23 import jalview.api.FeatureSettingsModelI;
24 import jalview.bin.Cache;
25 import jalview.datamodel.AlignmentI;
26 import jalview.datamodel.DBRefEntry;
27 import jalview.datamodel.SequenceI;
28 import jalview.util.DBRefUtils;
29 import jalview.util.MessageManager;
30
31 import java.util.ArrayList;
32 import java.util.Collections;
33 import java.util.Comparator;
34 import java.util.Enumeration;
35 import java.util.HashSet;
36 import java.util.Hashtable;
37 import java.util.List;
38 import java.util.Map;
39 import java.util.Stack;
40 import java.util.Vector;
41
42 public class ASequenceFetcher
43 {
44
45   /*
46    * set of databases we can retrieve entries from
47    */
48   protected Hashtable<String, Map<String, DbSourceProxy>> fetchableDbs;
49
50   /*
51    * comparator to sort by tier (0/1/2) and name
52    */
53   private Comparator<DbSourceProxy> proxyComparator;
54
55   /**
56    * Constructor
57    */
58   protected ASequenceFetcher()
59   {
60     super();
61
62     /*
63      * comparator to sort proxies by tier and name
64      */
65     proxyComparator = new Comparator<DbSourceProxy>()
66     {
67       @Override
68       public int compare(DbSourceProxy o1, DbSourceProxy o2)
69       {
70         /*
71          * Tier 0 precedes 1 precedes 2
72          */
73         int compared = Integer.compare(o1.getTier(), o2.getTier());
74         if (compared == 0)
75         {
76           // defend against NullPointer - should never happen
77           String o1Name = o1.getDbName();
78           String o2Name = o2.getDbName();
79           if (o1Name != null && o2Name != null)
80           {
81             compared = o1Name.compareToIgnoreCase(o2Name);
82           }
83         }
84         return compared;
85       }
86     };
87   }
88
89   /**
90    * get array of supported Databases
91    * 
92    * @return database source string for each database - only the latest version
93    *         of a source db is bound to each source.
94    */
95   public String[] getSupportedDb()
96   {
97     if (fetchableDbs == null)
98     {
99       return null;
100     }
101     String[] sf = fetchableDbs.keySet().toArray(
102             new String[fetchableDbs.size()]);
103     return sf;
104   }
105
106   public boolean isFetchable(String source)
107   {
108     for (String db : fetchableDbs.keySet())
109     {
110       if (source.equalsIgnoreCase(db))
111       {
112         return true;
113       }
114     }
115     Cache.log.warn("isFetchable doesn't know about '" + source + "'");
116     return false;
117   }
118
119   /**
120    * Fetch sequences for the given cross-references
121    * 
122    * @param refs
123    * @param dna
124    *          if true, only fetch from nucleotide data sources, else peptide
125    * @return
126    */
127   public SequenceI[] getSequences(List<DBRefEntry> refs, boolean dna)
128   {
129     Vector<SequenceI> rseqs = new Vector<SequenceI>();
130     Hashtable<String, List<String>> queries = new Hashtable<String, List<String>>();
131     for (DBRefEntry ref : refs)
132     {
133       if (!queries.containsKey(ref.getSource()))
134       {
135         queries.put(ref.getSource(), new ArrayList<String>());
136       }
137       List<String> qset = queries.get(ref.getSource());
138       if (!qset.contains(ref.getAccessionId()))
139       {
140         qset.add(ref.getAccessionId());
141       }
142     }
143     Enumeration<String> e = queries.keys();
144     while (e.hasMoreElements())
145     {
146       List<String> query = null;
147       String db = null;
148       db = e.nextElement();
149       query = queries.get(db);
150       if (!isFetchable(db))
151       {
152         reportStdError(db, query, new Exception(
153                 "Don't know how to fetch from this database :" + db));
154         continue;
155       }
156
157       Stack<String> queriesLeft = new Stack<String>();
158       queriesLeft.addAll(query);
159
160       List<DbSourceProxy> proxies = getSourceProxy(db);
161       for (DbSourceProxy fetcher : proxies)
162       {
163         List<String> queriesMade = new ArrayList<String>();
164         HashSet<String> queriesFound = new HashSet<String>();
165         try
166         {
167           if (fetcher.isDnaCoding() != dna)
168           {
169             continue; // wrong sort of data
170           }
171           boolean doMultiple = fetcher.getMaximumQueryCount() > 1;
172           while (!queriesLeft.isEmpty())
173           {
174             StringBuffer qsb = new StringBuffer();
175             do
176             {
177               if (qsb.length() > 0)
178               {
179                 qsb.append(fetcher.getAccessionSeparator());
180               }
181               String q = queriesLeft.pop();
182               queriesMade.add(q);
183               qsb.append(q);
184             } while (doMultiple && !queriesLeft.isEmpty());
185
186             AlignmentI seqset = null;
187             try
188             {
189               // create a fetcher and go to it
190               seqset = fetcher.getSequenceRecords(qsb.toString());
191             } catch (Exception ex)
192             {
193               System.err.println("Failed to retrieve the following from "
194                       + db);
195               System.err.println(qsb);
196               ex.printStackTrace(System.err);
197             }
198             // TODO: Merge alignment together - perhaps
199             if (seqset != null)
200             {
201               SequenceI seqs[] = seqset.getSequencesArray();
202               if (seqs != null)
203               {
204                 for (int is = 0; is < seqs.length; is++)
205                 {
206                   rseqs.addElement(seqs[is]);
207                   List<DBRefEntry> frefs = DBRefUtils.searchRefs(seqs[is]
208                           .getDBRefs(), new DBRefEntry(db, null, null));
209                   for (DBRefEntry dbr : frefs)
210                   {
211                     queriesFound.add(dbr.getAccessionId());
212                     queriesMade.remove(dbr.getAccessionId());
213                   }
214                   seqs[is] = null;
215                 }
216               }
217               else
218               {
219                 if (fetcher.getRawRecords() != null)
220                 {
221                   System.out.println("# Retrieved from " + db + ":"
222                           + qsb.toString());
223                   StringBuffer rrb = fetcher.getRawRecords();
224                   /*
225                    * for (int rr = 0; rr<rrb.length; rr++) {
226                    */
227                   String hdr;
228                   // if (rr<qs.length)
229                   // {
230                   hdr = "# " + db + ":" + qsb.toString();
231                   /*
232                    * } else { hdr = "# part "+rr; }
233                    */
234                   System.out.println(hdr);
235                   if (rrb != null)
236                   {
237                     System.out.println(rrb);
238                   }
239                   System.out.println("# end of " + hdr);
240                 }
241
242               }
243             }
244
245           }
246         } catch (Exception ex)
247         {
248           reportStdError(db, queriesMade, ex);
249         }
250         if (queriesMade.size() > 0)
251         {
252           System.out.println("# Adding " + queriesMade.size()
253                   + " ids back to queries list for searching again (" + db
254                   + ")");
255           queriesLeft.addAll(queriesMade);
256         }
257       }
258     }
259
260     SequenceI[] result = null;
261     if (rseqs.size() > 0)
262     {
263       result = new SequenceI[rseqs.size()];
264       int si = 0;
265       for (SequenceI s : rseqs)
266       {
267         result[si++] = s;
268         s.updatePDBIds();
269       }
270     }
271     return result;
272   }
273
274   public void reportStdError(String db, List<String> queriesMade,
275           Exception ex)
276   {
277
278     System.err.println("Failed to retrieve the following references from "
279             + db);
280     int n = 0;
281     for (String qv : queriesMade)
282     {
283       System.err.print(" " + qv + ";");
284       if (n++ > 10)
285       {
286         System.err.println();
287         n = 0;
288       }
289     }
290     System.err.println();
291     ex.printStackTrace();
292   }
293
294   /**
295    * Returns a list of proxies for the given source
296    * 
297    * @param db
298    *          database source string TODO: add version string/wildcard for
299    *          retrieval of specific DB source/version combinations.
300    * @return a list of DbSourceProxy for the db
301    */
302   public List<DbSourceProxy> getSourceProxy(String db)
303   {
304     db = DBRefUtils.getCanonicalName(db);
305     Map<String, DbSourceProxy> dblist = fetchableDbs.get(db);
306     if (dblist == null)
307     {
308       return new ArrayList<DbSourceProxy>();
309     }
310
311     /*
312      * sort so that primary sources precede secondary
313      */
314     List<DbSourceProxy> dbs = new ArrayList<DbSourceProxy>(dblist.values());
315     Collections.sort(dbs, proxyComparator);
316     return dbs;
317   }
318
319   /**
320    * constructs an instance of the proxy and registers it as a valid dbrefsource
321    * 
322    * @param dbSourceProxy
323    *          reference for class implementing
324    *          jalview.ws.seqfetcher.DbSourceProxy
325    */
326   protected void addDBRefSourceImpl(
327           Class<? extends DbSourceProxy> dbSourceProxy)
328           throws IllegalArgumentException
329   {
330     DbSourceProxy proxy = null;
331     try
332     {
333       DbSourceProxy proxyObj = dbSourceProxy.getConstructor().newInstance();
334       proxy = proxyObj;
335     } catch (IllegalArgumentException e)
336     {
337       throw e;
338     } catch (Exception e)
339     {
340       // Serious problems if this happens.
341       throw new Error(
342               MessageManager
343                       .getString("error.dbrefsource_implementation_exception"),
344               e);
345     }
346     addDbRefSourceImpl(proxy);
347   }
348
349   /**
350    * add the properly initialised DbSourceProxy object 'proxy' to the list of
351    * sequence fetchers
352    * 
353    * @param proxy
354    */
355   protected void addDbRefSourceImpl(DbSourceProxy proxy)
356   {
357     if (proxy != null)
358     {
359       if (fetchableDbs == null)
360       {
361         fetchableDbs = new Hashtable<String, Map<String, DbSourceProxy>>();
362       }
363       Map<String, DbSourceProxy> slist = fetchableDbs.get(proxy
364               .getDbSource());
365       if (slist == null)
366       {
367         fetchableDbs.put(proxy.getDbSource(),
368                 slist = new Hashtable<String, DbSourceProxy>());
369       }
370       slist.put(proxy.getDbName(), proxy);
371     }
372   }
373
374   /**
375    * select sources which are implemented by instances of the given class
376    * 
377    * @param class that implements DbSourceProxy
378    * @return null or vector of source names for fetchers
379    */
380   public String[] getDbInstances(Class class1)
381   {
382     if (!DbSourceProxy.class.isAssignableFrom(class1))
383     {
384       throw new Error(
385               MessageManager
386                       .formatMessage(
387                               "error.implementation_error_dbinstance_must_implement_interface",
388                               new String[] { class1.toString() }));
389     }
390     if (fetchableDbs == null)
391     {
392       return null;
393     }
394     String[] sources = null;
395     Vector<String> src = new Vector<String>();
396     Enumeration<String> dbs = fetchableDbs.keys();
397     while (dbs.hasMoreElements())
398     {
399       String dbn = dbs.nextElement();
400       for (DbSourceProxy dbp : fetchableDbs.get(dbn).values())
401       {
402         if (class1.isAssignableFrom(dbp.getClass()))
403         {
404           src.addElement(dbn);
405         }
406       }
407     }
408     if (src.size() > 0)
409     {
410       src.copyInto(sources = new String[src.size()]);
411     }
412     return sources;
413   }
414
415   public DbSourceProxy[] getDbSourceProxyInstances(Class class1)
416   {
417     List<DbSourceProxy> prlist = new ArrayList<DbSourceProxy>();
418     for (String fetchable : getSupportedDb())
419     {
420       for (DbSourceProxy pr : getSourceProxy(fetchable))
421       {
422         if (class1.isInstance(pr))
423         {
424           prlist.add(pr);
425         }
426       }
427     }
428     if (prlist.size() == 0)
429     {
430       return null;
431     }
432     return prlist.toArray(new DbSourceProxy[0]);
433   }
434
435   /**
436    * Returns a preferred feature colouring scheme for the given source, or null
437    * if none is defined.
438    * 
439    * @param source
440    * @return
441    */
442   public FeatureSettingsModelI getFeatureColourScheme(String source)
443   {
444     /*
445      * return the first non-null colour scheme for any proxy for
446      * this database source
447      */
448     for (DbSourceProxy proxy : getSourceProxy(source))
449     {
450       FeatureSettingsModelI preferredColours = proxy
451               .getFeatureColourScheme();
452       if (preferredColours != null)
453       {
454         return preferredColours;
455       }
456     }
457     return null;
458   }
459 }