cf60b630282b0224f54f4326cb176b9dafdd849b
[jalview.git] / src / jalview / ws / seqfetcher / ASequenceFetcher.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer (Version 2.8.0b1)
3  * Copyright (C) 2014 The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version.
10  *  
11  * Jalview is distributed in the hope that it will be useful, but 
12  * WITHOUT ANY WARRANTY; without even the implied warranty 
13  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
14  * PURPOSE.  See the GNU General Public License for more details.
15  * 
16  * You should have received a copy of the GNU General Public License along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
17  * The Jalview Authors are detailed in the 'AUTHORS' file.
18  */
19 package jalview.ws.seqfetcher;
20
21 import jalview.datamodel.AlignmentI;
22 import jalview.datamodel.DBRefEntry;
23 import jalview.datamodel.SequenceI;
24 import jalview.util.DBRefUtils;
25
26 import java.util.ArrayList;
27 import java.util.Enumeration;
28 import java.util.HashSet;
29 import java.util.Hashtable;
30 import java.util.Iterator;
31 import java.util.List;
32 import java.util.Map;
33 import java.util.Stack;
34 import java.util.Vector;
35
36 public class ASequenceFetcher
37 {
38
39   /**
40    * set of databases we can retrieve entries from
41    */
42   protected Hashtable<String, Map<String, DbSourceProxy>> FETCHABLEDBS;
43
44   public ASequenceFetcher()
45   {
46     super();
47   }
48
49   /**
50    * get list of supported Databases
51    * 
52    * @return database source string for each database - only the latest version
53    *         of a source db is bound to each source.
54    */
55   public String[] getSupportedDb()
56   {
57     if (FETCHABLEDBS == null)
58       return null;
59     String[] sf = new String[FETCHABLEDBS.size()];
60     Enumeration e = FETCHABLEDBS.keys();
61     int i = 0;
62     while (e.hasMoreElements())
63     {
64       sf[i++] = (String) e.nextElement();
65     }
66     ;
67     return sf;
68   }
69
70   public boolean isFetchable(String source)
71   {
72     Enumeration e = FETCHABLEDBS.keys();
73     while (e.hasMoreElements())
74     {
75       String db = (String) e.nextElement();
76       if (source.compareToIgnoreCase(db) == 0)
77         return true;
78     }
79     jalview.bin.Cache.log.warn("isFetchable doesn't know about '" + source
80             + "'");
81     return false;
82   }
83
84   public SequenceI[] getSequences(jalview.datamodel.DBRefEntry[] refs)
85   {
86     SequenceI[] ret = null;
87     Vector<SequenceI> rseqs = new Vector();
88     Hashtable<String, List<String>> queries = new Hashtable();
89     for (int r = 0; r < refs.length; r++)
90     {
91       if (!queries.containsKey(refs[r].getSource()))
92       {
93         queries.put(refs[r].getSource(), new ArrayList<String>());
94       }
95       List<String> qset = queries.get(refs[r].getSource());
96       if (!qset.contains(refs[r].getAccessionId()))
97       {
98         qset.add(refs[r].getAccessionId());
99       }
100     }
101     Enumeration<String> e = queries.keys();
102     while (e.hasMoreElements())
103     {
104       List<String> query = null;
105       String db = null;
106       db = e.nextElement();
107       query = queries.get(db);
108       if (!isFetchable(db))
109       {
110         reportStdError(db, query, new Exception(
111                 "Don't know how to fetch from this database :" + db));
112         continue;
113       }
114       Iterator<DbSourceProxy> fetchers = getSourceProxy(db).iterator();
115       Stack<String> queriesLeft = new Stack<String>();
116       // List<String> queriesFailed = new ArrayList<String>();
117       queriesLeft.addAll(query);
118       while (fetchers.hasNext())
119       {
120         List<String> queriesMade = new ArrayList<String>();
121         HashSet queriesFound = new HashSet<String>();
122         try
123         {
124           DbSourceProxy fetcher = fetchers.next();
125           boolean doMultiple = fetcher.getAccessionSeparator() != null; // No
126           // separator
127           // - no
128           // Multiple
129           // Queries
130           while (!queriesLeft.isEmpty())
131           {
132             StringBuffer qsb = new StringBuffer();
133             do
134             {
135               if (qsb.length() > 0)
136               {
137                 qsb.append(fetcher.getAccessionSeparator());
138               }
139               String q = queriesLeft.pop();
140               queriesMade.add(q);
141               qsb.append(q);
142             } while (doMultiple && !queriesLeft.isEmpty());
143
144             AlignmentI seqset = null;
145             try
146             {
147               // create a fetcher and go to it
148               seqset = fetcher.getSequenceRecords(qsb.toString()); // ,
149               // queriesFailed);
150             } catch (Exception ex)
151             {
152               System.err.println("Failed to retrieve the following from "
153                       + db);
154               System.err.println(qsb);
155               ex.printStackTrace(System.err);
156             }
157             // TODO: Merge alignment together - perhaps
158             if (seqset != null)
159             {
160               SequenceI seqs[] = seqset.getSequencesArray();
161               if (seqs != null)
162               {
163                 for (int is = 0; is < seqs.length; is++)
164                 {
165                   rseqs.addElement(seqs[is]);
166                   DBRefEntry[] frefs = DBRefUtils.searchRefs(seqs[is]
167                           .getDBRef(), new DBRefEntry(db, null, null));
168                   if (frefs != null)
169                   {
170                     for (DBRefEntry dbr : frefs)
171                     {
172                       queriesFound.add(dbr.getAccessionId());
173                       queriesMade.remove(dbr.getAccessionId());
174                     }
175                   }
176                   seqs[is] = null;
177                 }
178               }
179               else
180               {
181                 if (fetcher.getRawRecords() != null)
182                 {
183                   System.out.println("# Retrieved from " + db + ":"
184                           + qsb.toString());
185                   StringBuffer rrb = fetcher.getRawRecords();
186                   /*
187                    * for (int rr = 0; rr<rrb.length; rr++) {
188                    */
189                   String hdr;
190                   // if (rr<qs.length)
191                   // {
192                   hdr = "# " + db + ":" + qsb.toString();
193                   /*
194                    * } else { hdr = "# part "+rr; }
195                    */
196                   System.out.println(hdr);
197                   if (rrb != null)
198                     System.out.println(rrb);
199                   System.out.println("# end of " + hdr);
200                 }
201
202               }
203             }
204
205           }
206         } catch (Exception ex)
207         {
208           reportStdError(db, queriesMade, ex);
209         }
210         if (queriesMade.size() > 0)
211         {
212           System.out.println("# Adding " + queriesMade.size()
213                   + " ids back to queries list for searching again (" + db
214                   + ".");
215           queriesLeft.addAll(queriesMade);
216         }
217       }
218     }
219     if (rseqs.size() > 0)
220     {
221       ret = new SequenceI[rseqs.size()];
222       Enumeration sqs = rseqs.elements();
223       int si = 0;
224       while (sqs.hasMoreElements())
225       {
226         SequenceI s = (SequenceI) sqs.nextElement();
227         ret[si++] = s;
228         s.updatePDBIds();
229       }
230     }
231     return ret;
232   }
233
234   public void reportStdError(String db, List<String> queriesMade,
235           Exception ex)
236   {
237
238     System.err.println("Failed to retrieve the following references from "
239             + db);
240     int n = 0;
241     for (String qv : queriesMade)
242     {
243       System.err.print(" " + qv + ";");
244       if (n++ > 10)
245       {
246         System.err.println();
247         n = 0;
248       }
249     }
250     System.err.println();
251     ex.printStackTrace();
252   }
253
254   /**
255    * Retrieve an instance of the proxy for the given source
256    * 
257    * @param db
258    *          database source string TODO: add version string/wildcard for
259    *          retrieval of specific DB source/version combinations.
260    * @return an instance of DbSourceProxy for that db.
261    */
262   public List<DbSourceProxy> getSourceProxy(String db)
263   {
264     List<DbSourceProxy> dbs;
265     Map<String, DbSourceProxy> dblist = FETCHABLEDBS.get(db);
266     if (dblist == null)
267     {
268       return new ArrayList<DbSourceProxy>();
269     }
270     ;
271     if (dblist.size() > 1)
272     {
273       DbSourceProxy[] l = dblist.values().toArray(new DbSourceProxy[0]);
274       int i = 0;
275       String[] nm = new String[l.length];
276       // make sure standard dbs appear first, followed by reference das sources, followed by anything else.
277       for (DbSourceProxy s : l)
278       {
279         nm[i++] = ""+s.getTier()+s.getDbName().toLowerCase();
280       }
281       jalview.util.QuickSort.sort(nm, l);
282       dbs = new ArrayList<DbSourceProxy>();
283       for (i = l.length - 1; i >= 0; i--)
284       {
285         dbs.add(l[i]);
286       }
287     }
288     else
289     {
290       dbs = new ArrayList<DbSourceProxy>(dblist.values());
291     }
292     return dbs;
293   }
294
295   /**
296    * constructs and instance of the proxy and registers it as a valid
297    * dbrefsource
298    * 
299    * @param dbSourceProxy
300    *          reference for class implementing
301    *          jalview.ws.seqfetcher.DbSourceProxy
302    * @throws java.lang.IllegalArgumentException
303    *           if class does not implement jalview.ws.seqfetcher.DbSourceProxy
304    */
305   protected void addDBRefSourceImpl(Class dbSourceProxy)
306           throws java.lang.IllegalArgumentException
307   {
308     DbSourceProxy proxy = null;
309     try
310     {
311       Object proxyObj = dbSourceProxy.getConstructor(null)
312               .newInstance(null);
313       if (!DbSourceProxy.class.isInstance(proxyObj))
314       {
315         throw new IllegalArgumentException(
316                 dbSourceProxy.toString()
317                         + " does not implement the jalview.ws.seqfetcher.DbSourceProxy");
318       }
319       proxy = (DbSourceProxy) proxyObj;
320     } catch (IllegalArgumentException e)
321     {
322       throw e;
323     } catch (Exception e)
324     {
325       // Serious problems if this happens.
326       throw new Error("DBRefSource Implementation Exception", e);
327     }
328     addDbRefSourceImpl(proxy);
329   }
330
331   /**
332    * add the properly initialised DbSourceProxy object 'proxy' to the list of
333    * sequence fetchers
334    * 
335    * @param proxy
336    */
337   protected void addDbRefSourceImpl(DbSourceProxy proxy)
338   {
339     if (proxy != null)
340     {
341       if (FETCHABLEDBS == null)
342       {
343         FETCHABLEDBS = new Hashtable<String, Map<String, DbSourceProxy>>();
344       }
345       Map<String, DbSourceProxy> slist = FETCHABLEDBS.get(proxy
346               .getDbSource());
347       if (slist == null)
348       {
349         FETCHABLEDBS.put(proxy.getDbSource(),
350                 slist = new Hashtable<String, DbSourceProxy>());
351       }
352       slist.put(proxy.getDbName(), proxy);
353     }
354   }
355
356   /**
357    * test if the database handler for dbName contains the given dbProperty when
358    * a dbName resolves to a set of proxies - this method will return the result
359    * of the test for the first instance. TODO implement additional method to
360    * query all sources for a db to find one with a particular property
361    * 
362    * @param dbName
363    * @param dbProperty
364    * @return true if proxy has the given property
365    */
366   public boolean hasDbSourceProperty(String dbName, String dbProperty)
367   {
368     // TODO: decide if invalidDbName exception is thrown here.
369
370     List<DbSourceProxy> proxies = getSourceProxy(dbName);
371     if (proxies != null)
372     {
373       for (DbSourceProxy proxy : proxies)
374       {
375         if (proxy.getDbSourceProperties() != null)
376         {
377           return proxy.getDbSourceProperties().containsKey(dbProperty);
378         }
379       }
380     }
381     return false;
382   }
383
384   /**
385    * select sources which are implemented by instances of the given class
386    * 
387    * @param class that implements DbSourceProxy
388    * @return null or vector of source names for fetchers
389    */
390   public String[] getDbInstances(Class class1)
391   {
392     if (!jalview.ws.seqfetcher.DbSourceProxy.class.isAssignableFrom(class1))
393     {
394       throw new Error(
395               "Implmentation Error - getDbInstances must be given a class that implements jalview.ws.seqfetcher.DbSourceProxy (was given '"
396                       + class1 + "')");
397     }
398     if (FETCHABLEDBS == null)
399     {
400       return null;
401     }
402     String[] sources = null;
403     Vector src = new Vector();
404     Enumeration dbs = FETCHABLEDBS.keys();
405     while (dbs.hasMoreElements())
406     {
407       String dbn = (String) dbs.nextElement();
408       for (DbSourceProxy dbp : FETCHABLEDBS.get(dbn).values())
409       {
410         if (class1.isAssignableFrom(dbp.getClass()))
411         {
412           src.addElement(dbn);
413         }
414       }
415     }
416     if (src.size() > 0)
417     {
418       src.copyInto(sources = new String[src.size()]);
419     }
420     return sources;
421   }
422
423   public DbSourceProxy[] getDbSourceProxyInstances(Class class1)
424   {
425     ArrayList<DbSourceProxy> prlist = new ArrayList<DbSourceProxy>();
426     for (String fetchable : getSupportedDb())
427       for (DbSourceProxy pr : getSourceProxy(fetchable))
428       {
429         if (class1.isInstance(pr))
430         {
431           prlist.add(pr);
432         }
433       }
434     if (prlist.size() == 0)
435     {
436       return null;
437     }
438     return prlist.toArray(new DbSourceProxy[0]);
439   }
440
441 }