JAL-2113 embl_mapping.xml and code updated for EMBL XML v1.2
[jalview.git] / src / jalview / ws / dbsources / EmblXmlSource.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.ws.dbsources;
22
23 import jalview.datamodel.Alignment;
24 import jalview.datamodel.AlignmentI;
25 import jalview.datamodel.SequenceI;
26 import jalview.datamodel.xdb.embl.EmblEntry;
27 import jalview.datamodel.xdb.embl.EmblFile;
28 import jalview.util.MessageManager;
29 import jalview.ws.ebi.EBIFetchClient;
30
31 import java.io.File;
32 import java.util.ArrayList;
33 import java.util.List;
34
35 public abstract class EmblXmlSource extends EbiFileRetrievedProxy
36 {
37   /*
38    * JAL-1856 Embl returns this text for query not found
39    */
40   private static final String EMBL_NOT_FOUND_REPLY = "ERROR 12 No entries found.";
41
42   public EmblXmlSource()
43   {
44     super();
45   }
46
47   /**
48    * retrieve and parse an emblxml file
49    * 
50    * @param emprefx
51    *          either EMBL or EMBLCDS strings are allowed - anything else will
52    *          not retrieve emblxml
53    * @param query
54    * @return
55    * @throws Exception
56    */
57   public AlignmentI getEmblSequenceRecords(String emprefx, String query)
58           throws Exception
59   {
60     startQuery();
61     EBIFetchClient dbFetch = new EBIFetchClient();
62     File reply;
63     try
64     {
65       reply = dbFetch.fetchDataAsFile(
66               emprefx.toLowerCase() + ":" + query.trim(), "display=xml",
67               null,
68               ".xml");
69     } catch (Exception e)
70     {
71       stopQuery();
72       throw new Exception(MessageManager.formatMessage(
73               "exception.ebiembl_retrieval_failed_on", new String[] {
74                   emprefx.toLowerCase(), query.trim() }), e);
75     }
76     return getEmblSequenceRecords(emprefx, query, reply);
77   }
78
79   /**
80    * parse an emblxml file stored locally
81    * 
82    * @param emprefx
83    *          either EMBL or EMBLCDS strings are allowed - anything else will
84    *          not retrieve emblxml
85    * @param query
86    * @param file
87    *          the EMBL XML file containing the results of a query
88    * @return
89    * @throws Exception
90    */
91   public AlignmentI getEmblSequenceRecords(String emprefx, String query,
92           File reply) throws Exception
93   {
94     EmblFile efile = null;
95     List<SequenceI> seqs = new ArrayList<SequenceI>();
96
97     if (reply != null && reply.exists())
98     {
99       file = reply.getAbsolutePath();
100       if (reply.length() > EMBL_NOT_FOUND_REPLY.length())
101       {
102         efile = EmblFile.getEmblFile(reply);
103       }
104     }
105
106     List<SequenceI> peptides = new ArrayList<SequenceI>();
107     if (efile != null)
108     {
109       for (EmblEntry entry : efile.getEntries())
110       {
111         SequenceI seq = entry.getSequence(emprefx, peptides);
112         if (seq != null)
113         {
114           seqs.add(seq.deriveSequence());
115           // place DBReferences on dataset and refer
116         }
117       }
118     }
119
120     AlignmentI al = null;
121     if (!seqs.isEmpty())
122     {
123       al = new Alignment(seqs.toArray(new SequenceI[seqs.size()]));
124     }
125     stopQuery();
126     return al;
127   }
128
129   @Override
130   public boolean isDnaCoding()
131   {
132     return true;
133   }
134
135 }