use pdb refsource string
[jalview.git] / src / jalview / ws / dbsources / Pdb.java
1 /**\r
2  * \r
3  */\r
4 package jalview.ws.dbsources;\r
5 \r
6 import jalview.datamodel.Alignment;\r
7 import jalview.datamodel.DBRefEntry;\r
8 import jalview.datamodel.DBRefSource;\r
9 import jalview.datamodel.SequenceI;\r
10 \r
11 import java.io.BufferedInputStream;\r
12 import java.io.InputStream;\r
13 import java.io.InputStreamReader;\r
14 import java.util.Hashtable;\r
15 import java.util.Vector;\r
16 \r
17 import MCview.PDBChain;\r
18 import MCview.PDBfile;\r
19 \r
20 import com.stevesoft.pat.Regex;\r
21 \r
22 import jalview.datamodel.AlignmentI;\r
23 import jalview.io.FileParse;\r
24 import jalview.ws.DbSourceProxy;\r
25 import jalview.ws.DbSourceProxyImpl;\r
26 import jalview.ws.EBIFetchClient;\r
27 \r
28 /**\r
29  * @author JimP\r
30  *\r
31  */\r
32 public class Pdb extends EbiFileRetrievedProxy implements DbSourceProxy\r
33 {\r
34   public Pdb() {\r
35     super();\r
36     addDbSourceProperty(DBRefSource.PROTSEQDB);\r
37   }\r
38 \r
39   /* (non-Javadoc)\r
40    * @see jalview.ws.DbSourceProxy#getAccessionSeparator()\r
41    */\r
42   public String getAccessionSeparator()\r
43   {\r
44     // TODO Auto-generated method stub\r
45     return null;\r
46   }\r
47 \r
48   /* (non-Javadoc)\r
49    * @see jalview.ws.DbSourceProxy#getAccessionValidator()\r
50    */\r
51   public Regex getAccessionValidator()\r
52   {\r
53     return new Regex("[1-9][0-9A-Za-z]{3}[ _A-Za-z0-9]?");\r
54   }\r
55 \r
56   /* (non-Javadoc)\r
57    * @see jalview.ws.DbSourceProxy#getDbSource()\r
58    */\r
59   public String getDbSource()\r
60   {\r
61     return DBRefSource.PDB;\r
62   }\r
63 \r
64   /* (non-Javadoc)\r
65    * @see jalview.ws.DbSourceProxy#getDbVersion()\r
66    */\r
67   public String getDbVersion()\r
68   {\r
69     return "0";\r
70   }\r
71   /* (non-Javadoc)\r
72    * @see jalview.ws.DbSourceProxy#getSequenceRecords(java.lang.String[])\r
73    */\r
74   public AlignmentI getSequenceRecords(String queries) throws Exception\r
75   {\r
76 \r
77     Vector result = new Vector();\r
78     String chain = null;\r
79     String id = null;\r
80     if (queries.indexOf(":") > -1)\r
81     {\r
82       chain = queries.substring(queries.indexOf(":") + 1);\r
83       id = queries.substring(0, queries.indexOf(":"));\r
84     }\r
85     else\r
86     {\r
87       id = queries;\r
88     }\r
89     if (queries.length() > 4 && chain == null)\r
90     {\r
91       chain = queries.substring(4);\r
92       id = queries.substring(0, 4);\r
93     }\r
94     EBIFetchClient ebi = new EBIFetchClient();\r
95     file = ebi.fetchDataAsFile("pdb:" + id, "pdb", "raw")\r
96             .getAbsolutePath();\r
97     stopQuery();\r
98     if (file == null)\r
99     {\r
100       return null;\r
101     }\r
102     try\r
103     {\r
104       \r
105       PDBfile pdbfile = new PDBfile(file,\r
106               jalview.io.AppletFormatAdapter.FILE);\r
107       for (int i = 0; i < pdbfile.chains.size(); i++)\r
108       {\r
109         if (chain == null\r
110                 || ((PDBChain) pdbfile.chains.elementAt(i)).id\r
111                         .toUpperCase().equals(chain))\r
112         {\r
113           PDBChain pdbchain = (PDBChain) pdbfile.chains.elementAt(i);\r
114           // Get the Chain's Sequence - who's dataset includes any special features added from the PDB file\r
115           SequenceI sq = pdbchain.sequence;\r
116           // Specially formatted name for the PDB chain sequences retrieved from the PDB\r
117           sq.setName(jalview.datamodel.DBRefSource.PDB+"|" + id + "|" + sq.getName());\r
118           // Might need to add more metadata to the PDBEntry object\r
119           // like below\r
120           /*\r
121            * PDBEntry entry = new PDBEntry();\r
122            // Construct the PDBEntry\r
123            entry.setId(id);\r
124            if (entry.getProperty() == null)\r
125            entry.setProperty(new Hashtable());\r
126            entry.getProperty().put("chains",\r
127            pdbchain.id\r
128            + "=" + sq.getStart()\r
129            + "-" + sq.getEnd());\r
130            sq.getDatasetSequence().addPDBId(entry);\r
131            */\r
132           // Add PDB DB Refs\r
133           // We make a DBRefEtntry because we have obtained the PDB file from a verifiable source\r
134           // JBPNote - PDB DBRefEntry should also carry the chain and mapping information\r
135           DBRefEntry dbentry = new DBRefEntry(getDbSource(),\r
136                   getDbVersion(), id + pdbchain.id);\r
137           sq.addDBRef(dbentry);\r
138           // and add seuqence to the retrieved set\r
139           result.addElement(sq.deriveSequence());\r
140         }\r
141       }\r
142 \r
143       if (result.size() < 1)\r
144       {\r
145         throw new Exception("No PDB Records for " + id + " chain "\r
146                 + ((chain == null) ? " " : chain));\r
147       }\r
148     } catch (Exception ex) // Problem parsing PDB file\r
149     {\r
150       stopQuery();\r
151       throw (ex);\r
152     }\r
153 \r
154     SequenceI[] results = new SequenceI[result.size()];\r
155     for (int i = 0, j = result.size(); i < j; i++)\r
156     {\r
157       results[i] = (SequenceI) result.elementAt(i);\r
158       result.setElementAt(null, i);\r
159     }\r
160     return new Alignment(results);\r
161   }\r
162 \r
163   /* (non-Javadoc)\r
164    * @see jalview.ws.DbSourceProxy#isValidReference(java.lang.String)\r
165    */\r
166   public boolean isValidReference(String accession)\r
167   {\r
168     Regex r = getAccessionValidator();\r
169     return r.search(accession.trim());\r
170   }\r
171 \r
172   /**\r
173    * obtain human glyoxalase chain A sequence\r
174    */\r
175   public String getTestQuery()\r
176   {\r
177     return "1QIPA";\r
178   }\r
179 \r
180 }\r