6c6c26eb7b53a8b5b5b0e3a46c81a0f2b73f045a
[jalview.git] / src / jalview / datamodel / AlignedCodonFrame.java
1 package jalview.datamodel;\r
2 \r
3 import java.util.Enumeration;\r
4 import java.util.Vector;\r
5 \r
6 import jalview.util.MapList;\r
7 \r
8 /**\r
9  * Stores mapping between the columns of a protein alignment and a DNA alignment\r
10  * and a list of individual codon to amino acid mappings between sequences.\r
11  */\r
12 \r
13 public class AlignedCodonFrame\r
14 {\r
15   /**\r
16    * array of nucleotide positions for aligned codons at column of aligned proteins.\r
17    */\r
18   public int[][] codons = null;\r
19   /**\r
20    * width of protein sequence alignement\r
21    * implicit assertion that codons.length >= aaWidth\r
22    */\r
23   public int aaWidth=0;\r
24   /**\r
25    * initialise codon frame with a nominal alignment width\r
26    * @param aWidth\r
27    */\r
28   public AlignedCodonFrame(int aWidth)\r
29   {\r
30     if (aWidth<=0)\r
31    {\r
32       codons=null;\r
33       return;\r
34    }\r
35     codons = new int[aWidth][];\r
36     for (int res = 0; res < aWidth; res++)\r
37       codons[res] = null;\r
38   }\r
39 \r
40   /**\r
41    * ensure that codons array is at least as wide as aslen residues\r
42    * @param aslen\r
43    * @return (possibly newly expanded) codon array\r
44    */\r
45   public int[][] checkCodonFrameWidth(int aslen)\r
46   {\r
47     if (codons.length <= aslen + 1)\r
48     {\r
49       // probably never have to do this ?\r
50       int[][] c = new int[codons.length + 10][];\r
51       for (int i = 0; i < codons.length; i++)\r
52       {\r
53         c[i] = codons[i];\r
54         codons[i] = null;\r
55       }\r
56       codons = c;\r
57     }\r
58     return codons;\r
59   }\r
60   /**\r
61    * @return width of aligned translated amino acid residues \r
62    */\r
63   public int getaaWidth()\r
64   {\r
65     return aaWidth;\r
66   }\r
67   /**\r
68    * TODO: not an ideal solution - we reference the aligned amino acid sequences in order to make insertions on them\r
69    * Better would be dnaAlignment and aaAlignment reference....\r
70    */\r
71   Vector a_aaSeqs=new Vector();\r
72   /**\r
73    * increase aaWidth by one and insert a new aligned codon position space at aspos.\r
74    * @param aspos\r
75    */\r
76   public void insertAAGap(int aspos, char gapCharacter)\r
77   {            \r
78     // this aa appears before the aligned codons at aspos - so shift them in each pair of mapped sequences\r
79     aaWidth++;\r
80     if (a_aaSeqs!=null)\r
81     {\r
82       // we actually have to modify the aligned sequences here, so use the a_aaSeqs vector\r
83       Enumeration sq = a_aaSeqs.elements();\r
84       while (sq.hasMoreElements())\r
85       {\r
86         ((SequenceI) sq.nextElement()).insertCharAt(aspos, gapCharacter);\r
87       }\r
88     }\r
89     checkCodonFrameWidth(aspos);\r
90     if (aspos<aaWidth)\r
91     {\r
92       aaWidth++;\r
93       System.arraycopy(codons, aspos, codons, aspos+1, aaWidth-aspos);\r
94       codons[aspos]=null; // clear so new codon position can be marked.\r
95     }\r
96   }\r
97 \r
98   public void setAaWidth(int aapos)\r
99   {\r
100     aaWidth = aapos;\r
101   }\r
102   /**\r
103    * tied array of na Sequence objects.\r
104    */\r
105   SequenceI[] dnaSeqs=null;\r
106   /**\r
107    * tied array of Mappings to protein sequence Objects and \r
108      SequenceI[] aaSeqs=null;\r
109    * MapLists where eac maps from the corresponding dnaSeqs element to corresponding aaSeqs element  \r
110    */\r
111   Mapping[] dnaToProt=null;\r
112   /**\r
113    * add a mapping between the dataset sequences for the associated dna and protein sequence objects\r
114    * @param dnaseq\r
115    * @param aaseq\r
116    * @param map\r
117    */\r
118   public void addMap(SequenceI dnaseq, SequenceI aaseq, MapList map)\r
119   { \r
120     int nlen=1;\r
121     if (dnaSeqs!=null)\r
122     {\r
123       nlen = dnaSeqs.length+1;\r
124     }\r
125     SequenceI[] ndna = new SequenceI[nlen];\r
126     Mapping[] ndtp = new Mapping[nlen];\r
127     if (dnaSeqs!=null)\r
128     {\r
129       System.arraycopy(dnaSeqs,0,ndna, 0, dnaSeqs.length);\r
130       System.arraycopy(dnaToProt,0,ndtp, 0, dnaSeqs.length);\r
131     }\r
132     dnaSeqs = ndna;\r
133     dnaToProt = ndtp;\r
134     nlen--;\r
135     dnaSeqs[nlen] = (dnaseq.getDatasetSequence()==null) ? dnaseq : dnaseq.getDatasetSequence();\r
136     Mapping mp = new Mapping(map);\r
137     // JBPNote DEBUG! THIS !\r
138     //dnaseq.transferAnnotation(aaseq, mp);\r
139     //aaseq.transferAnnotation(dnaseq, new Mapping(map.getInverse()));\r
140     mp.to = (aaseq.getDatasetSequence()==null) ? aaseq : aaseq.getDatasetSequence();\r
141     a_aaSeqs.addElement(aaseq);\r
142     dnaToProt[nlen] = mp;\r
143   }\r
144 \r
145 \r
146   public SequenceI[] getdnaSeqs()\r
147   {\r
148     return dnaSeqs;\r
149   }\r
150   public SequenceI[] getAaSeqs()\r
151   {\r
152     if (dnaToProt==null)\r
153       return null;\r
154     SequenceI[] sqs = new SequenceI[dnaToProt.length];\r
155     for (int sz=0; sz<dnaToProt.length; sz++)\r
156     {\r
157       sqs[sz]  = dnaToProt[sz].to;\r
158     }\r
159     return sqs;\r
160   }\r
161   public MapList[] getdnaToProt()\r
162   {\r
163     if (dnaToProt==null)\r
164       return null;\r
165     MapList[] sqs = new MapList[dnaToProt.length];\r
166     for (int sz=0; sz<dnaToProt.length; sz++)\r
167     {\r
168       sqs[sz]  = dnaToProt[sz].map;\r
169     }\r
170     return sqs;\r
171   }\r
172   public Mapping[] getProtMappings()\r
173   {\r
174     return dnaToProt;\r
175   }\r
176   /**\r
177    * \r
178    * @param sequenceRef\r
179    * @return null or corresponding aaSeq entry for dnaSeq entry\r
180    */\r
181   public SequenceI getAaForDnaSeq(SequenceI dnaSeqRef)\r
182   {\r
183     if (dnaSeqs==null)\r
184     {\r
185       return null;\r
186     }\r
187     SequenceI dnads = dnaSeqRef.getDatasetSequence();\r
188     for (int ds=0;ds<dnaSeqs.length; ds++)\r
189     {\r
190       if (dnaSeqs[ds]==dnaSeqRef || dnaSeqs[ds]==dnads)\r
191         return dnaToProt[ds].to;\r
192     }\r
193     return null;\r
194   }\r
195   /**\r
196    * \r
197    * @param sequenceRef\r
198    * @return null or corresponding aaSeq entry for dnaSeq entry\r
199    */\r
200   public SequenceI getDnaForAaSeq(SequenceI aaSeqRef)\r
201   {\r
202     if (dnaToProt==null)\r
203     {\r
204       return null;\r
205     }\r
206     SequenceI aads = aaSeqRef.getDatasetSequence();\r
207     for (int as=0;as<dnaToProt.length; as++)\r
208     {\r
209       if (dnaToProt[as].to==aaSeqRef || dnaToProt[as].to==aads)\r
210         return dnaSeqs[as];\r
211     }\r
212     return null;\r
213   }\r
214   /**\r
215    * test to see if codon frame involves seq in any way\r
216    * @param seq a nucleotide or protein sequence\r
217    * @return true if a mapping exists to or from this sequence to any translated sequence\r
218    */\r
219   public boolean involvesSequence(SequenceI seq)\r
220   {\r
221     return getAaForDnaSeq(seq)!=null || getDnaForAaSeq(seq)!=null;\r
222   }\r
223   /**\r
224    * Add search results for regions in other sequences that translate or are translated from a particular position in seq \r
225    * @param seq\r
226    * @param index position in seq\r
227    * @param results where highlighted regions go\r
228    */\r
229   public void markMappedRegion(SequenceI seq, int index, SearchResults results)\r
230   {\r
231     if (dnaToProt==null)\r
232     {\r
233       return;\r
234     }\r
235     int[] codon;\r
236     SequenceI ds = seq.getDatasetSequence();\r
237     for (int mi = 0; mi<dnaToProt.length; mi++)\r
238     {\r
239       if (dnaSeqs[mi]==seq || dnaSeqs[mi]==ds)\r
240       {\r
241         // DEBUG System.err.println("dna pos "+index);\r
242         codon = dnaToProt[mi].map.locateInTo(index,index);\r
243         if (codon!=null)\r
244         {\r
245           for (int i=0; i<codon.length; i+=2)\r
246             {\r
247               results.addResult(dnaToProt[mi].to, codon[i], codon[i+1]);\r
248             }\r
249         }\r
250       } else\r
251         if (dnaToProt[mi].to==seq || dnaToProt[mi].to==ds)\r
252         {\r
253           // DEBUG System.err.println("aa pos "+index);\r
254           {\r
255             codon = dnaToProt[mi].map.locateInFrom(index, index);\r
256             if (codon!=null)\r
257             {\r
258             for (int i=0; i<codon.length; i+=2)\r
259               {\r
260                 results.addResult(dnaSeqs[mi], codon[i], codon[i+1]);\r
261               }\r
262           }\r
263         }\r
264         }\r
265     }\r
266   }\r
267 }\r