0074d2a260adb990aeaeeee40ff992845775c4a7
[jalview.git] / src / jalview / datamodel / SearchResults.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.datamodel;
22
23 import java.util.ArrayList;
24 import java.util.BitSet;
25 import java.util.List;
26
27 /**
28  * Holds a list of search result matches, where each match is a contiguous
29  * stretch of a single sequence.
30  * 
31  * @author gmcarstairs amwaterhouse
32  *
33  */
34 public class SearchResults implements SearchResultsI
35 {
36
37   private List<SearchResultMatchI> matches = new ArrayList<>();
38
39   /**
40    * One match consists of a sequence reference, start and end positions.
41    * Discontiguous ranges in a sequence require two or more Match objects.
42    */
43   public class Match implements SearchResultMatchI
44   {
45     final SequenceI sequence;
46
47     /**
48      * Start position of match in sequence (base 1)
49      */
50     final int start;
51
52     /**
53      * End position (inclusive) (base 1)
54      */
55     final int end;
56
57     /**
58      * create a Match on a range of sequence. Match always holds region in
59      * forwards order, even if given in reverse order (such as from a mapping to
60      * a reverse strand); this avoids trouble for routines that highlight search
61      * results etc
62      * 
63      * @param seq
64      *          a sequence
65      * @param start
66      *          start position of matched range (base 1)
67      * @param end
68      *          end of matched range (inclusive, base 1)
69      */
70     public Match(SequenceI seq, int start, int end)
71     {
72       sequence = seq;
73
74       /*
75        * always hold in forwards order, even if given in reverse order
76        * (such as from a mapping to a reverse strand); this avoids
77        * trouble for routines that highlight search results etc
78        */
79       if (start <= end)
80       {
81         this.start = start;
82         this.end = end;
83       }
84       else
85       {
86         // TODO: JBP could mark match as being specified in reverse direction
87         // for use
88         // by caller ? e.g. visualizing reverse strand highlight
89         this.start = end;
90         this.end = start;
91       }
92     }
93
94     @Override
95     public SequenceI getSequence()
96     {
97       return sequence;
98     }
99
100     @Override
101     public int getStart()
102     {
103       return start;
104     }
105
106     @Override
107     public int getEnd()
108     {
109       return end;
110     }
111
112     /**
113      * Returns a representation as "seqid/start-end"
114      */
115     @Override
116     public String toString()
117     {
118       StringBuilder sb = new StringBuilder();
119       if (sequence != null)
120       {
121         sb.append(sequence.getName()).append("/");
122       }
123       sb.append(start).append("-").append(end);
124       return sb.toString();
125     }
126
127     /**
128      * Hashcode is the hashcode of the matched sequence plus a hash of start and
129      * end positions. Match objects that pass the test for equals are guaranteed
130      * to have the same hashcode.
131      */
132     @Override
133     public int hashCode()
134     {
135       int hash = sequence == null ? 0 : sequence.hashCode();
136       hash += 31 * start;
137       hash += 67 * end;
138       return hash;
139     }
140
141     /**
142      * Two Match objects are equal if they are for the same sequence, start and
143      * end positions
144      */
145     @Override
146     public boolean equals(Object obj)
147     {
148       if (obj == null || !(obj instanceof SearchResultMatchI))
149       {
150         return false;
151       }
152       SearchResultMatchI m = (SearchResultMatchI) obj;
153       return (sequence == m.getSequence() && start == m.getStart()
154               && end == m.getEnd());
155     }
156
157     @Override
158     public boolean contains(SequenceI seq, int from, int to)
159     {
160       return (sequence == seq && start <= from && end >= to);
161     }
162   }
163
164   @Override
165   public SearchResultMatchI addResult(SequenceI seq, int start, int end)
166   {
167     Match m = new Match(seq, start, end);
168     if (!matches.contains(m))
169     {
170       matches.add(m);
171     }
172     return m;
173   }
174
175   @Override
176   public boolean involvesSequence(SequenceI sequence)
177   {
178     final int start = sequence.getStart();
179     final int end = sequence.getEnd();
180
181     SequenceI ds = sequence.getDatasetSequence();
182     for (SearchResultMatchI m : matches)
183     {
184       SequenceI matched = m.getSequence();
185       if (matched != null && (matched == sequence || matched == ds)
186               && (m.getEnd() >= start) && (m.getStart() <= end))
187       {
188         return true;
189       }
190     }
191     return false;
192   }
193
194   @Override
195   public int[] getResults(SequenceI sequence, int start, int end)
196   {
197     if (matches.isEmpty())
198     {
199       return null;
200     }
201
202     int[] result = null;
203     int[] tmp = null;
204     int resultLength, matchStart = 0, matchEnd = 0;
205     boolean mfound;
206     Match m;
207     for (SearchResultMatchI _m : matches)
208     {
209       m = (Match) _m;
210
211       mfound = false;
212       if (m.sequence == sequence
213               || m.sequence == sequence.getDatasetSequence())
214       {
215         mfound = true;
216         matchStart = sequence.findIndex(m.start) - 1;
217         matchEnd = m.start == m.end ? matchStart : sequence
218                 .findIndex(m.end) - 1;
219       }
220
221       if (mfound)
222       {
223         if (matchStart <= end && matchEnd >= start)
224         {
225           if (matchStart < start)
226           {
227             matchStart = start;
228           }
229
230           if (matchEnd > end)
231           {
232             matchEnd = end;
233           }
234
235           if (result == null)
236           {
237             result = new int[] { matchStart, matchEnd };
238           }
239           else
240           {
241             resultLength = result.length;
242             tmp = new int[resultLength + 2];
243             System.arraycopy(result, 0, tmp, 0, resultLength);
244             result = tmp;
245             result[resultLength] = matchStart;
246             result[resultLength + 1] = matchEnd;
247           }
248         }
249         else
250         {
251           // debug
252           // System.err.println("Outwith bounds!" + matchStart+">"+end +" or "
253           // + matchEnd+"<"+start);
254         }
255       }
256     }
257     return result;
258   }
259
260   @Override
261   public int markColumns(SequenceCollectionI sqcol, BitSet bs)
262   {
263     int count = 0;
264     BitSet mask = new BitSet();
265     int startRes = sqcol.getStartRes();
266     int endRes = sqcol.getEndRes();
267
268     for (SequenceI s : sqcol.getSequences())
269     {
270       int[] cols = getResults(s, startRes, endRes);
271       if (cols != null)
272       {
273         for (int pair = 0; pair < cols.length; pair += 2)
274         {
275           mask.set(cols[pair], cols[pair + 1] + 1);
276         }
277       }
278     }
279     // compute columns that were newly selected
280     BitSet original = (BitSet) bs.clone();
281     original.and(mask);
282     count = mask.cardinality() - original.cardinality();
283     // and mark ranges not already marked
284     bs.or(mask);
285     return count;
286   }
287
288   @Override
289   public int getSize()
290   {
291     return matches.size();
292   }
293
294   @Override
295   public boolean isEmpty()
296   {
297     return matches.isEmpty();
298   }
299
300   @Override
301   public List<SearchResultMatchI> getResults()
302   {
303     return matches;
304   }
305
306   /**
307    * Return the results as a list of matches [seq1/from-to, seq2/from-to, ...]
308    * 
309    * @return
310    */
311   @Override
312   public String toString()
313   {
314     return matches == null ? "" : matches.toString();
315   }
316
317   /**
318    * Hashcode is derived from the list of matches. This ensures that when two
319    * SearchResults objects satisfy the test for equals(), then they have the
320    * same hashcode.
321    * 
322    * @see Match#hashCode()
323    * @see java.util.AbstractList#hashCode()
324    */
325   @Override
326   public int hashCode()
327   {
328     return matches.hashCode();
329   }
330
331   /**
332    * Two SearchResults are considered equal if they contain the same matches in
333    * the same order.
334    */
335   @Override
336   public boolean equals(Object obj)
337   {
338     if (obj == null || !(obj instanceof SearchResultsI))
339     {
340       return false;
341     }
342     SearchResultsI sr = (SearchResultsI) obj;
343     return matches.equals(sr.getResults());
344   }
345
346   @Override
347   public void addSearchResults(SearchResultsI toAdd)
348   {
349     matches.addAll(toAdd.getResults());
350   }
351 }