7ea9985ecb03eaa2da3cd7671b9facd74d0f4ff4
[jalview.git] / src / jalview / datamodel / Alignment.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.datamodel;
22
23 import jalview.analysis.AlignmentUtils;
24 import jalview.io.FastaFile;
25 import jalview.util.MessageManager;
26
27 import java.util.ArrayList;
28 import java.util.Enumeration;
29 import java.util.HashSet;
30 import java.util.Hashtable;
31 import java.util.LinkedHashSet;
32 import java.util.List;
33 import java.util.Map;
34 import java.util.Set;
35 import java.util.Vector;
36
37 /**
38  * Data structure to hold and manipulate a multiple sequence alignment
39  */
40 /**
41  * @author JimP
42  * 
43  */
44 public class Alignment implements AlignmentI
45 {
46   protected Alignment dataset;
47
48   protected List<SequenceI> sequences;
49
50   protected List<SequenceGroup> groups = java.util.Collections
51           .synchronizedList(new ArrayList<SequenceGroup>());
52
53   protected char gapCharacter = '-';
54
55   protected int type = NUCLEOTIDE;
56
57   public static final int PROTEIN = 0;
58
59   public static final int NUCLEOTIDE = 1;
60
61   public boolean hasRNAStructure = false;
62
63   /** DOCUMENT ME!! */
64   public AlignmentAnnotation[] annotations;
65
66   HiddenSequences hiddenSequences = new HiddenSequences(this);
67
68   public Hashtable alignmentProperties;
69
70   private Set<AlignedCodonFrame> codonFrameList = new LinkedHashSet<AlignedCodonFrame>();
71
72   private void initAlignment(SequenceI[] seqs)
73   {
74     int i = 0;
75
76     if (jalview.util.Comparison.isNucleotide(seqs))
77     {
78       type = NUCLEOTIDE;
79     }
80     else
81     {
82       type = PROTEIN;
83     }
84
85     sequences = java.util.Collections
86             .synchronizedList(new ArrayList<SequenceI>());
87
88     for (i = 0; i < seqs.length; i++)
89     {
90       sequences.add(seqs[i]);
91     }
92
93   }
94
95   /**
96    * Make a 'copy' alignment - sequences have new copies of features and
97    * annotations, but share the original dataset sequences.
98    */
99   public Alignment(AlignmentI al)
100   {
101     SequenceI[] seqs = al.getSequencesArray();
102     for (int i = 0; i < seqs.length; i++)
103     {
104       seqs[i] = new Sequence(seqs[i]);
105     }
106
107     /*
108      * Share the same dataset sequence mappings (if any). TODO: find a better
109      * place for these to live (alignment dataset?).
110      */
111     this.codonFrameList = ((Alignment) al).codonFrameList;
112
113     initAlignment(seqs);
114   }
115
116   /**
117    * Make an alignment from an array of Sequences.
118    * 
119    * @param sequences
120    */
121   public Alignment(SequenceI[] seqs)
122   {
123     initAlignment(seqs);
124   }
125
126   /**
127    * Make a new alignment from an array of SeqCigars
128    * 
129    * @param seqs
130    *          SeqCigar[]
131    */
132   public Alignment(SeqCigar[] alseqs)
133   {
134     SequenceI[] seqs = SeqCigar.createAlignmentSequences(alseqs,
135             gapCharacter, new ColumnSelection(), null);
136     initAlignment(seqs);
137   }
138
139   /**
140    * Make a new alignment from an CigarArray JBPNote - can only do this when
141    * compactAlignment does not contain hidden regions. JBPNote - must also check
142    * that compactAlignment resolves to a set of SeqCigars - or construct them
143    * appropriately.
144    * 
145    * @param compactAlignment
146    *          CigarArray
147    */
148   public static AlignmentI createAlignment(CigarArray compactAlignment)
149   {
150     throw new Error(
151             MessageManager
152                     .getString("error.alignment_cigararray_not_implemented"));
153     // this(compactAlignment.refCigars);
154   }
155
156   @Override
157   public List<SequenceI> getSequences()
158   {
159     return sequences;
160   }
161
162   @Override
163   public List<SequenceI> getSequences(
164           Map<SequenceI, SequenceCollectionI> hiddenReps)
165   {
166     // TODO: in jalview 2.8 we don't do anything with hiddenreps - fix design to
167     // work on this.
168     return sequences;
169   }
170
171   @Override
172   public SequenceI[] getSequencesArray()
173   {
174     if (sequences == null)
175     {
176       return null;
177     }
178     synchronized (sequences)
179     {
180       return sequences.toArray(new SequenceI[sequences.size()]);
181     }
182   }
183
184   /**
185    * Returns a map of lists of sequences keyed by sequence name.
186    * 
187    * @return
188    */
189   @Override
190   public Map<String, List<SequenceI>> getSequencesByName()
191   {
192     return AlignmentUtils.getSequencesByName(this);
193   }
194
195   /**
196    * DOCUMENT ME!
197    * 
198    * @param i
199    *          DOCUMENT ME!
200    * 
201    * @return DOCUMENT ME!
202    */
203   @Override
204   public SequenceI getSequenceAt(int i)
205   {
206     synchronized (sequences)
207     {
208       if (i > -1 && i < sequences.size())
209       {
210         return sequences.get(i);
211       }
212     }
213     return null;
214   }
215
216   /**
217    * Adds a sequence to the alignment. Recalculates maxLength and size.
218    * 
219    * @param snew
220    */
221   @Override
222   public void addSequence(SequenceI snew)
223   {
224     if (dataset != null)
225     {
226       // maintain dataset integrity
227       if (snew.getDatasetSequence() != null)
228       {
229         getDataset().addSequence(snew.getDatasetSequence());
230       }
231       else
232       {
233         // derive new sequence
234         SequenceI adding = snew.deriveSequence();
235         getDataset().addSequence(adding.getDatasetSequence());
236         snew = adding;
237       }
238     }
239     if (sequences == null)
240     {
241       initAlignment(new SequenceI[] { snew });
242     }
243     else
244     {
245       synchronized (sequences)
246       {
247         sequences.add(snew);
248       }
249     }
250     if (hiddenSequences != null)
251     {
252       hiddenSequences.adjustHeightSequenceAdded();
253     }
254   }
255
256   /**
257    * Adds a sequence to the alignment. Recalculates maxLength and size.
258    * 
259    * @param snew
260    */
261   @Override
262   public void setSequenceAt(int i, SequenceI snew)
263   {
264     synchronized (sequences)
265     {
266       deleteSequence(i);
267       sequences.set(i, snew);
268     }
269   }
270
271   /**
272    * DOCUMENT ME!
273    * 
274    * @return DOCUMENT ME!
275    */
276   @Override
277   public List<SequenceGroup> getGroups()
278   {
279     return groups;
280   }
281
282   @Override
283   public void finalize()
284   {
285     if (getDataset() != null)
286     {
287       getDataset().removeAlignmentRef();
288     }
289
290     dataset = null;
291     sequences = null;
292     groups = null;
293     annotations = null;
294     hiddenSequences = null;
295   }
296
297   /**
298    * decrement the alignmentRefs counter by one and call finalize if it goes to
299    * zero.
300    */
301   private void removeAlignmentRef()
302   {
303     if (--alignmentRefs == 0)
304     {
305       finalize();
306     }
307   }
308
309   /**
310    * DOCUMENT ME!
311    * 
312    * @param s
313    *          DOCUMENT ME!
314    */
315   @Override
316   public void deleteSequence(SequenceI s)
317   {
318     deleteSequence(findIndex(s));
319   }
320
321   /**
322    * DOCUMENT ME!
323    * 
324    * @param i
325    *          DOCUMENT ME!
326    */
327   @Override
328   public void deleteSequence(int i)
329   {
330     if (i > -1 && i < getHeight())
331     {
332       synchronized (sequences)
333       {
334         sequences.remove(i);
335         hiddenSequences.adjustHeightSequenceDeleted(i);
336       }
337     }
338   }
339
340   /*
341    * (non-Javadoc)
342    * 
343    * @see jalview.datamodel.AlignmentI#findGroup(jalview.datamodel.SequenceI)
344    */
345   @Override
346   public SequenceGroup findGroup(SequenceI s)
347   {
348     synchronized (groups)
349     {
350       for (int i = 0; i < this.groups.size(); i++)
351       {
352         SequenceGroup sg = groups.get(i);
353
354         if (sg.getSequences(null).contains(s))
355         {
356           return sg;
357         }
358       }
359     }
360     return null;
361   }
362
363   /*
364    * (non-Javadoc)
365    * 
366    * @see
367    * jalview.datamodel.AlignmentI#findAllGroups(jalview.datamodel.SequenceI)
368    */
369   @Override
370   public SequenceGroup[] findAllGroups(SequenceI s)
371   {
372     ArrayList<SequenceGroup> temp = new ArrayList<SequenceGroup>();
373
374     synchronized (groups)
375     {
376       int gSize = groups.size();
377       for (int i = 0; i < gSize; i++)
378       {
379         SequenceGroup sg = groups.get(i);
380         if (sg == null || sg.getSequences() == null)
381         {
382           this.deleteGroup(sg);
383           gSize--;
384           continue;
385         }
386
387         if (sg.getSequences().contains(s))
388         {
389           temp.add(sg);
390         }
391       }
392     }
393     SequenceGroup[] ret = new SequenceGroup[temp.size()];
394     return temp.toArray(ret);
395   }
396
397   /**    */
398   @Override
399   public void addGroup(SequenceGroup sg)
400   {
401     synchronized (groups)
402     {
403       if (!groups.contains(sg))
404       {
405         if (hiddenSequences.getSize() > 0)
406         {
407           int i, iSize = sg.getSize();
408           for (i = 0; i < iSize; i++)
409           {
410             if (!sequences.contains(sg.getSequenceAt(i)))
411             {
412               sg.deleteSequence(sg.getSequenceAt(i), false);
413               iSize--;
414               i--;
415             }
416           }
417
418           if (sg.getSize() < 1)
419           {
420             return;
421           }
422         }
423         sg.setContext(this);
424         groups.add(sg);
425       }
426     }
427   }
428
429   /**
430    * remove any annotation that references gp
431    * 
432    * @param gp
433    *          (if null, removes all group associated annotation)
434    */
435   private void removeAnnotationForGroup(SequenceGroup gp)
436   {
437     if (annotations == null || annotations.length == 0)
438     {
439       return;
440     }
441     // remove annotation very quickly
442     AlignmentAnnotation[] t, todelete = new AlignmentAnnotation[annotations.length], tokeep = new AlignmentAnnotation[annotations.length];
443     int i, p, k;
444     if (gp == null)
445     {
446       for (i = 0, p = 0, k = 0; i < annotations.length; i++)
447       {
448         if (annotations[i].groupRef != null)
449         {
450           todelete[p++] = annotations[i];
451         }
452         else
453         {
454           tokeep[k++] = annotations[i];
455         }
456       }
457     }
458     else
459     {
460       for (i = 0, p = 0, k = 0; i < annotations.length; i++)
461       {
462         if (annotations[i].groupRef == gp)
463         {
464           todelete[p++] = annotations[i];
465         }
466         else
467         {
468           tokeep[k++] = annotations[i];
469         }
470       }
471     }
472     if (p > 0)
473     {
474       // clear out the group associated annotation.
475       for (i = 0; i < p; i++)
476       {
477         unhookAnnotation(todelete[i]);
478         todelete[i] = null;
479       }
480       t = new AlignmentAnnotation[k];
481       for (i = 0; i < k; i++)
482       {
483         t[i] = tokeep[i];
484       }
485       annotations = t;
486     }
487   }
488
489   @Override
490   public void deleteAllGroups()
491   {
492     synchronized (groups)
493     {
494       if (annotations != null)
495       {
496         removeAnnotationForGroup(null);
497       }
498       for (SequenceGroup sg : groups)
499       {
500         sg.setContext(null);
501       }
502       groups.clear();
503     }
504   }
505
506   /**    */
507   @Override
508   public void deleteGroup(SequenceGroup g)
509   {
510     synchronized (groups)
511     {
512       if (groups.contains(g))
513       {
514         removeAnnotationForGroup(g);
515         groups.remove(g);
516         g.setContext(null);
517       }
518     }
519   }
520
521   /**    */
522   @Override
523   public SequenceI findName(String name)
524   {
525     return findName(name, false);
526   }
527
528   /*
529    * (non-Javadoc)
530    * 
531    * @see jalview.datamodel.AlignmentI#findName(java.lang.String, boolean)
532    */
533   @Override
534   public SequenceI findName(String token, boolean b)
535   {
536     return findName(null, token, b);
537   }
538
539   /*
540    * (non-Javadoc)
541    * 
542    * @see jalview.datamodel.AlignmentI#findName(SequenceI, java.lang.String,
543    * boolean)
544    */
545   @Override
546   public SequenceI findName(SequenceI startAfter, String token, boolean b)
547   {
548
549     int i = 0;
550     SequenceI sq = null;
551     String sqname = null;
552     if (startAfter != null)
553     {
554       // try to find the sequence in the alignment
555       boolean matched = false;
556       while (i < sequences.size())
557       {
558         if (getSequenceAt(i++) == startAfter)
559         {
560           matched = true;
561           break;
562         }
563       }
564       if (!matched)
565       {
566         i = 0;
567       }
568     }
569     while (i < sequences.size())
570     {
571       sq = getSequenceAt(i);
572       sqname = sq.getName();
573       if (sqname.equals(token) // exact match
574               || (b && // allow imperfect matches - case varies
575               (sqname.equalsIgnoreCase(token))))
576       {
577         return getSequenceAt(i);
578       }
579
580       i++;
581     }
582
583     return null;
584   }
585
586   @Override
587   public SequenceI[] findSequenceMatch(String name)
588   {
589     Vector matches = new Vector();
590     int i = 0;
591
592     while (i < sequences.size())
593     {
594       if (getSequenceAt(i).getName().equals(name))
595       {
596         matches.addElement(getSequenceAt(i));
597       }
598       i++;
599     }
600
601     SequenceI[] result = new SequenceI[matches.size()];
602     for (i = 0; i < result.length; i++)
603     {
604       result[i] = (SequenceI) matches.elementAt(i);
605     }
606
607     return result;
608
609   }
610
611   /*
612    * (non-Javadoc)
613    * 
614    * @see jalview.datamodel.AlignmentI#findIndex(jalview.datamodel.SequenceI)
615    */
616   @Override
617   public int findIndex(SequenceI s)
618   {
619     int i = 0;
620
621     while (i < sequences.size())
622     {
623       if (s == getSequenceAt(i))
624       {
625         return i;
626       }
627
628       i++;
629     }
630
631     return -1;
632   }
633
634   /*
635    * (non-Javadoc)
636    * 
637    * @see
638    * jalview.datamodel.AlignmentI#findIndex(jalview.datamodel.SearchResults)
639    */
640   @Override
641   public int findIndex(SearchResults results)
642   {
643     int i = 0;
644
645     while (i < sequences.size())
646     {
647       if (results.involvesSequence(getSequenceAt(i)))
648       {
649         return i;
650       }
651       i++;
652     }
653     return -1;
654   }
655
656   /**
657    * DOCUMENT ME!
658    * 
659    * @return DOCUMENT ME!
660    */
661   @Override
662   public int getHeight()
663   {
664     return sequences.size();
665   }
666
667   /**
668    * DOCUMENT ME!
669    * 
670    * @return DOCUMENT ME!
671    */
672   @Override
673   public int getWidth()
674   {
675     int maxLength = -1;
676
677     for (int i = 0; i < sequences.size(); i++)
678     {
679       if (getSequenceAt(i).getLength() > maxLength)
680       {
681         maxLength = getSequenceAt(i).getLength();
682       }
683     }
684
685     return maxLength;
686   }
687
688   /**
689    * DOCUMENT ME!
690    * 
691    * @param gc
692    *          DOCUMENT ME!
693    */
694   @Override
695   public void setGapCharacter(char gc)
696   {
697     gapCharacter = gc;
698     synchronized (sequences)
699     {
700       for (SequenceI seq : sequences)
701       {
702         seq.setSequence(seq.getSequenceAsString().replace('.', gc)
703                 .replace('-', gc).replace(' ', gc));
704       }
705     }
706   }
707
708   /**
709    * DOCUMENT ME!
710    * 
711    * @return DOCUMENT ME!
712    */
713   @Override
714   public char getGapCharacter()
715   {
716     return gapCharacter;
717   }
718
719   /*
720    * (non-Javadoc)
721    * 
722    * @see jalview.datamodel.AlignmentI#isAligned()
723    */
724   @Override
725   public boolean isAligned()
726   {
727     return isAligned(false);
728   }
729
730   /*
731    * (non-Javadoc)
732    * 
733    * @see jalview.datamodel.AlignmentI#isAligned(boolean)
734    */
735   @Override
736   public boolean isAligned(boolean includeHidden)
737   {
738     int width = getWidth();
739     if (hiddenSequences == null || hiddenSequences.getSize() == 0)
740     {
741       includeHidden = true; // no hidden sequences to check against.
742     }
743     for (int i = 0; i < sequences.size(); i++)
744     {
745       if (includeHidden || !hiddenSequences.isHidden(getSequenceAt(i)))
746       {
747         if (getSequenceAt(i).getLength() != width)
748         {
749           return false;
750         }
751       }
752     }
753
754     return true;
755   }
756
757   /**
758    * Delete all annotations, including auto-calculated if the flag is set true.
759    * Returns true if at least one annotation was deleted, else false.
760    * 
761    * @param includingAutoCalculated
762    * @return
763    */
764   @Override
765   public boolean deleteAllAnnotations(boolean includingAutoCalculated)
766   {
767     boolean result = false;
768     for (AlignmentAnnotation alan : getAlignmentAnnotation())
769     {
770       if (!alan.autoCalculated || includingAutoCalculated)
771       {
772         deleteAnnotation(alan);
773         result = true;
774       }
775     }
776     return result;
777   }
778
779   /*
780    * (non-Javadoc)
781    * 
782    * @seejalview.datamodel.AlignmentI#deleteAnnotation(jalview.datamodel.
783    * AlignmentAnnotation)
784    */
785   @Override
786   public boolean deleteAnnotation(AlignmentAnnotation aa)
787   {
788     return deleteAnnotation(aa, true);
789   }
790
791   @Override
792   public boolean deleteAnnotation(AlignmentAnnotation aa, boolean unhook)
793   {
794     int aSize = 1;
795
796     if (annotations != null)
797     {
798       aSize = annotations.length;
799     }
800
801     if (aSize < 1)
802     {
803       return false;
804     }
805
806     AlignmentAnnotation[] temp = new AlignmentAnnotation[aSize - 1];
807
808     boolean swap = false;
809     int tIndex = 0;
810
811     for (int i = 0; i < aSize; i++)
812     {
813       if (annotations[i] == aa)
814       {
815         swap = true;
816         continue;
817       }
818       if (tIndex < temp.length)
819       {
820         temp[tIndex++] = annotations[i];
821       }
822     }
823
824     if (swap)
825     {
826       annotations = temp;
827       if (unhook)
828       {
829         unhookAnnotation(aa);
830       }
831     }
832     return swap;
833   }
834
835   /**
836    * remove any object references associated with this annotation
837    * 
838    * @param aa
839    */
840   private void unhookAnnotation(AlignmentAnnotation aa)
841   {
842     if (aa.sequenceRef != null)
843     {
844       aa.sequenceRef.removeAlignmentAnnotation(aa);
845     }
846     if (aa.groupRef != null)
847     {
848       // probably need to do more here in the future (post 2.5.0)
849       aa.groupRef = null;
850     }
851   }
852
853   /*
854    * (non-Javadoc)
855    * 
856    * @seejalview.datamodel.AlignmentI#addAnnotation(jalview.datamodel.
857    * AlignmentAnnotation)
858    */
859   @Override
860   public void addAnnotation(AlignmentAnnotation aa)
861   {
862     addAnnotation(aa, -1);
863   }
864
865   /*
866    * (non-Javadoc)
867    * 
868    * @seejalview.datamodel.AlignmentI#addAnnotation(jalview.datamodel.
869    * AlignmentAnnotation, int)
870    */
871   @Override
872   public void addAnnotation(AlignmentAnnotation aa, int pos)
873   {
874     if (aa.getRNAStruc() != null)
875     {
876       hasRNAStructure = true;
877     }
878
879     int aSize = 1;
880     if (annotations != null)
881     {
882       aSize = annotations.length + 1;
883     }
884
885     AlignmentAnnotation[] temp = new AlignmentAnnotation[aSize];
886     int i = 0;
887     if (pos == -1 || pos >= aSize)
888     {
889       temp[aSize - 1] = aa;
890     }
891     else
892     {
893       temp[pos] = aa;
894     }
895     if (aSize > 1)
896     {
897       int p = 0;
898       for (i = 0; i < (aSize - 1); i++, p++)
899       {
900         if (p == pos)
901         {
902           p++;
903         }
904         if (p < temp.length)
905         {
906           temp[p] = annotations[i];
907         }
908       }
909     }
910
911     annotations = temp;
912   }
913
914   @Override
915   public void setAnnotationIndex(AlignmentAnnotation aa, int index)
916   {
917     if (aa == null || annotations == null || annotations.length - 1 < index)
918     {
919       return;
920     }
921
922     int aSize = annotations.length;
923     AlignmentAnnotation[] temp = new AlignmentAnnotation[aSize];
924
925     temp[index] = aa;
926
927     for (int i = 0; i < aSize; i++)
928     {
929       if (i == index)
930       {
931         continue;
932       }
933
934       if (i < index)
935       {
936         temp[i] = annotations[i];
937       }
938       else
939       {
940         temp[i] = annotations[i - 1];
941       }
942     }
943
944     annotations = temp;
945   }
946
947   @Override
948   /**
949    * returns all annotation on the alignment
950    */
951   public AlignmentAnnotation[] getAlignmentAnnotation()
952   {
953     return annotations;
954   }
955
956   @Override
957   public void setNucleotide(boolean b)
958   {
959     if (b)
960     {
961       type = NUCLEOTIDE;
962     }
963     else
964     {
965       type = PROTEIN;
966     }
967   }
968
969   @Override
970   public boolean isNucleotide()
971   {
972     if (type == NUCLEOTIDE)
973     {
974       return true;
975     }
976     else
977     {
978       return false;
979     }
980   }
981
982   @Override
983   public boolean hasRNAStructure()
984   {
985     // TODO can it happen that structure is removed from alignment?
986     return hasRNAStructure;
987   }
988
989   @Override
990   public void setDataset(Alignment data)
991   {
992     if (dataset == null && data == null)
993     {
994       // Create a new dataset for this alignment.
995       // Can only be done once, if dataset is not null
996       // This will not be performed
997       SequenceI[] seqs = new SequenceI[getHeight()];
998       SequenceI currentSeq;
999       for (int i = 0; i < getHeight(); i++)
1000       {
1001         currentSeq = getSequenceAt(i);
1002         if (currentSeq.getDatasetSequence() != null)
1003         {
1004           seqs[i] = currentSeq.getDatasetSequence();
1005         }
1006         else
1007         {
1008           seqs[i] = currentSeq.createDatasetSequence();
1009         }
1010       }
1011
1012       dataset = new Alignment(seqs);
1013     }
1014     else if (dataset == null && data != null)
1015     {
1016       dataset = data;
1017       for (int i = 0; i < getHeight(); i++)
1018       {
1019         SequenceI currentSeq = getSequenceAt(i);
1020         SequenceI dsq = currentSeq.getDatasetSequence();
1021         if (dsq == null)
1022         {
1023           dsq = currentSeq.createDatasetSequence();
1024           dataset.addSequence(dsq);
1025         }
1026         else
1027         {
1028           while (dsq.getDatasetSequence() != null)
1029           {
1030             dsq = dsq.getDatasetSequence();
1031           }
1032           if (dataset.findIndex(dsq) == -1)
1033           {
1034             dataset.addSequence(dsq);
1035           }
1036         }
1037       }
1038     }
1039     dataset.addAlignmentRef();
1040   }
1041
1042   /**
1043    * reference count for number of alignments referencing this one.
1044    */
1045   int alignmentRefs = 0;
1046
1047   /**
1048    * increase reference count to this alignment.
1049    */
1050   private void addAlignmentRef()
1051   {
1052     alignmentRefs++;
1053   }
1054
1055   @Override
1056   public Alignment getDataset()
1057   {
1058     return dataset;
1059   }
1060
1061   @Override
1062   public boolean padGaps()
1063   {
1064     boolean modified = false;
1065
1066     // Remove excess gaps from the end of alignment
1067     int maxLength = -1;
1068
1069     SequenceI current;
1070     for (int i = 0; i < sequences.size(); i++)
1071     {
1072       current = getSequenceAt(i);
1073       for (int j = current.getLength(); j > maxLength; j--)
1074       {
1075         if (j > maxLength
1076                 && !jalview.util.Comparison.isGap(current.getCharAt(j)))
1077         {
1078           maxLength = j;
1079           break;
1080         }
1081       }
1082     }
1083
1084     maxLength++;
1085
1086     int cLength;
1087     for (int i = 0; i < sequences.size(); i++)
1088     {
1089       current = getSequenceAt(i);
1090       cLength = current.getLength();
1091
1092       if (cLength < maxLength)
1093       {
1094         current.insertCharAt(cLength, maxLength - cLength, gapCharacter);
1095         modified = true;
1096       }
1097       else if (current.getLength() > maxLength)
1098       {
1099         current.deleteChars(maxLength, current.getLength());
1100       }
1101     }
1102     return modified;
1103   }
1104
1105   /**
1106    * Justify the sequences to the left or right by deleting and inserting gaps
1107    * before the initial residue or after the terminal residue
1108    * 
1109    * @param right
1110    *          true if alignment padded to right, false to justify to left
1111    * @return true if alignment was changed
1112    */
1113   @Override
1114   public boolean justify(boolean right)
1115   {
1116     boolean modified = false;
1117
1118     // Remove excess gaps from the end of alignment
1119     int maxLength = -1;
1120     int ends[] = new int[sequences.size() * 2];
1121     SequenceI current;
1122     for (int i = 0; i < sequences.size(); i++)
1123     {
1124       current = getSequenceAt(i);
1125       // This should really be a sequence method
1126       ends[i * 2] = current.findIndex(current.getStart());
1127       ends[i * 2 + 1] = current.findIndex(current.getStart()
1128               + current.getLength());
1129       boolean hitres = false;
1130       for (int j = 0, rs = 0, ssiz = current.getLength(); j < ssiz; j++)
1131       {
1132         if (!jalview.util.Comparison.isGap(current.getCharAt(j)))
1133         {
1134           if (!hitres)
1135           {
1136             ends[i * 2] = j;
1137             hitres = true;
1138           }
1139           else
1140           {
1141             ends[i * 2 + 1] = j;
1142             if (j - ends[i * 2] > maxLength)
1143             {
1144               maxLength = j - ends[i * 2];
1145             }
1146           }
1147         }
1148       }
1149     }
1150
1151     maxLength++;
1152     // now edit the flanking gaps to justify to either left or right
1153     int cLength, extent, diff;
1154     for (int i = 0; i < sequences.size(); i++)
1155     {
1156       current = getSequenceAt(i);
1157
1158       cLength = 1 + ends[i * 2 + 1] - ends[i * 2];
1159       diff = maxLength - cLength; // number of gaps to indent
1160       extent = current.getLength();
1161       if (right)
1162       {
1163         // right justify
1164         if (extent > ends[i * 2 + 1])
1165         {
1166           current.deleteChars(ends[i * 2 + 1] + 1, extent);
1167           modified = true;
1168         }
1169         if (ends[i * 2] > diff)
1170         {
1171           current.deleteChars(0, ends[i * 2] - diff);
1172           modified = true;
1173         }
1174         else
1175         {
1176           if (ends[i * 2] < diff)
1177           {
1178             current.insertCharAt(0, diff - ends[i * 2], gapCharacter);
1179             modified = true;
1180           }
1181         }
1182       }
1183       else
1184       {
1185         // left justify
1186         if (ends[i * 2] > 0)
1187         {
1188           current.deleteChars(0, ends[i * 2]);
1189           modified = true;
1190           ends[i * 2 + 1] -= ends[i * 2];
1191           extent -= ends[i * 2];
1192         }
1193         if (extent > maxLength)
1194         {
1195           current.deleteChars(maxLength + 1, extent);
1196           modified = true;
1197         }
1198         else
1199         {
1200           if (extent < maxLength)
1201           {
1202             current.insertCharAt(extent, maxLength - extent, gapCharacter);
1203             modified = true;
1204           }
1205         }
1206       }
1207     }
1208     return modified;
1209   }
1210
1211   @Override
1212   public HiddenSequences getHiddenSequences()
1213   {
1214     return hiddenSequences;
1215   }
1216
1217   @Override
1218   public CigarArray getCompactAlignment()
1219   {
1220     synchronized (sequences)
1221     {
1222       SeqCigar alseqs[] = new SeqCigar[sequences.size()];
1223       int i = 0;
1224       for (SequenceI seq : sequences)
1225       {
1226         alseqs[i++] = new SeqCigar(seq);
1227       }
1228       CigarArray cal = new CigarArray(alseqs);
1229       cal.addOperation(CigarArray.M, getWidth());
1230       return cal;
1231     }
1232   }
1233
1234   @Override
1235   public void setProperty(Object key, Object value)
1236   {
1237     if (alignmentProperties == null)
1238     {
1239       alignmentProperties = new Hashtable();
1240     }
1241
1242     alignmentProperties.put(key, value);
1243   }
1244
1245   @Override
1246   public Object getProperty(Object key)
1247   {
1248     if (alignmentProperties != null)
1249     {
1250       return alignmentProperties.get(key);
1251     }
1252     else
1253     {
1254       return null;
1255     }
1256   }
1257
1258   @Override
1259   public Hashtable getProperties()
1260   {
1261     return alignmentProperties;
1262   }
1263
1264   /*
1265    * (non-Javadoc)
1266    * 
1267    * @see
1268    * jalview.datamodel.AlignmentI#addCodonFrame(jalview.datamodel.AlignedCodonFrame
1269    * )
1270    */
1271   @Override
1272   public void addCodonFrame(AlignedCodonFrame codons)
1273   {
1274     if (codons != null)
1275     {
1276       codonFrameList.add(codons);
1277     }
1278   }
1279
1280   /*
1281    * (non-Javadoc)
1282    * 
1283    * @see
1284    * jalview.datamodel.AlignmentI#getCodonFrame(jalview.datamodel.SequenceI)
1285    */
1286   @Override
1287   public List<AlignedCodonFrame> getCodonFrame(SequenceI seq)
1288   {
1289     if (seq == null)
1290     {
1291       return null;
1292     }
1293     List<AlignedCodonFrame> cframes = new ArrayList<AlignedCodonFrame>();
1294     for (AlignedCodonFrame acf : codonFrameList)
1295     {
1296       if (acf.involvesSequence(seq))
1297       {
1298         cframes.add(acf);
1299       }
1300     }
1301     return cframes;
1302   }
1303
1304   /**
1305    * Sets the codon frame mappings (replacing any existing mappings).
1306    * 
1307    * @see jalview.datamodel.AlignmentI#setCodonFrames()
1308    */
1309   @Override
1310   public void setCodonFrames(Set<AlignedCodonFrame> acfs)
1311   {
1312     this.codonFrameList = acfs;
1313   }
1314
1315   /**
1316    * Returns the set of codon frame mappings. Any changes to the returned set
1317    * will affect the alignment.
1318    * 
1319    * @see jalview.datamodel.AlignmentI#getCodonFrames()
1320    */
1321   @Override
1322   public Set<AlignedCodonFrame> getCodonFrames()
1323   {
1324     return codonFrameList;
1325   }
1326
1327   /*
1328    * (non-Javadoc)
1329    * 
1330    * @seejalview.datamodel.AlignmentI#removeCodonFrame(jalview.datamodel.
1331    * AlignedCodonFrame)
1332    */
1333   @Override
1334   public boolean removeCodonFrame(AlignedCodonFrame codons)
1335   {
1336     if (codons == null || codonFrameList == null)
1337     {
1338       return false;
1339     }
1340     return codonFrameList.remove(codons);
1341   }
1342
1343   @Override
1344   public void append(AlignmentI toappend)
1345   {
1346     if (toappend == this)
1347     {
1348       System.err.println("Self append may cause a deadlock.");
1349     }
1350     // TODO test this method for a future 2.5 release
1351     // currently tested for use in jalview.gui.SequenceFetcher
1352     boolean samegap = toappend.getGapCharacter() == getGapCharacter();
1353     char oldc = toappend.getGapCharacter();
1354     boolean hashidden = toappend.getHiddenSequences() != null
1355             && toappend.getHiddenSequences().hiddenSequences != null;
1356     // get all sequences including any hidden ones
1357     List<SequenceI> sqs = (hashidden) ? toappend.getHiddenSequences()
1358             .getFullAlignment().getSequences() : toappend.getSequences();
1359     if (sqs != null)
1360     {
1361       synchronized (sqs)
1362       {
1363         for (SequenceI addedsq : sqs)
1364         {
1365           if (!samegap)
1366           {
1367             char[] oldseq = addedsq.getSequence();
1368             for (int c = 0; c < oldseq.length; c++)
1369             {
1370               if (oldseq[c] == oldc)
1371               {
1372                 oldseq[c] = gapCharacter;
1373               }
1374             }
1375           }
1376           addSequence(addedsq);
1377         }
1378       }
1379     }
1380     AlignmentAnnotation[] alan = toappend.getAlignmentAnnotation();
1381     for (int a = 0; alan != null && a < alan.length; a++)
1382     {
1383       addAnnotation(alan[a]);
1384     }
1385
1386     this.codonFrameList.addAll(toappend.getCodonFrames());
1387
1388     List<SequenceGroup> sg = toappend.getGroups();
1389     if (sg != null)
1390     {
1391       for (SequenceGroup _sg : sg)
1392       {
1393         addGroup(_sg);
1394       }
1395     }
1396     if (toappend.getHiddenSequences() != null)
1397     {
1398       HiddenSequences hs = toappend.getHiddenSequences();
1399       if (hiddenSequences == null)
1400       {
1401         hiddenSequences = new HiddenSequences(this);
1402       }
1403       if (hs.hiddenSequences != null)
1404       {
1405         for (int s = 0; s < hs.hiddenSequences.length; s++)
1406         {
1407           // hide the newly appended sequence in the alignment
1408           if (hs.hiddenSequences[s] != null)
1409           {
1410             hiddenSequences.hideSequence(hs.hiddenSequences[s]);
1411           }
1412         }
1413       }
1414     }
1415     if (toappend.getProperties() != null)
1416     {
1417       // we really can't do very much here - just try to concatenate strings
1418       // where property collisions occur.
1419       Enumeration key = toappend.getProperties().keys();
1420       while (key.hasMoreElements())
1421       {
1422         Object k = key.nextElement();
1423         Object ourval = this.getProperty(k);
1424         Object toapprop = toappend.getProperty(k);
1425         if (ourval != null)
1426         {
1427           if (ourval.getClass().equals(toapprop.getClass())
1428                   && !ourval.equals(toapprop))
1429           {
1430             if (ourval instanceof String)
1431             {
1432               // append strings
1433               this.setProperty(k, ((String) ourval) + "; "
1434                       + ((String) toapprop));
1435             }
1436             else
1437             {
1438               if (ourval instanceof Vector)
1439               {
1440                 // append vectors
1441                 Enumeration theirv = ((Vector) toapprop).elements();
1442                 while (theirv.hasMoreElements())
1443                 {
1444                   ((Vector) ourval).addElement(theirv);
1445                 }
1446               }
1447             }
1448           }
1449         }
1450         else
1451         {
1452           // just add new property directly
1453           setProperty(k, toapprop);
1454         }
1455
1456       }
1457     }
1458   }
1459
1460   @Override
1461   public AlignmentAnnotation findOrCreateAnnotation(String name,
1462           String calcId, boolean autoCalc, SequenceI seqRef,
1463           SequenceGroup groupRef)
1464   {
1465     assert (name != null);
1466     if (annotations != null)
1467     {
1468       for (AlignmentAnnotation annot : getAlignmentAnnotation())
1469       {
1470         if (annot.autoCalculated == autoCalc && (name.equals(annot.label))
1471                 && (calcId == null || annot.getCalcId().equals(calcId))
1472                 && annot.sequenceRef == seqRef
1473                 && annot.groupRef == groupRef)
1474         {
1475           return annot;
1476         }
1477       }
1478     }
1479     AlignmentAnnotation annot = new AlignmentAnnotation(name, name,
1480             new Annotation[1], 0f, 0f, AlignmentAnnotation.BAR_GRAPH);
1481     annot.hasText = false;
1482     annot.setCalcId(new String(calcId));
1483     annot.autoCalculated = autoCalc;
1484     if (seqRef != null)
1485     {
1486       annot.setSequenceRef(seqRef);
1487     }
1488     annot.groupRef = groupRef;
1489     addAnnotation(annot);
1490
1491     return annot;
1492   }
1493
1494   @Override
1495   public Iterable<AlignmentAnnotation> findAnnotation(String calcId)
1496   {
1497     ArrayList<AlignmentAnnotation> aa = new ArrayList<AlignmentAnnotation>();
1498     for (AlignmentAnnotation a : getAlignmentAnnotation())
1499     {
1500       if (a.getCalcId() == calcId
1501               || (a.getCalcId() != null && calcId != null && a.getCalcId()
1502                       .equals(calcId)))
1503       {
1504         aa.add(a);
1505       }
1506     }
1507     return aa;
1508   }
1509
1510   /**
1511    * Returns an iterable collection of any annotations that match on given
1512    * sequence ref, calcId and label (ignoring null values).
1513    */
1514   @Override
1515   public Iterable<AlignmentAnnotation> findAnnotations(SequenceI seq,
1516           String calcId, String label)
1517   {
1518     ArrayList<AlignmentAnnotation> aa = new ArrayList<AlignmentAnnotation>();
1519     for (AlignmentAnnotation ann : getAlignmentAnnotation())
1520     {
1521       if (ann.getCalcId() != null && ann.getCalcId().equals(calcId)
1522               && ann.sequenceRef != null && ann.sequenceRef == seq
1523               && ann.label != null && ann.label.equals(label))
1524       {
1525         aa.add(ann);
1526       }
1527     }
1528     return aa;
1529   }
1530
1531   @Override
1532   public void moveSelectedSequencesByOne(SequenceGroup sg,
1533           Map<SequenceI, SequenceCollectionI> map, boolean up)
1534   {
1535     synchronized (sequences)
1536     {
1537       if (up)
1538       {
1539
1540         for (int i = 1, iSize = sequences.size(); i < iSize; i++)
1541         {
1542           SequenceI seq = sequences.get(i);
1543           if (!sg.getSequences(map).contains(seq))
1544           {
1545             continue;
1546           }
1547
1548           SequenceI temp = sequences.get(i - 1);
1549           if (sg.getSequences(null).contains(temp))
1550           {
1551             continue;
1552           }
1553
1554           sequences.set(i, temp);
1555           sequences.set(i - 1, seq);
1556         }
1557       }
1558       else
1559       {
1560         for (int i = sequences.size() - 2; i > -1; i--)
1561         {
1562           SequenceI seq = sequences.get(i);
1563           if (!sg.getSequences(map).contains(seq))
1564           {
1565             continue;
1566           }
1567
1568           SequenceI temp = sequences.get(i + 1);
1569           if (sg.getSequences(map).contains(temp))
1570           {
1571             continue;
1572           }
1573
1574           sequences.set(i, temp);
1575           sequences.set(i + 1, seq);
1576         }
1577       }
1578
1579     }
1580   }
1581
1582   @Override
1583   public void validateAnnotation(AlignmentAnnotation alignmentAnnotation)
1584   {
1585     alignmentAnnotation.validateRangeAndDisplay();
1586     if (isNucleotide() && alignmentAnnotation.isValidStruc())
1587     {
1588       hasRNAStructure = true;
1589     }
1590   }
1591
1592   private SequenceI seqrep = null;
1593
1594   /**
1595    * 
1596    * @return the representative sequence for this group
1597    */
1598   public SequenceI getSeqrep()
1599   {
1600     return seqrep;
1601   }
1602
1603   /**
1604    * set the representative sequence for this group. Note - this affects the
1605    * interpretation of the Hidereps attribute.
1606    * 
1607    * @param seqrep
1608    *          the seqrep to set (null means no sequence representative)
1609    */
1610   public void setSeqrep(SequenceI seqrep)
1611   {
1612     this.seqrep = seqrep;
1613   }
1614
1615   /**
1616    * 
1617    * @return true if group has a sequence representative
1618    */
1619   public boolean hasSeqrep()
1620   {
1621     return seqrep != null;
1622   }
1623
1624   @Override
1625   public int getEndRes()
1626   {
1627     return getWidth() - 1;
1628   }
1629
1630   @Override
1631   public int getStartRes()
1632   {
1633     return 0;
1634   }
1635
1636   /*
1637    * In the case of AlignmentI - returns the dataset for the alignment, if set
1638    * (non-Javadoc)
1639    * 
1640    * @see jalview.datamodel.AnnotatedCollectionI#getContext()
1641    */
1642   @Override
1643   public AnnotatedCollectionI getContext()
1644   {
1645     return dataset;
1646   }
1647
1648   /**
1649    * Align this alignment like the given (mapped) one.
1650    */
1651   @Override
1652   public int alignAs(AlignmentI al)
1653   {
1654     /*
1655      * Currently retains unmapped gaps (in introns), regaps mapped regions
1656      * (exons)
1657      */
1658     return alignAs(al, false, true);
1659   }
1660
1661   /**
1662    * Align this alignment 'the same as' the given one. Mapped sequences only are
1663    * realigned. If both of the same type (nucleotide/protein) then align both
1664    * identically. If this is nucleotide and the other is protein, make 3 gaps
1665    * for each gap in the protein sequences. If this is protein and the other is
1666    * nucleotide, insert a gap for each 3 gaps (or part thereof) between
1667    * nucleotide bases. If this is protein and the other is nucleotide, gaps
1668    * protein to match the relative ordering of codons in the nucleotide.
1669    * 
1670    * Parameters control whether gaps in exon (mapped) and intron (unmapped)
1671    * regions are preserved. Gaps that connect introns to exons are treated
1672    * conservatively, i.e. only preserved if both intron and exon gaps are
1673    * preserved.
1674    * 
1675    * @param al
1676    * @param preserveMappedGaps
1677    *          if true, gaps within and between mapped codons are preserved
1678    * @param preserveUnmappedGaps
1679    *          if true, gaps within and between unmapped codons are preserved
1680    */
1681   // @Override
1682   public int alignAs(AlignmentI al, boolean preserveMappedGaps,
1683           boolean preserveUnmappedGaps)
1684   {
1685     // TODO should this method signature be the one in the interface?
1686     int count = 0;
1687     boolean thisIsNucleotide = this.isNucleotide();
1688     boolean thatIsProtein = !al.isNucleotide();
1689     if (!thatIsProtein && !thisIsNucleotide)
1690     {
1691       return AlignmentUtils.alignProteinAsDna(this, al);
1692     }
1693
1694     char thisGapChar = this.getGapCharacter();
1695     String gap = thisIsNucleotide && thatIsProtein ? String
1696             .valueOf(new char[] { thisGapChar, thisGapChar, thisGapChar })
1697             : String.valueOf(thisGapChar);
1698
1699     // TODO handle intron regions? Needs a 'holistic' alignment of dna,
1700     // not just sequence by sequence. But how to 'gap' intron regions?
1701
1702     /*
1703      * Get mappings from 'that' alignment's sequences to this.
1704      */
1705     for (SequenceI alignTo : getSequences())
1706     {
1707       count += AlignmentUtils.alignSequenceAs(alignTo, al, gap,
1708               preserveMappedGaps, preserveUnmappedGaps) ? 1 : 0;
1709     }
1710     return count;
1711   }
1712
1713   /**
1714    * Returns the alignment in Fasta format. Behaviour of this method is not
1715    * guaranteed between versions.
1716    */
1717   @Override
1718   public String toString()
1719   {
1720     return new FastaFile().print(getSequencesArray());
1721   }
1722
1723   /**
1724    * Returns the set of distinct sequence names. No ordering is guaranteed.
1725    */
1726   @Override
1727   public Set<String> getSequenceNames()
1728   {
1729     Set<String> names = new HashSet<String>();
1730     for (SequenceI seq : getSequences())
1731     {
1732       names.add(seq.getName());
1733     }
1734     return names;
1735   }
1736
1737   @Override
1738   public boolean hasValidSequence()
1739   {
1740     boolean hasValidSeq = false;
1741     for (SequenceI seq : getSequences())
1742     {
1743       if ((seq.getEnd() - seq.getStart()) > 0)
1744       {
1745         hasValidSeq = true;
1746         break;
1747       }
1748     }
1749     return hasValidSeq;
1750   }
1751 }