a98e4b1b579dc4c3e404d28072f5b0d10d45bb1b
[jalview.git] / src / jalview / structures / models / AAStructureBindingModel.java
1 /*
2  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
3  * Copyright (C) $$Year-Rel$$ The Jalview Authors
4  * 
5  * This file is part of Jalview.
6  * 
7  * Jalview is free software: you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License 
9  * as published by the Free Software Foundation, either version 3
10  * of the License, or (at your option) any later version.
11  *  
12  * Jalview is distributed in the hope that it will be useful, but 
13  * WITHOUT ANY WARRANTY; without even the implied warranty 
14  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
15  * PURPOSE.  See the GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
19  * The Jalview Authors are detailed in the 'AUTHORS' file.
20  */
21 package jalview.structures.models;
22
23 import jalview.api.AlignmentViewPanel;
24 import jalview.api.SequenceRenderer;
25 import jalview.api.StructureSelectionManagerProvider;
26 import jalview.api.structures.JalviewStructureDisplayI;
27 import jalview.datamodel.AlignmentI;
28 import jalview.datamodel.HiddenColumns;
29 import jalview.datamodel.PDBEntry;
30 import jalview.datamodel.SequenceI;
31 import jalview.io.DataSourceType;
32 import jalview.schemes.ColourSchemeI;
33 import jalview.structure.AtomSpec;
34 import jalview.structure.StructureListener;
35 import jalview.structure.StructureMapping;
36 import jalview.structure.StructureMappingcommandSet;
37 import jalview.structure.StructureSelectionManager;
38 import jalview.util.Comparison;
39 import jalview.util.MessageManager;
40
41 import java.awt.Color;
42 import java.util.ArrayList;
43 import java.util.Arrays;
44 import java.util.BitSet;
45 import java.util.List;
46
47 /**
48  * 
49  * A base class to hold common function for protein structure model binding.
50  * Initial version created by refactoring JMol and Chimera binding models, but
51  * other structure viewers could in principle be accommodated in future.
52  * 
53  * @author gmcarstairs
54  *
55  */
56 public abstract class AAStructureBindingModel
57         extends SequenceStructureBindingModel
58         implements StructureListener, StructureSelectionManagerProvider
59 {
60
61   private StructureSelectionManager ssm;
62
63   /*
64    * distinct PDB entries (pdb files) associated
65    * with sequences
66    */
67   private PDBEntry[] pdbEntry;
68
69   /*
70    * sequences mapped to each pdbentry
71    */
72   private SequenceI[][] sequence;
73
74   /*
75    * array of target chains for sequences - tied to pdbentry and sequence[]
76    */
77   private String[][] chains;
78
79   /*
80    * datasource protocol for access to PDBEntrylatest
81    */
82   DataSourceType protocol = null;
83
84   protected boolean colourBySequence = true;
85
86   private boolean nucleotide;
87
88   private boolean finishedInit = false;
89
90   /**
91    * current set of model filenames loaded in the Jmol instance
92    */
93   protected String[] modelFileNames = null;
94
95   public String fileLoadingError;
96
97   /**
98    * Data bean class to simplify parameterisation in superposeStructures
99    */
100   protected class SuperposeData
101   {
102     /**
103      * Constructor with alignment width argument
104      * 
105      * @param width
106      */
107     public SuperposeData(int width)
108     {
109       pdbResNo = new int[width];
110     }
111
112     public String filename;
113
114     public String pdbId;
115
116     public String chain = "";
117
118     public boolean isRna;
119
120     /*
121      * The pdb residue number (if any) mapped to each column of the alignment
122      */
123     public int[] pdbResNo;
124   }
125
126   /**
127    * Constructor
128    * 
129    * @param ssm
130    * @param seqs
131    */
132   public AAStructureBindingModel(StructureSelectionManager ssm,
133           SequenceI[][] seqs)
134   {
135     this.ssm = ssm;
136     this.sequence = seqs;
137   }
138
139   /**
140    * Constructor
141    * 
142    * @param ssm
143    * @param pdbentry
144    * @param sequenceIs
145    * @param protocol
146    */
147   public AAStructureBindingModel(StructureSelectionManager ssm,
148           PDBEntry[] pdbentry, SequenceI[][] sequenceIs,
149           DataSourceType protocol)
150   {
151     this.ssm = ssm;
152     this.sequence = sequenceIs;
153     this.nucleotide = Comparison.isNucleotide(sequenceIs);
154     this.pdbEntry = pdbentry;
155     this.protocol = protocol;
156     resolveChains();
157   }
158
159   private boolean resolveChains()
160   {
161     /**
162      * final count of chain mappings discovered
163      */
164     int chainmaps = 0;
165     // JBPNote: JAL-2693 - this should be a list of chain mappings per
166     // [pdbentry][sequence]
167     String[][] newchains = new String[pdbEntry.length][];
168     int pe = 0;
169     for (PDBEntry pdb : pdbEntry)
170     {
171       SequenceI[] seqsForPdb = sequence[pe];
172       if (seqsForPdb != null)
173       {
174         newchains[pe] = new String[seqsForPdb.length];
175         int se = 0;
176         for (SequenceI asq : seqsForPdb)
177         {
178           String chain = (chains != null && chains[pe] != null)
179                   ? chains[pe][se]
180                   : null;
181           SequenceI sq = (asq.getDatasetSequence() == null) ? asq
182                   : asq.getDatasetSequence();
183           if (sq.getAllPDBEntries() != null)
184           {
185             for (PDBEntry pdbentry : sq.getAllPDBEntries())
186             {
187               if (pdb.getFile() != null && pdbentry.getFile() != null
188                       && pdb.getFile().equals(pdbentry.getFile()))
189               {
190                 String chaincode = pdbentry.getChainCode();
191                 if (chaincode != null && chaincode.length() > 0)
192                 {
193                   chain = chaincode;
194                   chainmaps++;
195                   break;
196                 }
197               }
198             }
199           }
200           newchains[pe][se] = chain;
201           se++;
202         }
203         pe++;
204       }
205     }
206
207     chains = newchains;
208     return chainmaps > 0;
209   }
210   public StructureSelectionManager getSsm()
211   {
212     return ssm;
213   }
214
215   /**
216    * Returns the i'th PDBEntry (or null)
217    * 
218    * @param i
219    * @return
220    */
221   public PDBEntry getPdbEntry(int i)
222   {
223     return (pdbEntry != null && pdbEntry.length > i) ? pdbEntry[i] : null;
224   }
225
226   /**
227    * Answers true if this binding includes the given PDB id, else false
228    * 
229    * @param pdbId
230    * @return
231    */
232   public boolean hasPdbId(String pdbId)
233   {
234     if (pdbEntry != null)
235     {
236       for (PDBEntry pdb : pdbEntry)
237       {
238         if (pdb.getId().equals(pdbId))
239         {
240           return true;
241         }
242       }
243     }
244     return false;
245   }
246
247   /**
248    * Returns the number of modelled PDB file entries.
249    * 
250    * @return
251    */
252   public int getPdbCount()
253   {
254     return pdbEntry == null ? 0 : pdbEntry.length;
255   }
256
257   public SequenceI[][] getSequence()
258   {
259     return sequence;
260   }
261
262   public String[][] getChains()
263   {
264     return chains;
265   }
266
267   public DataSourceType getProtocol()
268   {
269     return protocol;
270   }
271
272   // TODO may remove this if calling methods can be pulled up here
273   protected void setPdbentry(PDBEntry[] pdbentry)
274   {
275     this.pdbEntry = pdbentry;
276   }
277
278   protected void setSequence(SequenceI[][] sequence)
279   {
280     this.sequence = sequence;
281   }
282
283   protected void setChains(String[][] chains)
284   {
285     this.chains = chains;
286   }
287
288   /**
289    * Construct a title string for the viewer window based on the data Jalview
290    * knows about
291    * 
292    * @param viewerName
293    *          TODO
294    * @param verbose
295    * 
296    * @return
297    */
298   public String getViewerTitle(String viewerName, boolean verbose)
299   {
300     if (getSequence() == null || getSequence().length < 1
301             || getPdbCount() < 1 || getSequence()[0].length < 1)
302     {
303       return ("Jalview " + viewerName + " Window");
304     }
305     // TODO: give a more informative title when multiple structures are
306     // displayed.
307     StringBuilder title = new StringBuilder(64);
308     final PDBEntry pdbe = getPdbEntry(0);
309     title.append(viewerName + " view for " + getSequence()[0][0].getName()
310             + ":" + pdbe.getId());
311
312     if (verbose)
313     {
314       String method = (String) pdbe.getProperty("method");
315       if (method != null)
316       {
317         title.append(" Method: ").append(method);
318       }
319       String chain = (String) pdbe.getProperty("chains");
320       if (chain != null)
321       {
322         title.append(" Chain:").append(chain);
323       }
324     }
325     return title.toString();
326   }
327
328   /**
329    * Called by after closeViewer is called, to release any resources and
330    * references so they can be garbage collected. Override if needed.
331    */
332   protected void releaseUIResources()
333   {
334
335   }
336
337   public boolean isColourBySequence()
338   {
339     return colourBySequence;
340   }
341
342   public void setColourBySequence(boolean colourBySequence)
343   {
344     this.colourBySequence = colourBySequence;
345   }
346
347   protected void addSequenceAndChain(int pe, SequenceI[] seq,
348           String[] tchain)
349   {
350     if (pe < 0 || pe >= getPdbCount())
351     {
352       throw new Error(MessageManager.formatMessage(
353               "error.implementation_error_no_pdbentry_from_index",
354               new Object[]
355               { Integer.valueOf(pe).toString() }));
356     }
357     final String nullChain = "TheNullChain";
358     List<SequenceI> s = new ArrayList<>();
359     List<String> c = new ArrayList<>();
360     if (getChains() == null)
361     {
362       setChains(new String[getPdbCount()][]);
363     }
364     if (getSequence()[pe] != null)
365     {
366       for (int i = 0; i < getSequence()[pe].length; i++)
367       {
368         s.add(getSequence()[pe][i]);
369         if (getChains()[pe] != null)
370         {
371           if (i < getChains()[pe].length)
372           {
373             c.add(getChains()[pe][i]);
374           }
375           else
376           {
377             c.add(nullChain);
378           }
379         }
380         else
381         {
382           if (tchain != null && tchain.length > 0)
383           {
384             c.add(nullChain);
385           }
386         }
387       }
388     }
389     for (int i = 0; i < seq.length; i++)
390     {
391       if (!s.contains(seq[i]))
392       {
393         s.add(seq[i]);
394         if (tchain != null && i < tchain.length)
395         {
396           c.add(tchain[i] == null ? nullChain : tchain[i]);
397         }
398       }
399     }
400     SequenceI[] tmp = s.toArray(new SequenceI[s.size()]);
401     getSequence()[pe] = tmp;
402     if (c.size() > 0)
403     {
404       String[] tch = c.toArray(new String[c.size()]);
405       for (int i = 0; i < tch.length; i++)
406       {
407         if (tch[i] == nullChain)
408         {
409           tch[i] = null;
410         }
411       }
412       getChains()[pe] = tch;
413     }
414     else
415     {
416       getChains()[pe] = null;
417     }
418   }
419
420   /**
421    * add structures and any known sequence associations
422    * 
423    * @returns the pdb entries added to the current set.
424    */
425   public synchronized PDBEntry[] addSequenceAndChain(PDBEntry[] pdbe,
426           SequenceI[][] seq, String[][] chns)
427   {
428     List<PDBEntry> v = new ArrayList<>();
429     List<int[]> rtn = new ArrayList<>();
430     for (int i = 0; i < getPdbCount(); i++)
431     {
432       v.add(getPdbEntry(i));
433     }
434     for (int i = 0; i < pdbe.length; i++)
435     {
436       int r = v.indexOf(pdbe[i]);
437       if (r == -1 || r >= getPdbCount())
438       {
439         rtn.add(new int[] { v.size(), i });
440         v.add(pdbe[i]);
441       }
442       else
443       {
444         // just make sure the sequence/chain entries are all up to date
445         addSequenceAndChain(r, seq[i], chns[i]);
446       }
447     }
448     pdbe = v.toArray(new PDBEntry[v.size()]);
449     setPdbentry(pdbe);
450     if (rtn.size() > 0)
451     {
452       // expand the tied sequence[] and string[] arrays
453       SequenceI[][] sqs = new SequenceI[getPdbCount()][];
454       String[][] sch = new String[getPdbCount()][];
455       System.arraycopy(getSequence(), 0, sqs, 0, getSequence().length);
456       System.arraycopy(getChains(), 0, sch, 0, this.getChains().length);
457       setSequence(sqs);
458       setChains(sch);
459       pdbe = new PDBEntry[rtn.size()];
460       for (int r = 0; r < pdbe.length; r++)
461       {
462         int[] stri = (rtn.get(r));
463         // record the pdb file as a new addition
464         pdbe[r] = getPdbEntry(stri[0]);
465         // and add the new sequence/chain entries
466         addSequenceAndChain(stri[0], seq[stri[1]], chns[stri[1]]);
467       }
468     }
469     else
470     {
471       pdbe = null;
472     }
473     return pdbe;
474   }
475
476   /**
477    * Add sequences to the pe'th pdbentry's sequence set.
478    * 
479    * @param pe
480    * @param seq
481    */
482   public void addSequence(int pe, SequenceI[] seq)
483   {
484     addSequenceAndChain(pe, seq, null);
485   }
486
487   /**
488    * add the given sequences to the mapping scope for the given pdb file handle
489    * 
490    * @param pdbFile
491    *          - pdbFile identifier
492    * @param seq
493    *          - set of sequences it can be mapped to
494    */
495   public void addSequenceForStructFile(String pdbFile, SequenceI[] seq)
496   {
497     for (int pe = 0; pe < getPdbCount(); pe++)
498     {
499       if (getPdbEntry(pe).getFile().equals(pdbFile))
500       {
501         addSequence(pe, seq);
502       }
503     }
504   }
505
506   @Override
507   public abstract void highlightAtoms(List<AtomSpec> atoms);
508
509   protected boolean isNucleotide()
510   {
511     return this.nucleotide;
512   }
513
514   /**
515    * 
516    * @return a readable description of all mappings for the wrapped pdbfile to
517    *         any mapped sequences
518    * 
519    */
520   public String printMappings()
521   {
522     if (pdbEntry == null)
523     {
524       return "";
525     }
526     StringBuilder sb = new StringBuilder(128);
527     for (int pdbe = 0; pdbe < getPdbCount(); pdbe++)
528     {
529       String pdbfile = getPdbEntry(pdbe).getFile();
530       List<SequenceI> seqs = Arrays.asList(getSequence()[pdbe]);
531       sb.append(getSsm().printMappings(pdbfile, seqs));
532     }
533     return sb.toString();
534   }
535
536   /**
537    * Returns the mapped structure position for a given aligned column of a given
538    * sequence, or -1 if the column is gapped, beyond the end of the sequence, or
539    * not mapped to structure.
540    * 
541    * @param seq
542    * @param alignedPos
543    * @param mapping
544    * @return
545    */
546   protected int getMappedPosition(SequenceI seq, int alignedPos,
547           StructureMapping mapping)
548   {
549     if (alignedPos >= seq.getLength())
550     {
551       return -1;
552     }
553
554     if (Comparison.isGap(seq.getCharAt(alignedPos)))
555     {
556       return -1;
557     }
558     int seqPos = seq.findPosition(alignedPos);
559     int pos = mapping.getPDBResNum(seqPos);
560     return pos;
561   }
562
563   /**
564    * Helper method to identify residues that can participate in a structure
565    * superposition command. For each structure, identify a sequence in the
566    * alignment which is mapped to the structure. Identify non-gapped columns in
567    * the sequence which have a mapping to a residue in the structure. Returns
568    * the index of the first structure that has a mapping to the alignment.
569    * 
570    * @param alignment
571    *          the sequence alignment which is the basis of structure
572    *          superposition
573    * @param matched
574    *          a BitSet, where bit j is set to indicate that every structure has
575    *          a mapped residue present in column j (so the column can
576    *          participate in structure alignment)
577    * @param structures
578    *          an array of data beans corresponding to pdb file index
579    * @return
580    */
581   protected int findSuperposableResidues(AlignmentI alignment,
582           BitSet matched, SuperposeData[] structures)
583   {
584     int refStructure = -1;
585     String[] files = getStructureFiles();
586     if (files == null)
587     {
588       return -1;
589     }
590     for (int pdbfnum = 0; pdbfnum < files.length; pdbfnum++)
591     {
592       StructureMapping[] mappings = getSsm().getMapping(files[pdbfnum]);
593       int lastPos = -1;
594
595       /*
596        * Find the first mapped sequence (if any) for this PDB entry which is in
597        * the alignment
598        */
599       final int seqCountForPdbFile = getSequence()[pdbfnum].length;
600       for (int s = 0; s < seqCountForPdbFile; s++)
601       {
602         for (StructureMapping mapping : mappings)
603         {
604           final SequenceI theSequence = getSequence()[pdbfnum][s];
605           if (mapping.getSequence() == theSequence
606                   && alignment.findIndex(theSequence) > -1)
607           {
608             if (refStructure < 0)
609             {
610               refStructure = pdbfnum;
611             }
612             for (int r = 0; r < alignment.getWidth(); r++)
613             {
614               if (!matched.get(r))
615               {
616                 continue;
617               }
618               int pos = getMappedPosition(theSequence, r, mapping);
619               if (pos < 1 || pos == lastPos)
620               {
621                 matched.clear(r);
622                 continue;
623               }
624               lastPos = pos;
625               structures[pdbfnum].pdbResNo[r] = pos;
626             }
627             String chain = mapping.getChain();
628             if (chain != null && chain.trim().length() > 0)
629             {
630               structures[pdbfnum].chain = chain;
631             }
632             structures[pdbfnum].pdbId = mapping.getPdbId();
633             structures[pdbfnum].isRna = theSequence.getRNA() != null;
634
635             /*
636              * move on to next pdb file (ignore sequences for other chains
637              * for the same structure)
638              */
639             s = seqCountForPdbFile;
640             break;
641           }
642         }
643       }
644     }
645     return refStructure;
646   }
647
648   /**
649    * Returns true if the structure viewer has loaded all of the files of
650    * interest (identified by the file mapping having been set up), or false if
651    * any are still not loaded after a timeout interval.
652    * 
653    * @param files
654    */
655   protected boolean waitForFileLoad(String[] files)
656   {
657     /*
658      * give up after 10 secs plus 1 sec per file
659      */
660     long starttime = System.currentTimeMillis();
661     long endTime = 10000 + 1000 * files.length + starttime;
662     String notLoaded = null;
663
664     boolean waiting = true;
665     while (waiting && System.currentTimeMillis() < endTime)
666     {
667       waiting = false;
668       for (String file : files)
669       {
670         notLoaded = file;
671         if (file == null)
672         {
673           continue;
674         }
675         try
676         {
677           StructureMapping[] sm = getSsm().getMapping(file);
678           if (sm == null || sm.length == 0)
679           {
680             waiting = true;
681           }
682         } catch (Throwable x)
683         {
684           waiting = true;
685         }
686       }
687     }
688
689     if (waiting)
690     {
691       System.err.println(
692               "Timed out waiting for structure viewer to load file "
693                       + notLoaded);
694       return false;
695     }
696     return true;
697   }
698
699   @Override
700   public boolean isListeningFor(SequenceI seq)
701   {
702     if (sequence != null)
703     {
704       for (SequenceI[] seqs : sequence)
705       {
706         if (seqs != null)
707         {
708           for (SequenceI s : seqs)
709           {
710             if (s == seq || (s.getDatasetSequence() != null
711                     && s.getDatasetSequence() == seq.getDatasetSequence()))
712             {
713               return true;
714             }
715           }
716         }
717       }
718     }
719     return false;
720   }
721
722   public boolean isFinishedInit()
723   {
724     return finishedInit;
725   }
726
727   public void setFinishedInit(boolean fi)
728   {
729     this.finishedInit = fi;
730   }
731
732   /**
733    * Returns a list of chains mapped in this viewer.
734    * 
735    * @return
736    */
737   public abstract List<String> getChainNames();
738
739   /**
740    * Returns the Jalview panel hosting the structure viewer (if any)
741    * 
742    * @return
743    */
744   public JalviewStructureDisplayI getViewer()
745   {
746     return null;
747   }
748
749   public abstract void setJalviewColourScheme(ColourSchemeI cs);
750
751   /**
752    * Constructs and sends a command to align structures against a reference
753    * structure, based on one or more sequence alignments. May optionally return
754    * an error or warning message for the alignment command.
755    * 
756    * @param alignments
757    *          an array of alignments to process
758    * @param structureIndices
759    *          an array of corresponding reference structures (index into pdb
760    *          file array); if a negative value is passed, the first PDB file
761    *          mapped to an alignment sequence is used as the reference for
762    *          superposition
763    * @param hiddenCols
764    *          an array of corresponding hidden columns for each alignment
765    * @return
766    */
767   public abstract String superposeStructures(AlignmentI[] alignments,
768           int[] structureIndices, HiddenColumns[] hiddenCols);
769
770   public abstract void setBackgroundColour(Color col);
771
772   protected abstract StructureMappingcommandSet[] getColourBySequenceCommands(
773           String[] files, SequenceRenderer sr, AlignmentViewPanel avp);
774
775   /**
776    * returns the current sequenceRenderer that should be used to colour the
777    * structures
778    * 
779    * @param alignment
780    * 
781    * @return
782    */
783   public abstract SequenceRenderer getSequenceRenderer(
784           AlignmentViewPanel alignment);
785
786   protected abstract void colourBySequence(
787           StructureMappingcommandSet[] colourBySequenceCommands);
788
789   public abstract void colourByChain();
790
791   public abstract void colourByCharge();
792
793   /**
794    * colour any structures associated with sequences in the given alignment
795    * using the getFeatureRenderer() and getSequenceRenderer() renderers but only
796    * if colourBySequence is enabled.
797    */
798   public void colourBySequence(AlignmentViewPanel alignmentv)
799   {
800     if (!colourBySequence || !isLoadingFinished())
801     {
802       return;
803     }
804     if (getSsm() == null)
805     {
806       return;
807     }
808     String[] files = getStructureFiles();
809
810     SequenceRenderer sr = getSequenceRenderer(alignmentv);
811
812     StructureMappingcommandSet[] colourBySequenceCommands = getColourBySequenceCommands(
813             files, sr, alignmentv);
814     colourBySequence(colourBySequenceCommands);
815   }
816
817   public boolean hasFileLoadingError()
818   {
819     return fileLoadingError != null && fileLoadingError.length() > 0;
820   }
821
822   public abstract jalview.api.FeatureRenderer getFeatureRenderer(
823           AlignmentViewPanel alignment);
824 }