X-Git-Url: http://source.jalview.org/gitweb/?a=blobdiff_plain;f=src%2Fjalview%2Fanalysis%2FCrossRef.java;h=629850511fefc57400d34c9e07753c938e442c3e;hb=797df64fa2a0a30773d0f48f5494d4155e5a8be3;hp=d063eed215e2b50333e33df6bdd29dc36c9795f8;hpb=a32b2c8d6f9d68da9fdcd07e2557c62c90fed630;p=jalview.git

diff --git a/src/jalview/analysis/CrossRef.java b/src/jalview/analysis/CrossRef.java
index d063eed..6298505 100644
--- a/src/jalview/analysis/CrossRef.java
+++ b/src/jalview/analysis/CrossRef.java
@@ -1,3 +1,20 @@
+/*
+ * Jalview - A Sequence Alignment Editor and Viewer (Version 2.7)
+ * Copyright (C) 2011 J Procter, AM Waterhouse, J Engelhardt, LM Lui, G Barton, M Clamp, S Searle
+ * 
+ * This file is part of Jalview.
+ * 
+ * Jalview is free software: you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License 
+ * as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version.
+ * 
+ * Jalview is distributed in the hope that it will be useful, but 
+ * WITHOUT ANY WARRANTY; without even the implied warranty 
+ * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
+ * PURPOSE.  See the GNU General Public License for more details.
+ * 
+ * You should have received a copy of the GNU General Public License along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
+ */
 package jalview.analysis;
 
 import java.util.Enumeration;
@@ -49,19 +66,19 @@ public class CrossRef
   public static Hashtable classifyDbRefs(DBRefEntry[] rfs)
   {
     Hashtable classes = new Hashtable();
-    classes.put(DBRefSource.PROTEINDBS, jalview.util.DBRefUtils.selectRefs(
-            rfs, DBRefSource.PROTEINDBS));
+    classes.put(DBRefSource.PROTEINDBS,
+            jalview.util.DBRefUtils.selectRefs(rfs, DBRefSource.PROTEINDBS));
     classes.put(DBRefSource.DNACODINGDBS, jalview.util.DBRefUtils
             .selectRefs(rfs, DBRefSource.DNACODINGDBS));
-    classes.put(DBRefSource.DOMAINDBS, jalview.util.DBRefUtils.selectRefs(
-            rfs, DBRefSource.DOMAINDBS));
+    classes.put(DBRefSource.DOMAINDBS,
+            jalview.util.DBRefUtils.selectRefs(rfs, DBRefSource.DOMAINDBS));
     // classes.put(OTHER, )
     return classes;
   }
 
   /**
    * @param dna
-   *                true if seqs are DNA seqs
+   *          true if seqs are DNA seqs
    * @param seqs
    * @return a list of sequence database cross reference source types
    */
@@ -75,7 +92,7 @@ public class CrossRef
    * any of the direct DBRefEntrys on the given sequences.
    * 
    * @param dna
-   *                true if seqs are DNA seqs
+   *          true if seqs are DNA seqs
    * @param seqs
    * @return a list of sequence database cross reference source types
    */
@@ -86,36 +103,41 @@ public class CrossRef
     Vector refs = new Vector();
     for (int s = 0; s < seqs.length; s++)
     {
-      SequenceI dss = seqs[s];
-      while (dss.getDatasetSequence() != null)
+      if (seqs[s] != null)
       {
-        dss = dss.getDatasetSequence();
-      }
-      DBRefEntry[] rfs = findXDbRefs(dna, dss.getDBRef());
-      for (int r = 0; rfs != null && r < rfs.length; r++)
-      {
-        if (!refs.contains(rfs[r].getSource()))
+
+        SequenceI dss = seqs[s];
+        while (dss.getDatasetSequence() != null)
         {
-          refs.addElement(rfs[r].getSource());
+          dss = dss.getDatasetSequence();
         }
-      }
-      if (dataset != null)
-      {
-        // search for references to this sequence's direct references.
-        DBRefEntry[] lrfs = CrossRef.findXDbRefs(!dna, seqs[s].getDBRef());
-        Vector rseqs = new Vector();
-        CrossRef.searchDatasetXrefs(seqs[s], !dna, lrfs, dataset, rseqs,
-                null); // don't need to specify codon frame for mapping here
-        Enumeration lr = rseqs.elements();
-        while (lr.hasMoreElements())
+        DBRefEntry[] rfs = findXDbRefs(dna, dss.getDBRef());
+        for (int r = 0; rfs != null && r < rfs.length; r++)
         {
-          SequenceI rs = (SequenceI) lr.nextElement();
-          DBRefEntry[] xrs = findXDbRefs(dna, rs.getDBRef());
-          for (int r = 0; rfs != null && r < rfs.length; r++)
+          if (!refs.contains(rfs[r].getSource()))
           {
-            if (!refs.contains(rfs[r].getSource()))
+            refs.addElement(rfs[r].getSource());
+          }
+        }
+        if (dataset != null)
+        {
+          // search for references to this sequence's direct references.
+          DBRefEntry[] lrfs = CrossRef
+                  .findXDbRefs(!dna, seqs[s].getDBRef());
+          Vector rseqs = new Vector();
+          CrossRef.searchDatasetXrefs(seqs[s], !dna, lrfs, dataset, rseqs,
+                  null); // don't need to specify codon frame for mapping here
+          Enumeration lr = rseqs.elements();
+          while (lr.hasMoreElements())
+          {
+            SequenceI rs = (SequenceI) lr.nextElement();
+            DBRefEntry[] xrs = findXDbRefs(dna, rs.getDBRef());
+            for (int r = 0; rfs != null && r < rfs.length; r++)
             {
-              refs.addElement(rfs[r].getSource());
+              if (!refs.contains(rfs[r].getSource()))
+              {
+                refs.addElement(rfs[r].getSource());
+              }
             }
           }
         }
@@ -158,7 +180,8 @@ public class CrossRef
       {
         if (cdna[c].getSource().equals(DBRefSource.EMBLCDS))
         {
-          System.err.println("TODO: unimplemented sequence retrieval for coding region sequence.");
+          System.err
+                  .println("TODO: unimplemented sequence retrieval for coding region sequence.");
           // TODO: retrieve CDS dataset sequences
           // need global dataset sequence retriever/resolver to reuse refs
           // and construct Mapping entry.
@@ -195,7 +218,7 @@ public class CrossRef
    * @param dna
    * @param source
    * @param dataset
-   *                alignment to search for product sequences.
+   *          alignment to search for product sequences.
    * @return products (as dataset sequences)
    */
   public static Alignment findXrefSequences(SequenceI[] seqs, boolean dna,
@@ -262,7 +285,7 @@ public class CrossRef
           // xrefs on this sequence.
           if (dataset != null)
           {
-            found |= searchDataset(dss, xrfs[r], dataset, rseqs, cf);
+            found |= searchDataset(dss, xrfs[r], dataset, rseqs, cf); // ,false,!dna);
             if (found)
               xrfs[r] = null; // we've recovered seqs for this one.
           }
@@ -306,7 +329,10 @@ public class CrossRef
             xrfs = t;
             try
             {
-              retrieved = sftch.getSequences(xrfs); // problem here is we don't know which of xrfs resulted in which retrieved element
+              retrieved = sftch.getSequences(xrfs); // problem here is we don't
+              // know which of xrfs
+              // resulted in which
+              // retrieved element
             } catch (Exception e)
             {
               System.err
@@ -319,32 +345,39 @@ public class CrossRef
               for (int rs = 0; rs < retrieved.length; rs++)
               {
                 // TODO: examine each sequence for 'redundancy'
-                jalview.datamodel.DBRefEntry[] dbr = retrieved[rs].getDBRef();
+                jalview.datamodel.DBRefEntry[] dbr = retrieved[rs]
+                        .getDBRef();
                 if (dbr != null && dbr.length > 0)
                 {
                   for (int di = 0; di < dbr.length; di++)
                   {
-                    // find any entry where we should put in the sequence being cross-referenced into the map
+                    // find any entry where we should put in the sequence being
+                    // cross-referenced into the map
                     jalview.datamodel.Mapping map = dbr[di].getMap();
                     if (map != null)
                     {
                       if (map.getTo() != null && map.getMap() != null)
                       {
-                        // should search the local dataset to find any existing candidates for To !
+                        // should search the local dataset to find any existing
+                        // candidates for To !
                         try
                         {
-                          // compare ms with dss and replace with dss in mapping if map is congruent
+                          // compare ms with dss and replace with dss in mapping
+                          // if map is congruent
                           SequenceI ms = map.getTo();
                           int sf = map.getMap().getToLowest();
                           int st = map.getMap().getToHighest();
                           SequenceI mappedrg = ms.getSubSequence(sf, st);
                           SequenceI loc = dss.getSubSequence(sf, st);
-                          if (mappedrg.getLength()>0 && mappedrg.getSequenceAsString().equals(
-                                  loc.getSequenceAsString()))
+                          if (mappedrg.getLength() > 0
+                                  && mappedrg.getSequenceAsString().equals(
+                                          loc.getSequenceAsString()))
                           {
                             System.err
                                     .println("Mapping updated for retrieved crossreference");
-                            // method to update all refs of existing To on retrieved sequence with dss and merge any props on To onto dss.
+                            // method to update all refs of existing To on
+                            // retrieved sequence with dss and merge any props
+                            // on To onto dss.
                             map.setTo(dss);
                           }
                         } catch (Exception e)
@@ -415,7 +448,7 @@ public class CrossRef
    * @param xrf
    * @param dataset
    * @param rseqs
-   *                set of unique sequences
+   *          set of unique sequences
    * @param cf
    * @return true if one or more unique sequences were found and added
    */
@@ -434,10 +467,10 @@ public class CrossRef
    * @param xrf
    * @param dataset
    * @param rseqs
-   * @param direct -
-   *                search all references or only subset
+   * @param direct
+   *          - search all references or only subset
    * @param dna
-   *                search dna or protein xrefs (if direct=false)
+   *          search dna or protein xrefs (if direct=false)
    * @return true if relationship found and sequence added.
    */
   public static boolean searchDataset(SequenceI sequenceI, DBRefEntry xrf,
@@ -445,6 +478,7 @@ public class CrossRef
           boolean direct, boolean dna)
   {
     boolean found = false;
+    SequenceI[] typer = new SequenceI[1];
     if (dataset == null)
       return false;
     if (dataset.getSequences() == null)
@@ -465,17 +499,27 @@ public class CrossRef
         }
         if (nxt != sequenceI && nxt != sequenceI.getDatasetSequence())
         {
+          // check if this is the correct sequence type
+          {
+            typer[0] = nxt;
+            boolean isDna = jalview.util.Comparison.isNucleotide(typer);
+            if ((direct && isDna == dna) || (!direct && isDna != dna))
+            {
+              // skip this sequence because it is same molecule type
+              continue;
+            }
+          }
+
           // look for direct or indirect references in common
-          DBRefEntry[] poss = null, cands = null;
+          DBRefEntry[] poss = nxt.getDBRef(), cands = null;
           if (direct)
           {
-            cands = jalview.util.DBRefUtils.searchRefs(poss = nxt
-                    .getDBRef(), xrf);
+            cands = jalview.util.DBRefUtils.searchRefs(poss, xrf);
           }
           else
           {
-            cands = jalview.util.DBRefUtils.searchRefs(poss = CrossRef
-                    .findXDbRefs(dna, nxt.getDBRef()), xrf);
+            poss = CrossRef.findXDbRefs(dna, poss); //
+            cands = jalview.util.DBRefUtils.searchRefs(poss, xrf);
           }
           if (cands != null)
           {
@@ -526,8 +570,8 @@ public class CrossRef
    * @param dna
    * @param seqs
    * @param dataset
-   * @param fake -
-   *                don't actually build lists - just get types
+   * @param fake
+   *          - don't actually build lists - just get types
    * @return public static Object[] buildXProductsList(boolean dna, SequenceI[]
    *         seqs, AlignmentI dataset, boolean fake) { String types[] =
    *         jalview.analysis.CrossRef.findSequenceXrefTypes( dna, seqs,
@@ -536,18 +580,19 @@ public class CrossRef
    *         System.out.println("Type: " + types[t]); SequenceI[] prod =
    *         jalview.analysis.CrossRef.findXrefSequences(seqs, dna, types[t]);
    *         System.out.println("Found " + ((prod == null) ? "no" : "" +
-   *         prod.length) + " products"); if (prod!=null) { for (int p=0; p<prod.length;
-   *         p++) { System.out.println("Prod "+p+":
-   *         "+prod[p].getDisplayId(true)); } } }
-   *  } else { System.out.println("Trying getProducts for
-   * "+al.getSequenceAt(0).getDisplayId(true)); System.out.println("Search DS
-   * Xref for: "+(dna ? "dna" : "prot")); // have a bash at finding the products
-   * amongst all the retrieved sequences. SequenceI[] prod =
-   * jalview.analysis.CrossRef.findXrefSequences(al .getSequencesArray(), dna,
-   * null, ds); System.out.println("Found " + ((prod == null) ? "no" : "" +
-   * prod.length) + " products"); if (prod!=null) { // select non-equivalent
-   * sequences from dataset list for (int p=0; p<prod.length; p++) {
-   * System.out.println("Prod "+p+": "+prod[p].getDisplayId(true)); } }
-   *  } }
+   *         prod.length) + " products"); if (prod!=null) { for (int p=0;
+   *         p<prod.length; p++) { System.out.println("Prod "+p+":
+   *         "+prod[p].getDisplayId(true)); } } } } else {
+   *         System.out.println("Trying getProducts for
+   *         "+al.getSequenceAt(0).getDisplayId(true));
+   *         System.out.println("Search DS Xref for: "+(dna ? "dna" : "prot"));
+   *         // have a bash at finding the products amongst all the retrieved
+   *         sequences. SequenceI[] prod =
+   *         jalview.analysis.CrossRef.findXrefSequences(al
+   *         .getSequencesArray(), dna, null, ds); System.out.println("Found " +
+   *         ((prod == null) ? "no" : "" + prod.length) + " products"); if
+   *         (prod!=null) { // select non-equivalent sequences from dataset list
+   *         for (int p=0; p<prod.length; p++) { System.out.println("Prod "+p+":
+   *         "+prod[p].getDisplayId(true)); } } } }
    */
-}
\ No newline at end of file
+}