JAL-4241 add SeqsetUtils.filterSequence function

[jalview.git] / test / jalview / util / ComparisonTest.java
diff --git a/test/jalview/util/ComparisonTest.java b/test/jalview/util/ComparisonTest.java

index 67c81ad..cef9ffc 100644 (file)
--- a/test/jalview/util/ComparisonTest.java
+++ b/test/jalview/util/ComparisonTest.java
@@ -26,12 +26,21 @@ import static org.testng.AssertJUnit.assertTrue;
  
  import jalview.datamodel.Sequence;
  import jalview.datamodel.SequenceI;
  
  import jalview.datamodel.Sequence;
  import jalview.datamodel.SequenceI;
+import jalview.gui.JvOptionPane;
  
  
+import org.testng.annotations.BeforeClass;
  import org.testng.annotations.Test;
  
  public class ComparisonTest
  {
  
  import org.testng.annotations.Test;
  
  public class ComparisonTest
  {
  
+  @BeforeClass(alwaysRun = true)
+  public void setUpJvOptionPane()
+  {
+    JvOptionPane.setInteractiveMode(false);
+    JvOptionPane.setMockResponse(JvOptionPane.CANCEL_OPTION);
+  }
+
    @Test(groups = { "Functional" })
    public void testIsGap()
    {
    @Test(groups = { "Functional" })
    public void testIsGap()
    {
@@ -49,12 +58,13 @@ public class ComparisonTest
     * AGCTU. Test is not case-sensitive and ignores gaps.
     */
    @Test(groups = { "Functional" })
     * AGCTU. Test is not case-sensitive and ignores gaps.
     */
    @Test(groups = { "Functional" })
-  public void testIsNucleotide()
+  public void testIsNucleotide_sequences()
    {
      SequenceI seq = new Sequence("eightypercent", "agctuAGCPV");
      assertFalse(Comparison.isNucleotide(new SequenceI[] { seq }));
    {
      SequenceI seq = new Sequence("eightypercent", "agctuAGCPV");
      assertFalse(Comparison.isNucleotide(new SequenceI[] { seq }));
-    assertFalse(Comparison.isNucleotide(new SequenceI[][] { new SequenceI[]
-    { seq } }));
+    assertFalse(
+            Comparison.isNucleotide(new SequenceI[][]
+            { new SequenceI[] { seq } }));
  
      seq = new Sequence("eightyfivepercent", "agctuAGCPVagctuAGCUV");
      assertFalse(Comparison.isNucleotide(new SequenceI[] { seq }));
  
      seq = new Sequence("eightyfivepercent", "agctuAGCPVagctuAGCUV");
      assertFalse(Comparison.isNucleotide(new SequenceI[] { seq }));
@@ -76,21 +86,27 @@ public class ComparisonTest
      seq = new Sequence("DNA", "ACTugGCCAG");
      SequenceI seq2 = new Sequence("Protein", "FLIMVSPTYW");
      /*
      seq = new Sequence("DNA", "ACTugGCCAG");
      SequenceI seq2 = new Sequence("Protein", "FLIMVSPTYW");
      /*
-     * 90% DNA:
+     * 90% DNA but one protein sequence - expect false
       */
       */
-    assertTrue(Comparison.isNucleotide(new SequenceI[] { seq, seq, seq,
-        seq, seq, seq, seq, seq, seq, seq2 }));
-    assertTrue(Comparison.isNucleotide(new SequenceI[][] {
-        new SequenceI[] { seq }, new SequenceI[] { seq, seq, seq },
-        new SequenceI[] { seq, seq, seq, seq, seq, seq2 } }));
+    assertFalse(
+            Comparison.isNucleotide(new SequenceI[]
+            { seq, seq, seq, seq, seq, seq, seq, seq, seq, seq2 }));
+    assertFalse(
+            Comparison.isNucleotide(new SequenceI[][]
+            { new SequenceI[] { seq }, new SequenceI[] { seq, seq, seq },
+                new SequenceI[]
+                { seq, seq, seq, seq, seq, seq2 } }));
      /*
      /*
-     * 80% DNA:
+     * 80% DNA but one protein sequence - Expect false
       */
       */
-    assertFalse(Comparison.isNucleotide(new SequenceI[] { seq, seq, seq,
-        seq, seq, seq, seq, seq, seq2, seq2 }));
-    assertFalse(Comparison.isNucleotide(new SequenceI[][] { new SequenceI[]
-    { seq }, new SequenceI[] { seq, seq, seq },
-        new SequenceI[] { seq, seq, seq, seq, seq2, seq2, null } }));
+    assertFalse(
+            Comparison.isNucleotide(new SequenceI[]
+            { seq, seq, seq, seq, seq, seq, seq, seq, seq2, seq2 }));
+    assertFalse(
+            Comparison.isNucleotide(new SequenceI[][]
+            { new SequenceI[] { seq }, new SequenceI[] { seq, seq, seq },
+                new SequenceI[]
+                { seq, seq, seq, seq, seq2, seq2, null } }));
  
      seq = new Sequence("ProteinThatLooksLikeDNA", "WYATGCCTGAgtcgt");
      // 12/14 = 85.7%
  
      seq = new Sequence("ProteinThatLooksLikeDNA", "WYATGCCTGAgtcgt");
      // 12/14 = 85.7%
@@ -104,9 +120,9 @@ public class ComparisonTest
     * Test the percentage identity calculation for two sequences
     */
    @Test(groups = { "Functional" })
     * Test the percentage identity calculation for two sequences
     */
    @Test(groups = { "Functional" })
-  public void testPID()
+  public void testPID_includingGaps()
    {
    {
-    String seq1 = "ABCDEF";
+    String seq1 = "ABCDEFG"; // extra length here is ignored
      String seq2 = "abcdef";
      assertEquals("identical", 100f, Comparison.PID(seq1, seq2), 0.001f);
  
      String seq2 = "abcdef";
      assertEquals("identical", 100f, Comparison.PID(seq1, seq2), 0.001f);
  
@@ -120,24 +136,87 @@ public class ComparisonTest
      int length = seq1.length();
  
      // match gap-residue, match gap-gap: 9/10 identical
      int length = seq1.length();
  
      // match gap-residue, match gap-gap: 9/10 identical
+    // TODO should gap-gap be included in a PID score? JAL-791
      assertEquals(90f, Comparison.PID(seq1, seq2, 0, length, true, false),
              0.001f);
      // overloaded version of the method signature above:
      assertEquals(90f, Comparison.PID(seq1, seq2), 0.001f);
  
      // don't match gap-residue, match gap-gap: 7/10 identical
      assertEquals(90f, Comparison.PID(seq1, seq2, 0, length, true, false),
              0.001f);
      // overloaded version of the method signature above:
      assertEquals(90f, Comparison.PID(seq1, seq2), 0.001f);
  
      // don't match gap-residue, match gap-gap: 7/10 identical
-    assertEquals(70f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), false, false),
+    // TODO should gap-gap be included in a PID score?
+    assertEquals(70f, Comparison.PID(seq1, seq2, 0, length, false, false),
              0.001f);
              0.001f);
+  }
  
  
+  @Test(groups = { "Functional" })
+  public void testIsNucleotide()
+  {
+    assertTrue(Comparison.isNucleotide('a'));
+    assertTrue(Comparison.isNucleotide('A'));
+    assertTrue(Comparison.isNucleotide('c'));
+    assertTrue(Comparison.isNucleotide('C'));
+    assertTrue(Comparison.isNucleotide('g'));
+    assertTrue(Comparison.isNucleotide('G'));
+    assertTrue(Comparison.isNucleotide('t'));
+    assertTrue(Comparison.isNucleotide('T'));
+    assertTrue(Comparison.isNucleotide('u'));
+    assertTrue(Comparison.isNucleotide('U'));
+    assertFalse(Comparison.isNucleotide('-'));
+    assertFalse(Comparison.isNucleotide('P'));
+  }
+
+  /**
+   * Test the percentage identity calculation for two sequences
+   */
+  @Test(groups = { "Functional" })
+  public void testPID_ungappedOnly()
+  {
+    // 5 identical, 2 gap-gap, 2 gap-residue, 1 mismatch
+    // the extra length of seq1 is ignored
+    String seq1 = "a--b-cdefhr";
+    String seq2 = "a---bcdefg";
+    int length = seq1.length();
+
+    /*
+     * As currently coded, 'ungappedOnly' ignores gap-residue but counts
+     * gap-gap. Is this a bug - should gap-gap also be ignored, giving a PID of
+     * 5/6?
+     * 
+     * Note also there is no variant of the calculation that penalises
+     * gap-residue i.e. counts it as a mismatch. This would give a score of 5/8
+     * (if we ignore gap-gap) or 5/10 (if we count gap-gap as a match).
+     */
      // match gap-residue, match gap-gap: 7/8 identical
      // match gap-residue, match gap-gap: 7/8 identical
-    assertEquals(87.5f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), true, true),
+    assertEquals(87.5f, Comparison.PID(seq1, seq2, 0, length, true, true),
              0.001f);
  
      // don't match gap-residue with 'ungapped only' - same as above
              0.001f);
  
      // don't match gap-residue with 'ungapped only' - same as above
-    assertEquals(87.5f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), false, true),
+    assertEquals(87.5f, Comparison.PID(seq1, seq2, 0, length, false, true),
              0.001f);
    }
              0.001f);
    }
+
+  @Test(groups = { "Functional" })
+  public void testIsNucleotideSequence()
+  {
+    assertFalse(Comparison.isNucleotideSequence(null, true));
+    assertTrue(Comparison.isNucleotideSequence("", true));
+    assertTrue(Comparison.isNucleotideSequence("aAgGcCtTuU", true));
+    assertTrue(Comparison.isNucleotideSequence("aAgGcCtTuU", false));
+    assertFalse(Comparison.isNucleotideSequence("xAgGcCtTuU", false));
+    assertFalse(Comparison.isNucleotideSequence("aAgGcCtTuUx", false));
+    assertTrue(Comparison.isNucleotideSequence("a A-g.GcCtTuU", true));
+    assertFalse(Comparison.isNucleotideSequence("a A-g.GcCtTuU", false));
+  }
+
+  @Test(groups = { "Functional" })
+  public void testIsSameResidue()
+  {
+    assertTrue(Comparison.isSameResidue('a', 'a', false));
+    assertTrue(Comparison.isSameResidue('a', 'a', true));
+    assertTrue(Comparison.isSameResidue('A', 'a', false));
+    assertTrue(Comparison.isSameResidue('a', 'A', false));
+
+    assertFalse(Comparison.isSameResidue('a', 'A', true));
+    assertFalse(Comparison.isSameResidue('A', 'a', true));
+  }
  }
  }