JAL-1946 unit tests (and comments) for PID() function
authorgmungoc <g.m.carstairs@dundee.ac.uk>
Fri, 6 Nov 2015 09:17:13 +0000 (09:17 +0000)
committergmungoc <g.m.carstairs@dundee.ac.uk>
Fri, 6 Nov 2015 09:17:13 +0000 (09:17 +0000)
test/jalview/util/ComparisonTest.java

index 67c81ad..0c2c998 100644 (file)
@@ -104,7 +104,7 @@ public class ComparisonTest
    * Test the percentage identity calculation for two sequences
    */
   @Test(groups = { "Functional" })
-  public void testPID()
+  public void testPID_includingGaps()
   {
     String seq1 = "ABCDEF";
     String seq2 = "abcdef";
@@ -126,18 +126,36 @@ public class ComparisonTest
     assertEquals(90f, Comparison.PID(seq1, seq2), 0.001f);
 
     // don't match gap-residue, match gap-gap: 7/10 identical
-    assertEquals(70f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), false, false),
+    assertEquals(70f, Comparison.PID(seq1, seq2, 0, length, false, false),
             0.001f);
+  }
 
+  /**
+   * Test the percentage identity calculation for two sequences
+   */
+  @Test(groups = { "Functional" })
+  public void testPID_ungappedOnly()
+  {
+    // 5 identical, 2 gap-gap, 2 gap-residue, 1 mismatch
+    String seq1 = "a--b-cdefh";
+    String seq2 = "a---bcdefg";
+    int length = seq1.length();
+
+    /*
+     * As currently coded, 'ungappedOnly' ignores gap-residue but counts
+     * gap-gap. Is this a bug - should gap-gap also be ignored, giving a PID of
+     * 5/6?
+     * 
+     * Note also there is no variant of the calculation that penalises
+     * gap-residue i.e. counts it as a mismatch. This would give a score of 5/8
+     * (if we ignore gap-gap) or 5/10 (if we count gap-gap as a match).
+     */
     // match gap-residue, match gap-gap: 7/8 identical
-    assertEquals(87.5f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), true, true),
+    assertEquals(87.5f, Comparison.PID(seq1, seq2, 0, length, true, true),
             0.001f);
 
     // don't match gap-residue with 'ungapped only' - same as above
-    assertEquals(87.5f,
-            Comparison.PID(seq1, seq2, 0, seq1.length(), false, true),
+    assertEquals(87.5f, Comparison.PID(seq1, seq2, 0, length, false, true),
             0.001f);
   }
 }