JAL-2416 amended to (as near as possible) strict NCBI format
[jalview.git] / resources / scoreModel / dna.scm
1 ScoreMatrix DNA
2 #
3 # A DNA substitution matrix.
4 # This is an ad-hoc matrix which, in addition to penalising mutations between the common 
5 # nucleotides (ACGT), includes T/U equivalence in order to allow both DNA and/or RNA. 
6 # In addition, it encodes weak equivalence between R and Y with AG and CTU, respectively, 
7 # and N is allowed to match any other base weakly. 
8 # This matrix also includes I (Inosine) and X (Xanthine), but encodes them to weakly match
9 # any of (ACGTU), and unfavourably match each other.
10 #
11 # The first line declares a ScoreMatrix with the name DNA (shown in menus)
12 # Scores are not case sensitive, unless column(s) are provided for lower case characters
13 #
14 # Values may be integer or floating point, delimited by tab, space, comma or combinations
15 #
16         A       C       G       T       U       I       X       R       Y       N       -
17 A       10      -8      -8      -8      -8      1       1       1       -8      1       1 
18 C       -8      10      -8      -8      -8      1       1       -8      1       1       1
19 G       -8      -8      10      -8      -8      1       1       1       -8      1       1
20 T       -8      -8      -8      10      10      1       1       -8      1       1       1
21 U       -8      -8      -8      10      10      1       1       -8      1       1       1
22 I       1       1       1       1       1       10      0       0       0       1       1
23 X       1       1       1       1       1       0       10      0       0       1       1
24 R       1       -8      1       -8      -8      0       0       10      -8      1       1
25 Y       -8      1       -8      1       1       0       0       -8      10      1       1
26 N       1       1       1       1       1       1       1       1       1       10      1
27 -       1       1       1       1       1       1       1       1       1       1       1
28 #
29 #       A       C       G       T       U       I       X       R       Y       N               -