JPRED-2 copy the portable branch into Git

author Sasha Sherstnev <a.sherstnev@dundee.ac.uk>

Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)

committer Sasha Sherstnev <a.sherstnev@dundee.ac.uk>

Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)
author Sasha Sherstnev <a.sherstnev@dundee.ac.uk>
Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)
committer Sasha Sherstnev <a.sherstnev@dundee.ac.uk>
Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)
diff --git a/jpred/data/blast/BLOSUM45 b/jpred/data/blast/BLOSUM45

new file mode 100755 (executable)

index 0000000..40bd750
--- /dev/null
+++ b/jpred/data/blast/BLOSUM45
@@ -0,0 +1,31 @@
+#  Matrix made by matblas from blosum45.iij
+#  * column uses minimum score
+#  BLOSUM Clustered Scoring Matrix in 1/3 Bit Units
+#  Blocks Database = /data/blocks_5.0/blocks.dat
+#  Cluster Percentage: >= 45
+#  Entropy =   0.3795, Expected =  -0.2789
+   A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V  B  Z  X  *
+A  5 -2 -1 -2 -1 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  1  0 -2 -2  0 -1 -1 -1 -5 
+R -2  7  0 -1 -3  1  0 -2  0 -3 -2  3 -1 -2 -2 -1 -1 -2 -1 -2 -1  0 -1 -5 
+N -1  0  6  2 -2  0  0  0  1 -2 -3  0 -2 -2 -2  1  0 -4 -2 -3  4  0 -1 -5 
+D -2 -1  2  7 -3  0  2 -1  0 -4 -3  0 -3 -4 -1  0 -1 -4 -2 -3  5  1 -1 -5 
+C -1 -3 -2 -3 12 -3 -3 -3 -3 -3 -2 -3 -2 -2 -4 -1 -1 -5 -3 -1 -2 -3 -1 -5 
+Q -1  1  0  0 -3  6  2 -2  1 -2 -2  1  0 -4 -1  0 -1 -2 -1 -3  0  4 -1 -5 
+E -1  0  0  2 -3  2  6 -2  0 -3 -2  1 -2 -3  0  0 -1 -3 -2 -3  1  4 -1 -5 
+G  0 -2  0 -1 -3 -2 -2  7 -2 -4 -3 -2 -2 -3 -2  0 -2 -2 -3 -3 -1 -2 -1 -5 
+H -2  0  1  0 -3  1  0 -2 10 -3 -2 -1  0 -2 -2 -1 -2 -3  2 -3  0  0 -1 -5 
+I -1 -3 -2 -4 -3 -2 -3 -4 -3  5  2 -3  2  0 -2 -2 -1 -2  0  3 -3 -3 -1 -5 
+L -1 -2 -3 -3 -2 -2 -2 -3 -2  2  5 -3  2  1 -3 -3 -1 -2  0  1 -3 -2 -1 -5 
+K -1  3  0  0 -3  1  1 -2 -1 -3 -3  5 -1 -3 -1 -1 -1 -2 -1 -2  0  1 -1 -5 
+M -1 -1 -2 -3 -2  0 -2 -2  0  2  2 -1  6  0 -2 -2 -1 -2  0  1 -2 -1 -1 -5 
+F -2 -2 -2 -4 -2 -4 -3 -3 -2  0  1 -3  0  8 -3 -2 -1  1  3  0 -3 -3 -1 -5 
+P -1 -2 -2 -1 -4 -1  0 -2 -2 -2 -3 -1 -2 -3  9 -1 -1 -3 -3 -3 -2 -1 -1 -5 
+S  1 -1  1  0 -1  0  0  0 -1 -2 -3 -1 -2 -2 -1  4  2 -4 -2 -1  0  0 -1 -5 
+T  0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -1 -1  2  5 -3 -1  0  0 -1 -1 -5 
+W -2 -2 -4 -4 -5 -2 -3 -2 -3 -2 -2 -2 -2  1 -3 -4 -3 15  3 -3 -4 -2 -1 -5 
+Y -2 -1 -2 -2 -3 -1 -2 -3  2  0  0 -1  0  3 -3 -2 -1  3  8 -1 -2 -2 -1 -5 
+V  0 -2 -3 -3 -1 -3 -3 -3 -3  3  1 -2  1  0 -3 -1  0 -3 -1  5 -3 -3 -1 -5 
+B -1 -1  4  5 -2  0  1 -1  0 -3 -3  0 -2 -3 -2  0  0 -4 -2 -3  4  2 -1 -5 
+Z -1  0  0  1 -3  4  4 -2  0 -3 -2  1 -1 -3 -1  0 -1 -2 -2 -3  2  4 -1 -5 
+X -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -5 
+* -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5 -5  1 
diff --git a/jpred/data/blast/BLOSUM62 b/jpred/data/blast/BLOSUM62

new file mode 100755 (executable)

index 0000000..fcd15e8
--- /dev/null
+++ b/jpred/data/blast/BLOSUM62
@@ -0,0 +1,31 @@
+#  Matrix made by matblas from blosum62.iij
+#  * column uses minimum score
+#  BLOSUM Clustered Scoring Matrix in 1/2 Bit Units
+#  Blocks Database = /data/blocks_5.0/blocks.dat
+#  Cluster Percentage: >= 62
+#  Entropy =   0.6979, Expected =  -0.5209
+   A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V  B  Z  X  *
+A  4 -1 -2 -2  0 -1 -1  0 -2 -1 -1 -1 -1 -2 -1  1  0 -3 -2  0 -2 -1 -1 -4 
+R -1  5  0 -2 -3  1  0 -2  0 -3 -2  2 -1 -3 -2 -1 -1 -3 -2 -3 -1  0 -1 -4 
+N -2  0  6  1 -3  0  0  0  1 -3 -3  0 -2 -3 -2  1  0 -4 -2 -3  3  0 -1 -4 
+D -2 -2  1  6 -3  0  2 -1 -1 -3 -4 -1 -3 -3 -1  0 -1 -4 -3 -3  4  1 -1 -4 
+C  0 -3 -3 -3  9 -3 -4 -3 -3 -1 -1 -3 -1 -2 -3 -1 -1 -2 -2 -1 -3 -3 -1 -4 
+Q -1  1  0  0 -3  5  2 -2  0 -3 -2  1  0 -3 -1  0 -1 -2 -1 -2  0  3 -1 -4 
+E -1  0  0  2 -4  2  5 -2  0 -3 -3  1 -2 -3 -1  0 -1 -3 -2 -2  1  4 -1 -4 
+G  0 -2  0 -1 -3 -2 -2  6 -2 -4 -4 -2 -3 -3 -2  0 -2 -2 -3 -3 -1 -2 -1 -4 
+H -2  0  1 -1 -3  0  0 -2  8 -3 -3 -1 -2 -1 -2 -1 -2 -2  2 -3  0  0 -1 -4 
+I -1 -3 -3 -3 -1 -3 -3 -4 -3  4  2 -3  1  0 -3 -2 -1 -3 -1  3 -3 -3 -1 -4 
+L -1 -2 -3 -4 -1 -2 -3 -4 -3  2  4 -2  2  0 -3 -2 -1 -2 -1  1 -4 -3 -1 -4 
+K -1  2  0 -1 -3  1  1 -2 -1 -3 -2  5 -1 -3 -1  0 -1 -3 -2 -2  0  1 -1 -4 
+M -1 -1 -2 -3 -1  0 -2 -3 -2  1  2 -1  5  0 -2 -1 -1 -1 -1  1 -3 -1 -1 -4 
+F -2 -3 -3 -3 -2 -3 -3 -3 -1  0  0 -3  0  6 -4 -2 -2  1  3 -1 -3 -3 -1 -4 
+P -1 -2 -2 -1 -3 -1 -1 -2 -2 -3 -3 -1 -2 -4  7 -1 -1 -4 -3 -2 -2 -1 -1 -4 
+S  1 -1  1  0 -1  0  0  0 -1 -2 -2  0 -1 -2 -1  4  1 -3 -2 -2  0  0 -1 -4 
+T  0 -1  0 -1 -1 -1 -1 -2 -2 -1 -1 -1 -1 -2 -1  1  5 -2 -2  0 -1 -1 -1 -4 
+W -3 -3 -4 -4 -2 -2 -3 -2 -2 -3 -2 -3 -1  1 -4 -3 -2 11  2 -3 -4 -3 -1 -4 
+Y -2 -2 -2 -3 -2 -1 -2 -3  2 -1 -1 -2 -1  3 -3 -2 -2  2  7 -1 -3 -2 -1 -4 
+V  0 -3 -3 -3 -1 -2 -2 -3 -3  3  1 -2  1 -1 -2 -2  0 -3 -1  4 -3 -2 -1 -4 
+B -2 -1  3  4 -3  0  1 -1  0 -3 -4  0 -3 -3 -2  0 -1 -4 -3 -3  4  1 -1 -4 
+Z -1  0  0  1 -3  3  4 -2  0 -3 -3  1 -1 -3 -1  0 -1 -3 -2 -2  1  4 -1 -4 
+X -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -4 
+* -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4 -4  1 
diff --git a/jpred/data/blast/BLOSUM80 b/jpred/data/blast/BLOSUM80

new file mode 100755 (executable)

index 0000000..186f20f
--- /dev/null
+++ b/jpred/data/blast/BLOSUM80
@@ -0,0 +1,31 @@
+#  Matrix made by matblas from blosum80.iij
+#  * column uses minimum score
+#  BLOSUM Clustered Scoring Matrix in 1/2 Bit Units
+#  Blocks Database = /data/blocks_5.0/blocks.dat
+#  Cluster Percentage: >= 80
+#  Entropy =   0.9868, Expected =  -0.7442
+   A  R  N  D  C  Q  E  G  H  I  L  K  M  F  P  S  T  W  Y  V  B  Z  X  *  
+A  5 -2 -2 -2 -1 -1 -1  0 -2 -2 -2 -1 -1 -3 -1  1  0 -3 -2  0 -2 -1 -1 -6 
+R -2  6 -1 -2 -4  1 -1 -3  0 -3 -3  2 -2 -4 -2 -1 -1 -4 -3 -3 -2  0 -1 -6 
+N -2 -1  6  1 -3  0 -1 -1  0 -4 -4  0 -3 -4 -3  0  0 -4 -3 -4  4  0 -1 -6 
+D -2 -2  1  6 -4 -1  1 -2 -2 -4 -5 -1 -4 -4 -2 -1 -1 -6 -4 -4  4  1 -1 -6 
+C -1 -4 -3 -4  9 -4 -5 -4 -4 -2 -2 -4 -2 -3 -4 -2 -1 -3 -3 -1 -4 -4 -1 -6 
+Q -1  1  0 -1 -4  6  2 -2  1 -3 -3  1  0 -4 -2  0 -1 -3 -2 -3  0  3 -1 -6 
+E -1 -1 -1  1 -5  2  6 -3  0 -4 -4  1 -2 -4 -2  0 -1 -4 -3 -3  1  4 -1 -6 
+G  0 -3 -1 -2 -4 -2 -3  6 -3 -5 -4 -2 -4 -4 -3 -1 -2 -4 -4 -4 -1 -3 -1 -6 
+H -2  0  0 -2 -4  1  0 -3  8 -4 -3 -1 -2 -2 -3 -1 -2 -3  2 -4 -1  0 -1 -6 
+I -2 -3 -4 -4 -2 -3 -4 -5 -4  5  1 -3  1 -1 -4 -3 -1 -3 -2  3 -4 -4 -1 -6 
+L -2 -3 -4 -5 -2 -3 -4 -4 -3  1  4 -3  2  0 -3 -3 -2 -2 -2  1 -4 -3 -1 -6 
+K -1  2  0 -1 -4  1  1 -2 -1 -3 -3  5 -2 -4 -1 -1 -1 -4 -3 -3 -1  1 -1 -6 
+M -1 -2 -3 -4 -2  0 -2 -4 -2  1  2 -2  6  0 -3 -2 -1 -2 -2  1 -3 -2 -1 -6 
+F -3 -4 -4 -4 -3 -4 -4 -4 -2 -1  0 -4  0  6 -4 -3 -2  0  3 -1 -4 -4 -1 -6 
+P -1 -2 -3 -2 -4 -2 -2 -3 -3 -4 -3 -1 -3 -4  8 -1 -2 -5 -4 -3 -2 -2 -1 -6 
+S  1 -1  0 -1 -2  0  0 -1 -1 -3 -3 -1 -2 -3 -1  5  1 -4 -2 -2  0  0 -1 -6 
+T  0 -1  0 -1 -1 -1 -1 -2 -2 -1 -2 -1 -1 -2 -2  1  5 -4 -2  0 -1 -1 -1 -6 
+W -3 -4 -4 -6 -3 -3 -4 -4 -3 -3 -2 -4 -2  0 -5 -4 -4 11  2 -3 -5 -4 -1 -6 
+Y -2 -3 -3 -4 -3 -2 -3 -4  2 -2 -2 -3 -2  3 -4 -2 -2  2  7 -2 -3 -3 -1 -6 
+V  0 -3 -4 -4 -1 -3 -3 -4 -4  3  1 -3  1 -1 -3 -2  0 -3 -2  4 -4 -3 -1 -6 
+B -2 -2  4  4 -4  0  1 -1 -1 -4 -4 -1 -3 -4 -2  0 -1 -5 -3 -4  4  0 -1 -6 
+Z -1  0  0  1 -4  3  4 -3  0 -4 -3  1 -2 -4 -2  0 -1 -4 -3 -3  0  4 -1 -6 
+X -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -6 
+* -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6 -6  1 
diff --git a/jpred/data/blast/KSat.flt b/jpred/data/blast/KSat.flt

new file mode 100755 (executable)

index 0000000..35cd220
--- /dev/null
+++ b/jpred/data/blast/KSat.flt
@@ -0,0 +1,30 @@
+; comments must have a semicolon in the first column or else
+; unpredictable behavior after reading the file will result
+; the first value is the type of filter; the second is info; then data
+1                   1 = filter      2 = matrix
+250                 if 1, window    if 2, cutoff
+100                 { symbol "A", name "Adenine" },
+33                  { symbol "B" , name "G or T or C" },
+0                   { symbol "C", name "Cytosine" },
+67                  { symbol "D", name "G or A or T" },
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+0                   { symbol "G", name "Guanine" },
+67                  { symbol "H", name "A or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+50                  { symbol "K", name "G or T" },
+;                   { symbol "", name ""},
+50                  { symbol "M", name "A or C" },
+50                  { symbol "N", name "A or G or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+;                   { symbol "", name ""},
+50                  { symbol "R", name "G or A"},
+0                   { symbol "S", name "G or C"},
+100                 { symbol "T", name "Thymine"},
+;                   { symbol "", name ""},
+33                  { symbol "V", name "G or C or A"},
+0                   { symbol "W", name "A or T" },
+;                   { symbol "", name ""},
+50                  { symbol "Y", name "T or C"}
diff --git a/jpred/data/blast/KSchoth.flt b/jpred/data/blast/KSchoth.flt

new file mode 100755 (executable)

index 0000000..e5e1a02
--- /dev/null
+++ b/jpred/data/blast/KSchoth.flt
@@ -0,0 +1,29 @@
+;Chothia aa      ; 16 character descriptor
+;2               ; 1=Nucleic  2=Protein
+1                ; 1=Filter   2-64=No. Pos. in Matrix
+8                ; 3-256=Filter Window  0-100=Percent Cutoff Matrix Output
+  -0.27   A  Ala
+   0.55   BB Asx
+  -0.23   C  Cys   Note: Columns 1-8 must contain 1 numeric value only
+   0.50   D  Asp
+   0.33   E  Glu
+  -0.55   F  Phe
+  -0.22   G  Gly
+   0.37   H  His
+  -0.80   I  Ile
+   1.17   K  Lys
+  -0.44   L  Leu
+  -0.31   M  Met
+   0.61   N  Asn
+   0.36   P  Pro
+   1.00   Q  Gln
+   2.00   R  Arg
+   0.17   S  Ser
+   0.18   T  Thr
+  -0.65   V  Val
+   0.05   W  Trp
+   0.19   X- Unk
+   0.48   Y  Tyr
+   0.66   ZZ Glx
+   0.19   ** ***
+;Chothia -- dunno -- picked out of a FORTRAN file from Spouge
diff --git a/jpred/data/blast/KSgc.flt b/jpred/data/blast/KSgc.flt

new file mode 100755 (executable)

index 0000000..1eb9a6b
--- /dev/null
+++ b/jpred/data/blast/KSgc.flt
@@ -0,0 +1,30 @@
+; comments must have a semicolon in the first column or else
+; unpredictable behavior after reading the file will result
+; the first value is the type of filter; the second is info; then data
+1                   1 = filter      2 = matrix
+250                 if 1, window    if 2, cutoff
+0                   { symbol "A", name "Adenine" },
+67                  { symbol "B" , name "G or T or C" },
+100                 { symbol "C", name "Cytosine" },
+33                  { symbol "D", name "G or A or T" },
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+100                 { symbol "G", name "Guanine" },
+33                  { symbol "H", name "A or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+50                  { symbol "K", name "G or T" },
+;                   { symbol "", name ""},
+50                  { symbol "M", name "A or C" },
+50                  { symbol "N", name "A or G or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+;                   { symbol "", name ""},
+50                  { symbol "R", name "G or A"},
+100                 { symbol "S", name "G or C"},
+0                   { symbol "T", name "Thymine"},
+;                   { symbol "", name ""},
+67                  { symbol "V", name "G or C or A"},
+0                   { symbol "W", name "A or T" },
+;                   { symbol "", name ""},
+50                  { symbol "Y", name "T or C"}
diff --git a/jpred/data/blast/KShopp.flt b/jpred/data/blast/KShopp.flt

new file mode 100755 (executable)

index 0000000..d9f57f2
--- /dev/null
+++ b/jpred/data/blast/KShopp.flt
@@ -0,0 +1,31 @@
+;Antigenicity    ; 16 character descriptor
+;2               ; 1=Nucleic  2=Protein
+1                ; 1=Filter   2-64=No. Pos. in Matrix
+6                ; 3-256=Filter Window  0-100=Percent Cutoff Matrix Output
+  -0.500   A  Ala
+   1.600   BB Asx
+  -1.000   C  Cys   Note: Columns 1-8 must contain 1 numeric value only
+   3.000   D  Asp
+   3.000   E  Glu
+  -2.500   F  Phe
+   0.000   G  Gly
+  -0.500   H  His
+  -1.800   I  Ile
+   3.000   K  Lys
+  -1.800   L  Leu
+  -1.300   M  Met
+   0.200   N  Asn
+   0.000   P  Pro
+   0.200   Q  Gln
+   3.000   R  Arg
+   0.300   S  Ser
+  -0.400   T  Thr
+  -1.500   V  Val
+  -3.400   W  Trp
+  -0.200   X- Unk
+  -2.300   Y  Tyr
+   1.600   ZZ Glx
+  -0.200   ** ***
+;Antigenicity - Hopp and Woods (Hydrophilicity Index)
+;A window of 6 residues is the published (and recomended)
+;value for calculating the moving average
diff --git a/jpred/data/blast/KSkyte.flt b/jpred/data/blast/KSkyte.flt

new file mode 100755 (executable)

index 0000000..5580df6
--- /dev/null
+++ b/jpred/data/blast/KSkyte.flt
@@ -0,0 +1,31 @@
+;Hydropathy      ; 16 character descriptor
+;2               ; 1=Nucleic  2=Protein
+1                ; 1=Filter   2-64=No. Pos. in Matrix
+19               ; 3-256=Filter Window  0-100=Percent Cutoff Matrix Output
+   1.800   A  Ala
+  -3.500   BB Asx
+   2.500   C  Cys   Note: Columns 1-8 must contain 1 numeric value only
+  -3.500   D  Asp
+  -3.500   E  Glu   Note: This file is required for amphpathic helic
+   2.800   F  Phe
+  -0.400   G  Gly
+  -3.200   H  His
+   4.500   I  Ile
+  -3.900   K  Lys
+   3.800   L  Leu
+   1.900   M  Met
+  -3.500   N  Asn
+  -1.600   P  Pro
+  -3.500   Q  Gln
+  -4.500   R  Arg
+  -0.800   S  Ser
+  -0.700   T  Thr
+   4.200   V  Val
+  -0.900   W  Trp
+  -0.490   X- Unk
+  -1.300   Y  Tyr
+  -3.500   ZZ Glx
+  -0.490   ** ***
+;Hydropathy - Kyte and Doolittle (Hydrophobicity Index)
+;A window of 19 residues is the published (and recomended) value
+;for calculating the moving average to find membrane spanning regions
diff --git a/jpred/data/blast/KSpcc.mat b/jpred/data/blast/KSpcc.mat

new file mode 100755 (executable)

index 0000000..7c2a29d
--- /dev/null
+++ b/jpred/data/blast/KSpcc.mat
@@ -0,0 +1,25 @@
+; original matrix
+A 1.297  1.551  1.084  2.612  0.377  1.248  0.877 ; A
+B 0.000  0.000  0.000  0.000  0.000  0.000  0.000 ; BDN
+C 0.824  0.022  0.308  0.152  0.180  0.156  0.044 ; C
+D 0.030  2.352  2.268  0.237  0.663  1.620  1.448 ; D
+E 0.262  3.496  3.108  0.998  5.685  2.494  3.048 ; E
+F 0.531  0.076  0.403  0.662  0.189  0.106  0.013 ; F
+G 0.045  0.275  0.578  0.216  0.211  0.426  0.156 ; G
+H 0.347  0.275  0.679  0.395  0.294  0.579  0.213 ; H
+I 2.597  0.098  0.345  0.894  0.514  0.471  0.431 ; I
+K 1.375  2.639  1.763  0.191  1.815  1.961  2.795 ; K
+L 3.167  0.297  0.398  3.902  0.585  0.501  0.483 ; L
+M 2.240  0.370  0.480  1.409  0.541  0.772  0.663 ; M
+N 0.835  1.475  1.534  0.039  1.722  2.456  2.280 ; N
+P 0.000  0.008  0.000  0.013  0.000  0.000  0.000 ; P
+Q 0.179  2.114  1.778  0.631  2.550  1.578  2.526 ; Q
+R 0.659  1.163  1.210  0.031  1.358  1.937  1.798 ; R
+S 0.382  0.583  1.052  0.419  0.525  0.916  0.628 ; S
+T 0.169  0.702  0.955  0.654  0.791  0.843  0.647 ; T
+V 1.665  0.403  0.386  0.949  0.211  0.342  0.360 ; V
+W 0.240  0.000  0.000  0.456  0.019  0.000  0.000 ; W
+X 0.000  0.000  0.000  0.000  0.000  0.000  0.000 ; X-
+Y 1.417  0.090  0.122  1.659  0.190  0.130  0.155 ; Y
+Z 0.000  0.000  0.000  0.000  0.000  0.000  0.000 ; ZEQ
+* 0.000  0.000  0.000  0.000  0.000  0.000  0.000 ; **
diff --git a/jpred/data/blast/KSpur.flt b/jpred/data/blast/KSpur.flt

new file mode 100755 (executable)

index 0000000..937d9df
--- /dev/null
+++ b/jpred/data/blast/KSpur.flt
@@ -0,0 +1,30 @@
+; comments must have a semicolon in the first column or else
+; unpredictable behavior after reading the file will result
+; the first value is the type of filter; the second is info; then data
+1                   1 = filter      2 = matrix
+250                 if 1, window    if 2, cutoff
+100                 { symbol "A", name "Adenine" },
+33                  { symbol "B" , name "G or T or C" },
+0                   { symbol "C", name "Cytosine" },
+67                  { symbol "D", name "G or A or T" },
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+100                 { symbol "G", name "Guanine" },
+33                  { symbol "H", name "A or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+50                  { symbol "K", name "G or T" },
+;                   { symbol "", name ""},
+50                  { symbol "M", name "A or C" },
+50                  { symbol "N", name "A or G or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+;                   { symbol "", name ""},
+100                 { symbol "R", name "G or A"},
+50                  { symbol "S", name "G or C"},
+0                   { symbol "T", name "Thymine"},
+;                   { symbol "", name ""},
+67                  { symbol "V", name "G or C or A"},
+50                  { symbol "W", name "A or T" },
+;                   { symbol "", name ""},
+0                   { symbol "Y", name "T or C"}
diff --git a/jpred/data/blast/KSpyr.flt b/jpred/data/blast/KSpyr.flt

new file mode 100755 (executable)

index 0000000..b147a6c
--- /dev/null
+++ b/jpred/data/blast/KSpyr.flt
@@ -0,0 +1,30 @@
+; comments must have a semicolon in the first column or else
+; unpredictable behavior after reading the file will result
+; the first value is the type of filter; the second is info; then data
+1                   1 = filter      2 = matrix
+250                 if 1, window    if 2, cutoff
+0                   { symbol "A", name "Adenine" },
+67                  { symbol "B" , name "G or T or C" },
+100                 { symbol "C", name "Cytosine" },
+33                  { symbol "D", name "G or A or T" },
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+0                   { symbol "G", name "Guanine" },
+67                  { symbol "H", name "A or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+50                  { symbol "K", name "G or T" },
+;                   { symbol "", name ""},
+50                  { symbol "M", name "A or C" },
+50                  { symbol "N", name "A or G or C or T" } ,
+;                   { symbol "", name "" },
+;                   { symbol "", name "" },
+;                   { symbol "", name ""},
+0                   { symbol "R", name "G or A"},
+50                  { symbol "S", name "G or C"},
+100                 { symbol "T", name "Thymine"},
+;                   { symbol "", name ""},
+33                  { symbol "V", name "G or C or A"},
+0                   { symbol "W", name "A or T" },
+;                   { symbol "", name ""},
+100                 { symbol "Y", name "T or C"}
diff --git a/jpred/data/blast/PAM30 b/jpred/data/blast/PAM30

new file mode 100755 (executable)

index 0000000..8a01c88
--- /dev/null
+++ b/jpred/data/blast/PAM30
@@ -0,0 +1,34 @@
+#
+# This matrix was produced by "pam" Version 1.0.6 [28-Jul-93]
+#
+# PAM 30 substitution matrix, scale = ln(2)/2 = 0.346574
+#
+# Expected score = -5.06, Entropy = 2.57 bits
+#
+# Lowest score = -17, Highest score = 13
+#
+    A   R   N   D   C   Q   E   G   H   I   L   K   M   F   P   S   T   W   Y   V   B   Z   X   *
+A   6  -7  -4  -3  -6  -4  -2  -2  -7  -5  -6  -7  -5  -8  -2   0  -1 -13  -8  -2  -3  -3  -3 -17
+R  -7   8  -6 -10  -8  -2  -9  -9  -2  -5  -8   0  -4  -9  -4  -3  -6  -2 -10  -8  -7  -4  -6 -17
+N  -4  -6   8   2 -11  -3  -2  -3   0  -5  -7  -1  -9  -9  -6   0  -2  -8  -4  -8   6  -3  -3 -17
+D  -3 -10   2   8 -14  -2   2  -3  -4  -7 -12  -4 -11 -15  -8  -4  -5 -15 -11  -8   6   1  -5 -17
+C  -6  -8 -11 -14  10 -14 -14  -9  -7  -6 -15 -14 -13 -13  -8  -3  -8 -15  -4  -6 -12 -14  -9 -17
+Q  -4  -2  -3  -2 -14   8   1  -7   1  -8  -5  -3  -4 -13  -3  -5  -5 -13 -12  -7  -3   6  -5 -17
+E  -2  -9  -2   2 -14   1   8  -4  -5  -5  -9  -4  -7 -14  -5  -4  -6 -17  -8  -6   1   6  -5 -17
+G  -2  -9  -3  -3  -9  -7  -4   6  -9 -11 -10  -7  -8  -9  -6  -2  -6 -15 -14  -5  -3  -5  -5 -17
+H  -7  -2   0  -4  -7   1  -5  -9   9  -9  -6  -6 -10  -6  -4  -6  -7  -7  -3  -6  -1  -1  -5 -17
+I  -5  -5  -5  -7  -6  -8  -5 -11  -9   8  -1  -6  -1  -2  -8  -7  -2 -14  -6   2  -6  -6  -5 -17
+L  -6  -8  -7 -12 -15  -5  -9 -10  -6  -1   7  -8   1  -3  -7  -8  -7  -6  -7  -2  -9  -7  -6 -17
+K  -7   0  -1  -4 -14  -3  -4  -7  -6  -6  -8   7  -2 -14  -6  -4  -3 -12  -9  -9  -2  -4  -5 -17
+M  -5  -4  -9 -11 -13  -4  -7  -8 -10  -1   1  -2  11  -4  -8  -5  -4 -13 -11  -1 -10  -5  -5 -17
+F  -8  -9  -9 -15 -13 -13 -14  -9  -6  -2  -3 -14  -4   9 -10  -6  -9  -4   2  -8 -10 -13  -8 -17
+P  -2  -4  -6  -8  -8  -3  -5  -6  -4  -8  -7  -6  -8 -10   8  -2  -4 -14 -13  -6  -7  -4  -5 -17
+S   0  -3   0  -4  -3  -5  -4  -2  -6  -7  -8  -4  -5  -6  -2   6   0  -5  -7  -6  -1  -5  -3 -17
+T  -1  -6  -2  -5  -8  -5  -6  -6  -7  -2  -7  -3  -4  -9  -4   0   7 -13  -6  -3  -3  -6  -4 -17
+W -13  -2  -8 -15 -15 -13 -17 -15  -7 -14  -6 -12 -13  -4 -14  -5 -13  13  -5 -15 -10 -14 -11 -17
+Y  -8 -10  -4 -11  -4 -12  -8 -14  -3  -6  -7  -9 -11   2 -13  -7  -6  -5  10  -7  -6  -9  -7 -17
+V  -2  -8  -8  -8  -6  -7  -6  -5  -6   2  -2  -9  -1  -8  -6  -6  -3 -15  -7   7  -8  -6  -5 -17
+B  -3  -7   6   6 -12  -3   1  -3  -1  -6  -9  -2 -10 -10  -7  -1  -3 -10  -6  -8   6   0  -5 -17
+Z  -3  -4  -3   1 -14   6   6  -5  -1  -6  -7  -4  -5 -13  -4  -5  -6 -14  -9  -6   0   6  -5 -17
+X  -3  -6  -3  -5  -9  -5  -5  -5  -5  -5  -6  -5  -5  -8  -5  -3  -4 -11  -7  -5  -5  -5  -5 -17
+* -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17 -17   1
diff --git a/jpred/data/blast/PAM70 b/jpred/data/blast/PAM70

new file mode 100755 (executable)

index 0000000..b20cdf0
--- /dev/null
+++ b/jpred/data/blast/PAM70
@@ -0,0 +1,34 @@
+#
+# This matrix was produced by "pam" Version 1.0.6 [28-Jul-93]
+#
+# PAM 70 substitution matrix, scale = ln(2)/2 = 0.346574
+#
+# Expected score = -2.77, Entropy = 1.60 bits
+#
+# Lowest score = -11, Highest score = 13
+#
+    A   R   N   D   C   Q   E   G   H   I   L   K   M   F   P   S   T   W   Y   V   B   Z   X   *
+A   5  -4  -2  -1  -4  -2  -1   0  -4  -2  -4  -4  -3  -6   0   1   1  -9  -5  -1  -1  -1  -2 -11
+R  -4   8  -3  -6  -5   0  -5  -6   0  -3  -6   2  -2  -7  -2  -1  -4   0  -7  -5  -4  -2  -3 -11
+N  -2  -3   6   3  -7  -1   0  -1   1  -3  -5   0  -5  -6  -3   1   0  -6  -3  -5   5  -1  -2 -11
+D  -1  -6   3   6  -9   0   3  -1  -1  -5  -8  -2  -7 -10  -4  -1  -2 -10  -7  -5   5   2  -3 -11
+C  -4  -5  -7  -9   9  -9  -9  -6  -5  -4 -10  -9  -9  -8  -5  -1  -5 -11  -2  -4  -8  -9  -6 -11
+Q  -2   0  -1   0  -9   7   2  -4   2  -5  -3  -1  -2  -9  -1  -3  -3  -8  -8  -4  -1   5  -2 -11
+E  -1  -5   0   3  -9   2   6  -2  -2  -4  -6  -2  -4  -9  -3  -2  -3 -11  -6  -4   2   5  -3 -11
+G   0  -6  -1  -1  -6  -4  -2   6  -6  -6  -7  -5  -6  -7  -3   0  -3 -10  -9  -3  -1  -3  -3 -11
+H  -4   0   1  -1  -5   2  -2  -6   8  -6  -4  -3  -6  -4  -2  -3  -4  -5  -1  -4   0   1  -3 -11
+I  -2  -3  -3  -5  -4  -5  -4  -6  -6   7   1  -4   1   0  -5  -4  -1  -9  -4   3  -4  -4  -3 -11
+L  -4  -6  -5  -8 -10  -3  -6  -7  -4   1   6  -5   2  -1  -5  -6  -4  -4  -4   0  -6  -4  -4 -11
+K  -4   2   0  -2  -9  -1  -2  -5  -3  -4  -5   6   0  -9  -4  -2  -1  -7  -7  -6  -1  -2  -3 -11
+M  -3  -2  -5  -7  -9  -2  -4  -6  -6   1   2   0  10  -2  -5  -3  -2  -8  -7   0  -6  -3  -3 -11
+F  -6  -7  -6 -10  -8  -9  -9  -7  -4   0  -1  -9  -2   8  -7  -4  -6  -2   4  -5  -7  -9  -5 -11
+P   0  -2  -3  -4  -5  -1  -3  -3  -2  -5  -5  -4  -5  -7   7   0  -2  -9  -9  -3  -4  -2  -3 -11
+S   1  -1   1  -1  -1  -3  -2   0  -3  -4  -6  -2  -3  -4   0   5   2  -3  -5  -3   0  -2  -1 -11
+T   1  -4   0  -2  -5  -3  -3  -3  -4  -1  -4  -1  -2  -6  -2   2   6  -8  -4  -1  -1  -3  -2 -11
+W  -9   0  -6 -10 -11  -8 -11 -10  -5  -9  -4  -7  -8  -2  -9  -3  -8  13  -3 -10  -7 -10  -7 -11
+Y  -5  -7  -3  -7  -2  -8  -6  -9  -1  -4  -4  -7  -7   4  -9  -5  -4  -3   9  -5  -4  -7  -5 -11
+V  -1  -5  -5  -5  -4  -4  -4  -3  -4   3   0  -6   0  -5  -3  -3  -1 -10  -5   6  -5  -4  -2 -11
+B  -1  -4   5   5  -8  -1   2  -1   0  -4  -6  -1  -6  -7  -4   0  -1  -7  -4  -5   5   1  -2 -11
+Z  -1  -2  -1   2  -9   5   5  -3   1  -4  -4  -2  -3  -9  -2  -2  -3 -10  -7  -4   1   5  -3 -11
+X  -2  -3  -2  -3  -6  -2  -3  -3  -3  -3  -4  -3  -3  -5  -3  -1  -2  -7  -5  -2  -2  -3  -3 -11
+* -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11 -11   1
diff --git a/jpred/data/blast/asn2ff.prt b/jpred/data/blast/asn2ff.prt

new file mode 100755 (executable)

index 0000000..0445e9a
--- /dev/null
+++ b/jpred/data/blast/asn2ff.prt
@@ -0,0 +1,2725 @@
+PrintTemplateSet ::= {
+  {
+    name "StdSeqDescrElement" ,
+    format {
+      asn1 "Seq-descr.E" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Seq-descr.E.mol-type" ,
+              label "Molecule type" ,
+              prefix " " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.modif" ,
+              label "Modifiers" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seq-descr.E.modif.E" ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seq-descr.E.method" ,
+              label "Method" ,
+              prefix " " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.name" ,
+              label "Name" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.title" ,
+              label "Title" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.org" ,
+              label "Organism" ,
+              prefix " " ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "Seq-descr.E.comment" ,
+              label "Comment" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.num" ,
+              label "Numbering" ,
+              prefix " " ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "Seq-descr.E.maploc" ,
+              label "Map location" ,
+              prefix " " ,
+              form
+                use-template "StdDbtag" } ,
+            {
+              asn1 "Seq-descr.E.pir" ,
+              label "PIR block" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.genbank" ,
+              label "GenBank block" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.pub" ,
+              label "Citation" ,
+              prefix " " ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "Seq-descr.E.region" ,
+              label "Region" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-descr.E.user" ,
+              label "User Type" ,
+              prefix " " ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seq-descr.E.sp" ,
+              label "SWISS-PROT block" ,
+              prefix " " ,
+              form
+                use-template "StdSPBlock"} ,
+            {
+              asn1 "Seq-descr.E.neighbors" ,
+              label "Neighbors" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.embl" ,
+              label "EMBL block" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.create-date" ,
+              label "Create date" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seq-descr.E.update-date" ,
+              label "Update date" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seq-descr.E.prf" ,
+              label "PRF block" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.pdb" ,
+              label "PDB block" ,
+              prefix " " ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seq-descr.E.het" ,
+              label "Heterogen" ,
+              prefix " " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdBioseqId" ,
+    format {
+      asn1 "Bioseq" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Bioseq.id" ,
+              prefix "" ,
+             suffix ";" ,
+               form
+        block {
+          components {
+            {
+              asn1 "Bioseq.id.E.pir" ,
+             label "pir:" ,
+             prefix " " ,
+              form
+                use-template "StdPIRseqId" } ,
+            {
+              asn1 "Bioseq.id.E.other" ,
+             label "REFSEQ:" ,
+             prefix " " ,
+              form
+                use-template "StdOtherId" } ,
+            {
+              asn1 "Bioseq.id.E.local" ,
+             label "userid:" ,
+             prefix " " ,
+              form
+                use-template "StdLocalId" } ,
+            {
+              asn1 "Bioseq.id.E.genbank" ,
+             label "genbank:" ,
+             prefix " " ,
+              form
+                use-template "StdGPseqId" } ,
+            {
+              asn1 "Bioseq.id.E.swissprot" ,
+             label "swissprot:" ,
+             prefix " " ,
+              form
+                use-template "StdSPseqId" } ,
+            {
+              asn1 "Bioseq.id.E.prf" ,
+             label "prf:" ,
+             prefix " " ,
+              form
+                use-template "StdPRFseqId" } ,
+            {
+              asn1 "Bioseq.id.E.pdb" ,
+             label "pdb:" ,
+             prefix " " ,
+              form
+                use-template "StdPDBseqId" } } } } } } } } ,
+  {
+    name "VersionBioseqId" ,
+    format {
+      asn1 "Bioseq" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Bioseq.id" ,
+              prefix "" ,
+             suffix ";" ,
+               form
+        block {
+          components {
+            {
+              asn1 "Bioseq.id.E.pir" ,
+             label "pir:" ,
+             prefix " " ,
+              form
+                use-template "StdPIRseqId" } ,
+            {
+              asn1 "Bioseq.id.E.local" ,
+             label "userid:" ,
+             prefix " " ,
+              form
+                use-template "StdLocalId" } ,
+            {
+              asn1 "Bioseq.id.E.genbank" ,
+             label "genbank:" ,
+             prefix " " ,
+              form
+                use-template "VersionGPseqId" } ,
+            {
+              asn1 "Bioseq.id.E.swissprot" ,
+             label "swissprot:" ,
+             prefix " " ,
+              form
+                use-template "StdSPseqId" } ,
+            {
+              asn1 "Bioseq.id.E.prf" ,
+             label "prf:" ,
+             prefix " " ,
+              form
+                use-template "StdPRFseqId" } ,
+            {
+              asn1 "Bioseq.id.E.pdb" ,
+             label "pdb:" ,
+             prefix " " ,
+              form
+                use-template "StdPDBseqId" } } } } } } } } ,
+  {
+    name "StdSeqFeatLocation" ,
+    format {
+      asn1 "Seq-feat.location" ,
+      label "Location" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "StdSeqFeatProduct" ,
+    format {
+      asn1 "Seq-feat.product" ,
+      label "Product" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "EntrySeqFeatData" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat.data" ,
+      prefix "\t" ,
+      form
+        use-template "StdSeqFeatData" } } ,
+  {
+    name "StdSeqFeat" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat" ,
+      prefix " " ,
+      suffix "  " ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Seq-feat.data" ,
+              form
+                use-template "StdSeqFeatData" } ,
+            {
+              asn1 "Seq-feat" ,
+              form
+                use-template "StdSeqFeatCommon" } ,
+            {
+              asn1 "Seq-feat.product" ,
+              label "Product" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.location" ,
+              label "Location" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.cit" ,
+              label "Citations" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.cit.pub.E" ,
+                      form
+                        use-template "StdPub" } } } } ,
+            {
+              asn1 "Seq-feat.xref" ,
+              label "Cross-reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.xref.E" ,
+                      form
+                        use-template "StdSeqFeatXref" } } } } } } } } ,
+  {
+    name "StdSeqFeatData" ,
+    format {
+      asn1 "SeqFeatData" ,
+      form
+        block {
+          components {
+            {
+              asn1 "SeqFeatData.gene" ,
+              label "Gene" ,
+              form
+                use-template "StdGeneRef" } ,
+            {
+              asn1 "SeqFeatData.org" ,
+              label "Organism" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "SeqFeatData.cdregion" ,
+              label "Coding Region" ,
+              form
+                use-template "StdCdRegion" } ,
+            {
+              asn1 "SeqFeatData.prot" ,
+              label "Protein" ,
+              form
+                use-template "StdProtRef" } ,
+            {
+              asn1 "SeqFeatData.rna" ,
+              label "RNA" ,
+              form
+                use-template "StdRNARef" } ,
+            {
+              asn1 "SeqFeatData.pub" ,
+              label "Citation" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "SeqFeatData.seq" ,
+              label "Sequence" ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "SeqFeatData.imp.key" ,
+              label "Import" ,
+              form
+                use-template "StdImpFeat" } ,
+            {
+              asn1 "SeqFeatData.region" ,
+              label "Region" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.comment" ,
+              label "Comment" ,
+              form
+                null NULL } ,
+            {
+              asn1 "SeqFeatData.bond" ,
+              label "Bond" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.site" ,
+              label "Site" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.rsite" ,
+              label "Rest. Site" ,
+              form
+                use-template "StdRsiteRef" } ,
+            {
+              asn1 "SeqFeatData.user" ,
+              label "User Type" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "SeqFeatData.txinit" ,
+              label "TxInit" ,
+              form
+                use-template "StdTxInit" } ,
+            {
+              asn1 "SeqFeatData.num" ,
+              label "Numbering" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "SeqFeatData.psec-str" ,
+              label "Sec. Struct" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.non-std-residue" ,
+              label "NonStd Residue" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.het" ,
+              label "Heterogen" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdGeneRef" ,
+    format {
+      asn1 "Gene-ref" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Gene-ref" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Gene-ref.locus" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Gene-ref.allele" ,
+                      prefix " " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is a pseudogene." } } ,
+            {
+              asn1 "Gene-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.maploc" ,
+              label "Map Location" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } } } } } ,
+  {
+    name "StdUserObj" ,
+    format {
+      asn1 "User-object" ,
+      label "User-object" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "User-object.class" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "User-object.type" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdSPBlock" ,
+    format {
+      asn1 "SP-block" ,
+      prefix "" ,
+      suffix " " ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "SP-block.class" ,
+             label "class: " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SP-block.extra-acc" ,
+             label "extra accessions:" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                 components {
+                   {
+                    asn1 "SP-block.extra-acc.E" ,
+                     form
+                       text {
+                                 } } } } } ,
+            {
+              asn1 "SP-block.imeth" ,
+              form
+                boolean {
+                true "seq starts with Met"   } } ,
+            {
+              asn1 "SP-block.plasnm" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                 components {
+                   {
+                    asn1 "SP-block.plasnm.E" ,
+                     form
+                       text {
+                                 } } } } } ,
+            {
+              asn1 "SP-block.seqref" ,
+             label "xrefs:" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                  components {
+                    {
+                      asn1 "Seq-id.local" ,
+                      form
+                        use-template "StdObjectId" } ,
+                    {
+                      asn1 "Seq-id.genbank" ,
+                     label "genbank" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.embl" ,
+                     label "embl" ,
+                     prefix " " ,
+                      form
+                        use-template "StdEMBLseqId" } ,
+                    {
+                      asn1 "Seq-id.pir" ,
+                     label "pir" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.swissprot" ,
+                     label "swissprot" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.patent" ,
+                      form
+                        use-template "StdPatentSeqId" } ,
+                    {
+                      asn1 "Seq-id.other" ,
+                               label "REFSEQ:" ,
+                               prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.general" ,
+                      form
+                        use-template "StdDbtag" } ,
+                    {
+                      asn1 "Seq-id.gi" ,
+                     label "gi:" ,
+                     prefix " " ,
+                      form
+                       text {
+                         } } ,
+                    {
+                      asn1 "Seq-id.ddbj" ,
+                     label "ddbj" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.prf" ,
+                     label "prf" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.pdb" ,
+                      form
+                        use-template "StdPDBseqId" } ,
+                  } } } ,
+             {
+              asn1 "SP-block.dbref" ,
+              label "xrefs (non-sequence databases):" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", ",
+                components {
+                {
+                  asn1 "SP-block.dbref.E" ,
+                 form
+                   block {
+                   components {    
+                {
+                  asn1 "Dbtag.db" ,
+                 suffix ": " ,
+                 form
+                 text {
+                    } } ,
+                {
+                 asn1 "Dbtag.tag" ,
+                 form
+                 use-template "StdObjectId" } ,
+                 } } } } } } ,
+            {
+              asn1 "SP-block.created" ,
+             label "created:" ,
+             prefix " " ,
+             form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "SP-block.sequpd" ,
+             label "sequence updated:" ,
+             prefix " " ,
+             form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "SP-block.annotupd" ,
+             label "annotation updated:" ,
+             prefix " " ,
+             form
+                user {
+                  printfunc "StdDatePrint" } } ,
+                  } } } } ,
+  {
+    name "StdPirBlock" ,
+    format {
+      asn1 "PIR-block" ,
+      prefix "" ,
+      suffix "" ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "PIR-block.host" ,
+             label "host:" ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.source" ,
+             label "source: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.summary" ,
+             label "summary: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.genetic" ,
+             label "genetic: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.includes" ,
+             label "includes: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.placement" ,
+             label "placement: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.superfamily" ,
+             label "superfamily: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.cross-reference" ,
+             label "xref: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.date" ,
+             label "PIR dates: " ,
+              form
+                text {
+                     } } ,
+            {
+              asn1 "PIR-block.had-punct" ,
+              form
+                boolean {
+                true "punctuation in sequence" } } ,
+            {
+              asn1 "PIR-block.seqref" ,
+             label "xrefs:" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                  components {
+                    {
+                      asn1 "Seq-id.local" ,
+                      form
+                        use-template "StdObjectId" } ,
+                    {
+                      asn1 "Seq-id.genbank" ,
+                     label "genbank" ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.embl" ,
+                     label "embl" ,
+                     prefix " " ,
+                      form
+                        use-template "StdEMBLseqId" } ,
+                    {
+                      asn1 "Seq-id.pir" ,
+                     label "pir" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.swissprot" ,
+                     label "swissprot" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.patent" ,
+                      form
+                        use-template "StdPatentSeqId" } ,
+                    {
+                      asn1 "Seq-id.other" ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.general" ,
+                      form
+                        null NULL } ,
+                    {
+                      asn1 "Seq-id.gi" ,
+                     label "gi:" ,
+                     prefix " " ,
+                      form
+                       text {
+                                         } } ,
+                    {
+                      asn1 "Seq-id.ddbj" ,
+                     label "ddbj" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.prf" ,
+                     label "prf" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.pdb" ,
+                      form
+                        use-template "StdPDBseqId" } ,
+                  } } } ,
+                  } } } } ,
+  {
+    name "StdPDBBlock" ,
+    format {
+      asn1 "PDB-block" ,
+      prefix "" ,
+      suffix "" ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "PDB-block.deposition" ,
+             label "deposition: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "PDB-block.class" ,
+             label "class: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "PDB-block.source" ,
+             label "source:" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                 components {
+                   {
+                    asn1 "PDB-block.source.E" ,
+                     form
+                       text {
+                                 } } } } } ,
+            {
+              asn1 "PDB-block.exp-method" ,
+             label "Non X-ray method: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "PDB-block.replace" ,
+             prefix "" ,
+             form
+               use-template "Pdb-replace" } ,
+                  } } } } ,
+  {
+    name "Pdb-replace" ,
+    format {
+      asn1 "PDB-replace" ,
+      prefix "" ,
+      suffix "" ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "PDB-replace.date" ,
+             label "replacement date:" ,
+             prefix " " ,
+             form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "PDB-replace.ids" ,
+             label "ids replaced:" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                 components {
+                   {
+                    asn1 "PDB-replace.ids.E" ,
+                     form
+                       text {
+                                 } } } } } ,
+                  } } } } ,
+  {
+    name "StdPRFBlock" ,
+    format {
+      asn1 "PRF-block" ,
+      prefix "" ,
+      suffix "" ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "PRF-block.extra-src" ,
+             prefix "" ,
+             form
+               use-template "Prf-Extra-src" } ,
+                  } } } } ,
+  {
+    name "Prf-Extra-src" ,
+    format {
+      asn1 "PRF-ExtraSrc" ,
+      prefix "" ,
+      suffix "" ,
+      form
+        block {
+          separator ";~" ,
+          components {
+            {
+              asn1 "PRF-ExtraSrc.host" ,
+             label "host:" ,
+             prefix " " ,
+             form
+                text {
+                         } } ,
+            {
+              asn1 "PRF-ExtraSrc.part" ,
+             label "part:" ,
+             prefix " " ,
+             form
+                text {
+                         } } ,
+            {
+              asn1 "PRF-ExtraSrc.state" ,
+             label "state:" ,
+             prefix " " ,
+             form
+                text {
+                         } } ,
+            {
+              asn1 "PRF-ExtraSrc.strain" ,
+             label "strain:" ,
+             prefix " " ,
+             form
+                text {
+                         } } ,
+            {
+              asn1 "PRF-ExtraSrc.taxon" ,
+             label "taxonomy:" ,
+             prefix " " ,
+             form
+                text {
+                                } } ,
+                  } } } } ,
+  {
+    name "StdSPBXRef" ,
+    format {
+      asn1 "SP-block" ,
+      prefix " " ,
+      suffix "  " ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "SP-block.seqref" ,
+             prefix " " ,
+             form
+               block {
+                 separator ", ",
+                  components {
+                    {
+                      asn1 "Seq-id.local" ,
+                      form
+                        use-template "StdObjectId" } ,
+                    {
+                      asn1 "Seq-id.genbank" ,
+                     label "genbank" ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.embl" ,
+                     label "embl" ,
+                     prefix " " ,
+                      form
+                        use-template "StdEMBLseqId" } ,
+                    {
+                      asn1 "Seq-id.pir" ,
+                     label "pir" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.swissprot" ,
+                     label "swissprot" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.patent" ,
+                      form
+                        use-template "StdPatentSeqId" } ,
+                    {
+                      asn1 "Seq-id.other" ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.general" ,
+                      form
+                        null NULL } ,
+                    {
+                      asn1 "Seq-id.gi" ,
+                     label "gi:" ,
+                     prefix " " ,
+                      form
+                       text {
+                         } } ,
+                    {
+                      asn1 "Seq-id.ddbj" ,
+                     label "ddbj" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.prf" ,
+                     label "prf" ,
+                     prefix " " ,
+                      form
+                        use-template "StdTextseqId" } ,
+                    {
+                      asn1 "Seq-id.pdb" ,
+                      form
+                        use-template "StdPDBseqId" } ,
+                  } } } ,
+                  } } } } ,
+  {
+    name "StdPub" ,
+    format {
+      asn1 "Pub" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Pub.gen" ,
+              form
+                use-template "StdCitGen" } ,
+            {
+              asn1 "Pub.sub" ,
+              form
+                use-template "StdCitSub" } ,
+            {
+              asn1 "Pub.medline" ,
+              form
+                use-template "StdMedlineEntry" } ,
+            {
+              asn1 "Pub.muid" ,
+              label "MEDLINE uid: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Pub.article" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Pub.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Pub.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Pub.proc" ,
+              form
+                use-template "StdCitProc" } ,
+            {
+              asn1 "Pub.patent" ,
+              form
+                use-template "StdCitPat" } ,
+            {
+              asn1 "Pub.pat-id" ,
+              form
+                use-template "StdIdPat" } ,
+            {
+              asn1 "Pub.man" ,
+              form
+                use-template "StdCitLet" } ,
+            {
+              asn1 "Pub.equiv" ,
+              form
+                use-template "StdPubEquiv" } } } } } ,
+  {
+    name "StdCitGen" ,
+    format {
+      asn1 "Cit-gen" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-gen.serial-number" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-gen.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-gen.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.cit" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Cit-gen.journal" ,
+                      suffix ":" ,
+                      form
+                        use-template "StdTitle" } ,
+                    {
+                      asn1 "Cit-gen.issue" ,
+                      suffix ";" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-gen.pages" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitSub" ,
+    format {
+      asn1 "Cit-sub" ,
+      prefix "Data Submission " ,
+      form
+        block {
+          components {
+            {
+              asn1 "Cit-sub.medium" ,
+              prefix "on " ,
+              suffix " " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-sub.imp.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-sub.authors" ,
+              prefix " " ,
+              form
+                use-template "StdAuthList" } } } } } ,
+  {
+    name "StdMedlineEntry" ,
+    format {
+      asn1 "Medline-entry" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Medline-entry" ,
+              form
+                block {
+                  separator "   " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.uid" ,
+                      label "uid" ,
+                      prefix ": " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Medline-entry.em" ,
+                      label "entry month" ,
+                      prefix ": " ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } ,
+            {
+              asn1 "Medline-entry.cit" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Medline-entry.abstract" ,
+              label "abstract" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Medline-entry.mesh" ,
+              label "Mesh Terms" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.mesh.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-mesh.term" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-mesh.mp" ,
+                              form
+                                boolean {
+                                  true " (Main Point)" } } ,
+                            {
+                              asn1 "Medline-mesh.qual" ,
+                              form
+                                block {
+                                  separator " " ,
+                                  components {
+                                    {
+                                      asn1 "Medline-mesh.qual.E" ,
+                                      form
+                                        block {
+                                          components {
+                                            {
+                                              asn1 "Medline-qual.subh" ,
+                                              form
+                                                text {
+                                                   } } ,
+                                            {
+                                              asn1 "Medline-qual.mp" ,
+                                              form
+                                                boolean {
+                                                  true " (Main Point)" } } } } } } } } } } } } } } ,
+            {
+              asn1 "Medline-entry.substance" ,
+              label "Substance" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.substance.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-rn.name" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-rn.type" ,
+                              form
+                                enum {
+                                  values {
+                                    "" ,
+                                    " CAS: " ,
+                                    "EC " } } } ,
+                            {
+                              asn1 "Medline-rn.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.xref" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.xref.E" ,
+                      form
+                        block {
+                          separator ": " ,
+                          components {
+                            {
+                              asn1 "Medline-si.type" ,
+                              form
+                                enum {
+                                   } } ,
+                            {
+                              asn1 "Medline-si.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.gene" ,
+              label "Possible Gene Symbols" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.gene.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Medline-entry.idnum" ,
+              label "Support" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.idnum.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitArt" ,
+    format {
+      asn1 "Cit-art" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-art.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-art.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-art.from.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Cit-art.from.book" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-art.from.proc" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitProc" } } } } } ,
+  {
+    name "StdCitJour" ,
+    format {
+      asn1 "Cit-jour" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-jour.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-jour.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitBook" ,
+    format {
+      asn1 "Cit-book" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-book.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.coll" ,
+              prefix "Collection: " ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-book.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitProc" ,
+    format {
+      asn1 "Cit-proc" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-proc.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-proc.meet" ,
+              label "Meeting " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Meeting.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Meeting.date" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Meeting.place" ,
+                      form
+                        use-template "StdAffil" } } } } } } } } ,
+  {
+    name "StdCitPat" ,
+    format {
+      asn1 "Cit-pat" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-pat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-pat.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-pat" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Cit-pat.country" ,
+                      suffix " " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.doc-type" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.date-issue" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Cit-pat.app-number" ,
+                      prefix " Appl: " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.app-date" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } } } } } ,
+  {
+    name "StdIdPat" ,
+    format {
+      asn1 "Id-pat" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Id-pat.country" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.number" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.app-number" ,
+              prefix "Appl: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdPatentSeqId" ,
+    format {
+      asn1 "Patent-seq-id" ,
+      label "patent: " ,
+      form
+        block {
+          components {
+            {
+              asn1 "Patent-seq-id.seqid" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Patent-seq-id.cit" ,
+              prefix " " ,
+             form
+                use-template "StdIdPat" } } } } } ,
+  {
+    name "StdCitLet" ,
+    format {
+      asn1 "Cit-let" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-let.type" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-let.man-id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-let.cit" ,
+              form
+                use-template "StdCitBook" } } } } } ,
+  {
+    name "StdPubEquiv" ,
+    format {
+      asn1 "Pub-equiv" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Pub-equiv.E" ,
+              form
+                use-template "StdPub" } } } } } ,
+  {
+    name "StdTitle" ,
+    format {
+      asn1 "Title" ,
+      form
+        block {
+          separator ", " ,
+          components {
+            {
+              asn1 "Title.E.trans" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.name" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.tsub" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.abr" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.iso-jta" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.ml-jta" ,
+              label "MEDLINE" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.jta" ,
+              label "jta" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.issn" ,
+              label "ISSN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.coden" ,
+              label "CODEN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.isbn" ,
+              label "ISBN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdAuthList" ,
+    format {
+      asn1 "Auth-list" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Auth-list" ,
+              form
+                user {
+                  printfunc "StdAuthListNamesPrint" } } ,
+            {
+              asn1 "Auth-list.affil" ,
+              form
+                use-template "StdAffil" } } } } } ,
+  {
+    name "StdAffil" ,
+    format {
+      asn1 "Affil" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Affil.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.affil" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.div" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.street" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Affil.std.city" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.sub" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.country" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdImprint" ,
+    format {
+      asn1 "Imprint" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Imprint.date" ,
+              prefix "(" ,
+              suffix ") " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Imprint.volume" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.issue" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.section" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.part-sup" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.pages" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.prepub" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Imprint.pub" ,
+              label " Publisher: " ,
+              form
+                use-template "StdAffil" } ,
+            {
+              asn1 "Imprint.cprt" ,
+              label " Copyright: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdSeqFeatXref" ,
+    format {
+      asn1 "SeqFeatXref" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "SeqFeatXref.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "SeqFeatXref.data" ,
+              form
+                use-template "StdSeqFeatData" } } } } } ,
+  {
+    name "StdOrgRef" ,
+    format {
+      asn1 "Org-ref" ,
+      label "Org-ref" ,
+      prefix " " ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Org-ref" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Org-ref.taxname" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Org-ref.common" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.mod" ,
+              label "Modifiers" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.mod.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } ,
+            {
+              asn1 "Org-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCdRegion" ,
+    format {
+      asn1 "Cdregion" ,
+      label "Cdregion" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cdregion.orf" ,
+              form
+                boolean {
+                  true "Uncharacterized Open Reading Frame" } } ,
+            {
+              asn1 "Cdregion.frame" ,
+              label "Reading Frame = " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cdregion.code" ,
+              label "Genetic Code: " ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Genetic-code.E.name" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Genetic-code.E.id" ,
+                      label "id= " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Cdregion.conflict" ,
+              form
+                boolean {
+                  true "Translation conflicts with protein sequence" } } ,
+            {
+              asn1 "Cdregion.stops" ,
+              prefix "Translation contains " ,
+              suffix " stop codons" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.gaps" ,
+              prefix "Translation contains " ,
+              suffix " gaps when aligned to protein" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.mismatch" ,
+              prefix "Translation contains " ,
+              suffix " mismatches when aligned to protein" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdProtRef" ,
+    format {
+      asn1 "Prot-ref" ,
+      label "Prot-ref" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Prot-ref.name" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.name.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Prot-ref.ec" ,
+              label "ec" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.ec.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.activity" ,
+              label "activity" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.activity.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.db" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdRNARef" ,
+    format {
+      asn1 "RNA-ref" ,
+      label "RNA-ref" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "RNA-ref.type" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "RNA-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is an RNA pseudogene." } } ,
+            {
+              asn1 "RNA-ref.ext.name" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdPubdesc" ,
+    format {
+      asn1 "Pubdesc" ,
+      label "Pubdesc" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Pubdesc.pub" ,
+              form
+                use-template "StdPubEquiv" } ,
+            {
+              asn1 "Pubdesc" ,
+              prefix "In this article: " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Pubdesc.name" ,
+                      label "name=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.fig" ,
+                      label "figure=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.poly-a" ,
+                      form
+                        boolean {
+                          true "poly(A) shown" } } ,
+                    {
+                      asn1 "Pubdesc.maploc" ,
+                      label "map location=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.num" ,
+                      form
+                        use-template "StdNumbering" } ,
+                    {
+                      asn1 "Pubdesc.numexc" ,
+                      form
+                        boolean {
+                          true "numbering inconsistent" } } } } } ,
+            {
+              asn1 "Pubdesc.comment" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdImpFeat" ,
+    format {
+      asn1 "Imp-feat.key" ,
+      label "Imp-feat" ,
+      form
+        text {
+           } } } ,
+  {
+    name "StdRsiteRef" ,
+    format {
+      asn1 "Rsite-ref" ,
+      label "Rsite-ref" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Rsite-ref.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Rsite-ref.std" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdTxInit" ,
+    format {
+      asn1 "TxInit" ,
+      label "TxInit" ,
+      form
+        null NULL } } ,
+  {
+    name "StdNumbering" ,
+    format {
+      asn1 "Numbering" ,
+      label "Numbering" ,
+      form
+        null NULL } } ,
+  {
+    name "StdFeatId" ,
+    format {
+      asn1 "Feat-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Feat-id.gibb" ,
+              label "GenInfo Backbone: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.giim.id" ,
+              label "GenInfo Import Id: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.local" ,
+              label "Local: " ,
+              form
+                use-template "StdObjectId" } ,
+            {
+              asn1 "Feat-id.general" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdSeqFeatCommon" ,
+    format {
+      asn1 "Seq-feat" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Seq-feat.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "Seq-feat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat" ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.partial" ,
+                      form
+                        boolean {
+                          true "Partial" } } ,
+                    {
+                      asn1 "Seq-feat.except" ,
+                      form
+                        boolean {
+                          true "Biological Exception" } } ,
+                    {
+                      asn1 "Seq-feat.exp-ev" ,
+                      label "Evidence" ,
+                      prefix " is " ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seq-feat.comment" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat.ext" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seq-feat.qual" ,
+              label "Qualifiers" ,
+              prefix " " ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.qual.E" ,
+                      prefix "\\" ,
+                      form
+                        block {
+                          separator "= " ,
+                          components {
+                            {
+                              asn1 "Gb-qual.qual" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Gb-qual.val" ,
+                              form
+                                text {
+                                   } } } } } } } } } } } } ,
+  {
+    name "StdDbtag" ,
+    format {
+      asn1 "Dbtag" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Dbtag.db" ,
+              suffix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Dbtag.tag" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdObjectId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdTextseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+             label "" ,
+              form
+                text { 
+                   } } } } } } ,
+  {
+    name "VersionTextseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+             label "." ,
+             prefix "" ,
+              form
+                text { 
+                   } } } } } } ,
+  {
+    name "StdPDBseqId" ,
+    format {
+      asn1 "PDB-seq-id" ,
+      label "PDB Id: " ,
+      form
+        block {
+          components {
+            {
+              asn1 "PDB-seq-id.mol" ,
+             label "molecule" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "PDB-mol-id" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "PDB-seq-id.chain" ,
+             label "chain" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "PDB-seq-id.rel" ,
+             label "release" ,
+             prefix " " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdEMBLseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+             label "." ,
+             prefix "" ,
+             form
+                text { 
+                 } } ,
+                 } } } } ,
+  {
+    name "StdPIRseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdPRFseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdPDBseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdSPseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "," ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdLocalId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdOtherId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "," ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdGPseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "," ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdSeqId" ,
+    format {
+      asn1 "Seq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seq-id.local" ,
+              form
+                use-template "StdObjectId" } ,
+            {
+              asn1 "Seq-id.genbank" ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+              asn1 "Seq-id.embl" ,
+             label "embl" ,
+             prefix " " ,
+              form
+                use-template "StdEMBLseqId" } ,
+            {
+              asn1 "Seq-id.pir" ,
+             label "pir" ,
+             prefix " " ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+              asn1 "Seq-id.swissprot" ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+               asn1 "Seq-id.patent" ,
+               form
+                 use-template "StdPatentSeqId" } ,
+            {
+              asn1 "Seq-id.other" ,
+             label "REFSEQ:" ,
+             prefix " " ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+              asn1 "Seq-id.general" ,
+              form
+                null NULL } ,
+            {
+               asn1 "Seq-id.gi" ,
+             label "gi:" ,
+             prefix " " ,
+              form
+               text {
+                         } } ,
+            {
+              asn1 "Seq-id.ddbj" ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+              asn1 "Seq-id.prf" ,
+              form
+                use-template "StdTextseqId" } ,
+            {
+              asn1 "Seq-id.pdb" ,
+              form
+                use-template "StdPDBseqId" } ,
+                  } 
+                  } } } , 
+  {
+    name "VersionSeqId" ,
+    format {
+      asn1 "Seq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seq-id.local" ,
+              form
+                use-template "StdObjectId" } ,
+            {
+              asn1 "Seq-id.genbank" ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+              asn1 "Seq-id.embl" ,
+             label "embl" ,
+             prefix " " ,
+              form
+                use-template "StdEMBLseqId" } ,
+            {
+              asn1 "Seq-id.pir" ,
+             label "pir" ,
+             prefix " " ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+              asn1 "Seq-id.swissprot" ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+               asn1 "Seq-id.patent" ,
+               form
+                 use-template "StdPatentSeqId" } ,
+            {
+              asn1 "Seq-id.other" ,
+             label "REFSEQ:" ,
+             prefix " " ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+              asn1 "Seq-id.general" ,
+              form
+                null NULL } ,
+            {
+               asn1 "Seq-id.gi" ,
+             label "gi:" ,
+             prefix " " ,
+              form
+               text {
+                         } } ,
+            {
+              asn1 "Seq-id.ddbj" ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+              asn1 "Seq-id.prf" ,
+              form
+                use-template "VersionTextseqId" } ,
+            {
+              asn1 "Seq-id.pdb" ,
+              form
+                use-template "StdPDBseqId" } ,
+                  } 
+                  } } } }
diff --git a/jpred/data/blast/bstdt.val b/jpred/data/blast/bstdt.val

new file mode 100755 (executable)

index 0000000..0f841cb

Binary files /dev/null and b/jpred/data/blast/bstdt.val differ
diff --git a/jpred/data/blast/featdef.val b/jpred/data/blast/featdef.val

new file mode 100755 (executable)

index 0000000..9c57282

Binary files /dev/null and b/jpred/data/blast/featdef.val differ
diff --git a/jpred/data/blast/gc.val b/jpred/data/blast/gc.val

new file mode 100755 (executable)

index 0000000..84fa7f0

Binary files /dev/null and b/jpred/data/blast/gc.val differ
diff --git a/jpred/data/blast/humrep.fsa b/jpred/data/blast/humrep.fsa

new file mode 100755 (executable)

index 0000000..4559c38
--- /dev/null
+++ b/jpred/data/blast/humrep.fsa
@@ -0,0 +1,1070 @@
+>Alu  
+ggccgggcgcggtggctcacgcctgtaatcccagcactttgggaggccga
+ggcgggcggatcacctgaggtcaggagttcgagaccagcctggccaacat
+ggtgaaaccccgtctctactaaaaatacaaaaattagccgggcgtggtgg
+cgcgcgcctgtaatcccagctactcgggaggctgaggcaggagaatcgct
+tgaacccgggaggcggaggttgcagtgagccgagatcgcgccactgcact
+ccagcctgggcgacagagcgagactccgtctcaaaaaaaaaaaaaaaaaa
+>MIR  
+acagyayagcatagtggttaagagcacggrctctggagccagactgcctg
+ggttcgaatcccggctctgccacttactagctgtgtgaccttgggcaagt
+tacttaacctctctgtgcctcagtttcctcatctgtaaaatggggataat
+aatagtacctacctcatagggttgttgtgaggattaaatgagttaataya
+tgtaaagcgcttagaacagtgcctggcacatagtaagcgctcaataaatg
+ttrgytattatt
+>L1  
+ggcggtggagccaagatgaccgaataggaacagctccagtctatagctcc
+catcgtgagtgacgcagaagacgggtgatttctgcatttccaactgaggt
+accaggttcatctcacagggaagtgccaggcagtgggtgcaggacagtag
+tgcagtgcactgtgcatgagccgaagcagggcgaggcatcacctcacccg
+ggaagcacaaggggtcagggaattccctttcctagtcaaagaaaagggtg
+acagatggcacctggaaaatcgggtcactcccgccctaatactgcgctct
+tccaacaagcttaacaaatggcacaccaggagattatatcccatgcctgg
+ctcagagggtcctacgcccatggagcctcgctcattgctagcacagcagt
+ctgaggtcaaactgcaaggtggcagtgaggctgggggaggggtgcccacc
+attgtccaggcttgagcaggtaaacaaagccgcctggaagctcgaactgg
+gtggagcccaccacagctcaaggaggcctgcctgcctctgtaggctccac
+ctctaggggcagggcacagacaaacaaaagacaacaagaacctctgcaga
+cttaaatgtccctgtctgacagctttgaagagagtagtggttctcccagc
+acatagcttcagatctgagaacaggcagactgcctcctcaagtgggtccc
+tgacccccgagtagcctaactgggaggcatcccccagtagggcggactga
+cacctcacatggctggtactcctctaagacaaaacttccagaggaatgat
+caggcagcagcatttgcggttcaccaatatccactgttctgcagccaccg
+ctgctgatacccaggaaaacagcatctggagtggacctccagtaaactcc
+aacagacctgcagctgagggtcctgactgttagaaggaaaactaacaaac
+agaaaggacatccacaccaaaaacccatctgtacatcaccatcatcaaag
+accaaaggtagataaaaccataaagatggggaaaaagcagagcagaaaaa
+ctggacactctaaaaatgagagtgcctctccttctccaaagtaacgcagc
+tcctcaccagcaatggaacaaagctgggcagagaatgactttgacgagtt
+gagagaggaaggcttcagaagatcaaactactccaagctaaaggaggaag
+ttcgaacaaacggcaaagaagtaaaaaactttgaaaaaaaattagatgaa
+tggataactagaataaccaatgcacagaagtccttaaaggacctgatgga
+gctgaaaaccaaggcaggagaactacgtgacaaatacacaagcctcagta
+accgatgagatcaactggaagaaagggtatcaatgacggaagatgaaatg
+aatgaaatgaagcatgaagagaagtttagagaaaaaagaataaaaagaaa
+cgaacaaagcctccaagaaatatgggactatgtgaaaagaccaaatctac
+atctaattggtgtagctgaaagtgatggggagaatggaaccaagttggaa
+aacactctgcaggatattatccaggagaacttccccaatctagcaaggca
+gcccaaattcacattcaggaaatacagagaacgccacaaagatactccta
+gagaaaagcaactccaagacacataactgacagattcaccaaagttgaaa
+tgaaggaaaaaatgttaagggcagccagagagaaaggtcgggttacccac
+aaagggaagcccatcagactaacagctgatctatcggcagaaactctaca
+agccagaagaaagtgggggccaatattcaacattgttaaagaaaagaatt
+ttcggcccagaatttcatatccagccaaactaagcttcataagcattgga
+gaaataaaatcctttacagacaagcaaatgctgagagattttgtcaccac
+caggcctgccctacaagagctcctgaaggaagcactaaacatggaaagga
+acaactagtatcagccactgcaaaaacatgccaaattgtaaacgaccatc
+aaggctaggaagaaactgcatcaaggagcaaaataaccagctaacatcat
+aatgacaggatcaaattcatacataacaatactcaccttaaatgtaaata
+ggctaaatgctccaattaaaagacacagactggcaaattggataaggagt
+caagacccatctgtcgttatgtattcaggaaacccatctcacgtgcagag
+acacacataggctcgaaataaaaggatggaggaatatctaccaagcaaat
+ggaaaacaaaaaaaggcaggggttgcaatcctagtctctgataaaacaga
+ttttaaaccaacaaagatcaaaagagacaaagaaggccattacataatgg
+caaagggatctattcaagaagaagaactaactatactaaatatatatgca
+cccaatacaggagcacccagattcataaaacaagtcctgagtgacctaca
+aagagacttagatgcccacacaataataatgggagactttaacaccccac
+tgtcaacattagacagatcaacgagacagaaagttaacaaggatatccag
+gaattggactcagctctgcaccaagcagacctaatagacatctacagaac
+tctccaccccaaatcaacagaatatacattcttttcagcaccacaccaca
+cctattccaaaactgaccacatagttggaagtaaagctctcctcagcaaa
+tgtaaaagaacagaaactataacaaactgtctctcagaccacagtgcaat
+caaactagaactcaggattaagaaactcactcaaaaccactcagctacat
+ggaaactgaacagcctgctcctgaatgactactgggtacataacaaaatg
+aaggcagaaataaagatgttctttgaaacaacgagaacaaagacacaaca
+caccagaatctctgagacacattcaaagcagtgtgtagagggaaatttat
+agcactaaatgcccacaagggaaagcaggaaagatctaaaattgacaccc
+taacatcacaattaaaaaactagagaagcaggagcaaacacattcaaaag
+ctaacagaagacaagaaataactaagatcagagcagaagtgaagaagata
+gagacacaaaaaacccttcaaaaaaatcaatgaatccagaagctgttttt
+ttgaaaagatcaacaaaattgatagactgctagcaagactaataaagaag
+aaaggggagaagaatcaaatagacgcaataaaaaatgacacggggtatca
+ccactgatcccacagaaatacaaactaccgtcagagaatactataaacac
+ctctacgcaaataaactagaaaatctagaagaaatggataaattcctcga
+cacatacactctgccaagactaaaccaggaagaagttgtatctctgaata
+gaccaataacaggctctgaaattgaggcaataattaatagcttatcaacc
+aaaaaaagtccgggaccagtaggattcatagccgaattctaccagaggta
+caaggaggagctggtaccattccttctgaaactattccaatcaatagaaa
+aagagggaatcctccctaactcattttatgaggccagcatcatcctgata
+ccaaagcctgacagagacacaacaaaaaaagagaatgttacaccaatatc
+cttgatgaacatcgatgcaaaaatcctcaataaaatactggcaaactgaa
+tccagcagcacatcaaaaagcttatcctccatgatcaagtgggcttcatc
+cctgccatgcaaggctggttcaacatacgaaatcaataaacataatccag
+catataaacagaaccaaagacacaaaccatatgattatctcaatagatgc
+agaaaaggcctttgacaaaattcaacaatgcttcatgctaaaaactctca
+ataaattaggtattgatgggacatatctcaaaataataagagctatctat
+gacaaacccacagccaatatcatactgagtggacaaaaactggaagcatt
+ccctttgaaaactggcacaaggcagggatgccctctctcaccactcctat
+tcaacatagtgttggaagttctggccagggcaatcaggcaggagaaggaa
+ataaagggcattcaattaggaaaagaggaaggtgaaattgtccctgtttg
+cagatgacatgattgtatatctagaaaaccccattgtctcagcccaaaat
+ctccttaagctgataagcaacttcagcaaagtctcaggatataaaatcag
+tgtgcaaaaatcacaagtattcctatgcaccaataacagacaaacagaga
+gccaaatcatgagtgaactcccattcacaattgcttcaaagagaataaaa
+tacctaggaatccaacttacaagggatgtgaaggacctcttcaaggagaa
+ctacaaaccactgctcaatgaaataaaagaggatacaaacaaatggaaga
+acattccatgcttatgggtaggaagaatcatatcgtgaaaatggtcatac
+tgcccaaggtaatttatagattcaatgccatccccatcaagctaccaatg
+actttcttcacagaactggaaaaaactactttaaagttcatatggaatca
+aaaaagagcccacatcaccaaggcaatcctaagccaaaagaacaaagctg
+gaggcatcacgctacctgacttcaaactatactacaatgctacggtaacc
+aaaacagcatggtactggtaccaaaacagagatctagaccaatggaacag
+aacagagccctcagaaataatgccgcatatctacaactatccgatctttg
+acaaacctgagagaaacaagcaatggggaaaggattccctatttaataaa
+tggtgctgggaaaactggctagccatatgtagaaagctgaaactggatcc
+ttccttacaccttatacaaaaattaattcaagatggattaaagacttaaa
+cattagacctaaaaccataaaaaccctagaaaaaaacctaggcaatacca
+ttcaggacataggcatgggcaaggacttcatgtctaaaacaccaaaacga
+atggcaacaaaagacaaaatggacaaacgggatctaattaaactaaagag
+cttctgcacagctaaagaaactaccatcagagtgaacaggcaacctacaa
+aatgggagaaaatttttgcaatctactcatctgacaaagggctaatatcc
+agaatctacaatgaactcaaacaaatttacaagaaaaaacaaacaacccc
+atcaaaaagtgggcaaaggatatgaacagacacttctcaaaagaagacat
+ttatgtaatcaaaaaacacatgaaaaaatgctcatcatcactagccatca
+gagaaatgcaaatcaaaaccacaatgagataccatctcacaccagttaga
+atggcgatcattaaaaagtcaggaaacaacaggtgctggagaggatgtgg
+agaaacaggaacaacttttacactgttggtgggactgtaaactagttcaa
+ccattgcggaagtcagtgtggcaattcctcaggaatctagaactagaaat
+accatttgacccagccatcccattactgggtagatacccaaaggattata
+aatcatgctgctataaagacacatgcacacgtatgtttattgcagcacta
+ttcacaatagcaaagacttggaaccaacccaaatgtccaacaacgataga
+ttggattaagaaaatgtggcacatatacaccatggaatactatgcagcca
+taaaaaatgatgagttcatgtcctttgtagggacatggatgaagctggaa
+actatcattctcagcaaactatcacaaggacaataaaccaaacaccgcat
+gttctcactcataggtgggaattgaacaatgagaacacatggacacatga
+agaggaacatcacactctggggactgttatggggtggggggcaggggcag
+ggatagcactaggagatatacctaatgctaaatgacgagttaatgggtgc
+agcacaccaacatggcacatgtatacatatataacaaacctgccgttgtg
+cacatgtaccctaaaacttgaagtataataataaaaaaaa
+>THE1
+tgatatggtttggctgtgtccccacccaaatctcatcttgaattgtagct
+cccataattcccacgtgtcgtgggagggacccggtgggaggtaattgaat
+catgggggcgggtctttcccgtgctgttctcgtgatagtgaataagtctc
+acgagatctgatggttttataaaggggagttyccctgcacangctctctt
+gcctgccgccatgtaagacgtgmctttgctcctccttcgccttcygccat
+gattgtgaggcctccccagccatgtggaactgtgagtccattaaacctct
+ttyctttataaattacccagtctcgggtatgtctttattagcagcatgag
+aacggactaataca
+>MLT1
+tgtggtagccagcctccaagatggcccccaatgatccctgctcctggtat
+tcacayccttgtatggtcycytcctacattgaryyagggctrgtctgtgt
+gaccaatagaatagggcagaggtgatgaratrtcacgtgattacgcgtac
+gtgattatgtaasattcagtctttgmcgtcattcttgccgagagactctc
+ctsctggtyttgaagaagtaagctgccacgtcatgagnnnncnnannaga
+rygccgcaaggcaagggnntctagagctgagagtcgcccttactgatggg
+aagtccacgtggsaaggaactgaggtctcctgccaacagccagcttcgac
+ytgccagccatgtgagtgagccatcttggaagcggatcctccagccccag
+tyaagccttcagatgactgcagccccggctgacatcttgactgcaacctc
+atgagagaccctgagccagaactacccagctaagctgctcctarattcct
+gacccacatgtggtaggcwgaataatggctccccaaagatgtccacgtcc
+taatccccagaacctgtgaatatgttaccttacatggcaaaagggacttt
+gcagatgtgattaagttaaggatcttgagatggggagattatcctggatt
+atccgggtgggcccaatgtaatcacaagggtccttawaagagggaggcag
+agggtcagagtcagaagaaggagatgtgacgatggaagcagrragngaaa
+actcaacgttgctggctttgaagatggaggaaggggccatgagccaagga
+atgcgggcagcctctagaagctggaaaaggcaaggaaacggattctcccc
+tagagcctccagaargaacgcggccctgccgacaccttgattttagccca
+gtgagacycattttggacttctgacctccagaactgtaagataataaatt
+tgtgttgttttaagccactaagtttgtggtaatttgttacagcagcmaya
+ggaaactaataca
+>MSTAR  
+gaawattggtactgaggagtggagcattgctataaagatacctgaaaatg
+tggaagcgactttggaactgggtaacaggcagaggttggaagagtttgga
+gggctcagaagaagacaggaagatgagggaaagtttggaacttcttagag
+acttgttaaatggttgtgaccaaaatgctgatagtgatatggacagtaag
+ggccaggctgacgaggtctcagatggaaatgaggaacttattgggaactg
+gagcaaaggtcactcttgttatacattagcaaagagcttggctgcatttt
+gcccctgccctagagatttgtggaagtttgaacttgagagtgatgatcta
+gggtatctggcggaagaaatttctaagcagcaaagcgttcaagatgtgac
+ctggctgcttttaacagcttacagtcatatgcgagagcaaagaaatcact
+taaagttggaatttatatttaaaagggaagcagagcgtaaaagtttggaa
+aatttgcagcctggccatgtgatagaaaagaaaaacccgttttctggaga
+gaaattcaagcaggctgcggagcgaccgtttgctaaagagattagcataa
+ctaaaaggaagccaagtgctgatagccaagacaatgggaaaaaggcctcg
+aaggcatttcagaaatcttcgaggtggtccttcccatcacaggcccagag
+gcctaggaggactgaatggtttcgtgggccaggcccagggccccgctgcc
+ctgtgcagcctcgggacactgctccctgcatcccggctgctycggctcca
+gccgtggctcaaagggccccaggtacagctcgagctgccgcttcggagag
+tgcaagctataagccttggtggcttccacatggtgttaagcctgcaggtg
+cacagaatgcaagagtgaaggaggcttggcagcctccacctagatttcag
+aggatgtatgggaaatcctgggtgcccaggcagaagcctgctgcagggac
+ggagccctcacagagaacctctactagagcagtgccaaagggaaatgtgg
+ggttggagcccccacacagagtccccaccggggcactgcctagtggagct
+gtgggaagggggccactgtcctccagaccccagaatggtagagccactgg
+cagcgtgcaccgccagcctggaaaagccgcaggcatcagactccaacccg
+tgagagcagccacgtgggctgtgcccagcaaagccacaggggcggagctg
+cccaaggccttgggagcccacccctcgcaccagcgtgccctggatgcgag
+acacggagtcaaaggagattattttggagctttaagatttaatgactgcc
+ctgctgggtttcggacttgcgtggggcctgtagcccctttcttttggccc
+atttctcccttttggaatggaaatatttacccaatgcctgtaccaccatt
+gtatcttggaagtaaataacttctttttgattttacaggctcataggtgg
+aaggaacttgccttgtctcagatgagactttggactttggacttttgagt
+taatgctggaatgagttaagactttgggggactgttgggaaggcatgatt
+gtattttgcaatgtgagaaggacgtgagatttgggggaaccaggggcaga
+a
+>MLT2B2  
+tgtgatggttaattttatgtgtcaacttgactgggctaargggtgcccag
+atagctggttaaacattatttctgggtgtgtctgtgagggtgtttccaga
+tgagattagcatttgaatcagcggactgagtaaagaagattgccctcacc
+aatgtgggcgggcatcatccaatccgttgagggcctgratagaacaaaaa
+ggcagaggaagggtgaatttgctctctctccttgagctgggacatccatc
+ttctcctgcccttggacattagaactccaggttctcgggccttcggacty
+cgggacttgcaccagcagccccccagattctcaggccttcggactcggac
+tgaryyacgccaccggcttccctggttctccagcttgcagacggcatatc
+gtgggacttctcagcctccataatcacgtgagccaattcccctaataaat
+cycytctatccatcctattggttctgtctctctggagaaccctgactaat
+aca
+>LTR1  
+tgatatgggagtgctgggaagggaagagcgtggtccctttaaatgataca
+gaagggggaaaggaagtgctgtgtggaggaggatgtggtccctggctagt
+actccaaccacacagacctaggttaaggacaggcatttttgttgcatttc
+ccaagaccaccctggcctgccatgcccccatcctgtgcctataaaaaccc
+aagaccctaataaggcagagatagaagcagctggacgtcatgaggaacac
+atcagtggaagagcacacaagcggctagtcatcaagagctcaccagtgga
+agagcagcccgataggcactggcacgcaggcaggtaccggcatgccagca
+ggccatcgactggcaaaatgatgccgaatttggctggagtggtcagagaa
+gagccaggtcactgagctgccggactccaggggaaaaccatctcccttct
+ggctcccccatccactgagagctatttctactcaataaaaccttgcagtc
+attctccaggcccacatgtgatctgattcttctggtacatcaaggcaaga
+aaccccaggatacagaaagccctctgtccttgtgacaaggtagagggtct
+aactgagctggttaacacaagctgcctgtagatggcaaactaaaagagca
+ccttgtaacacatgcccactggagcttcaggagctgtaaacattcacccc
+tagacactgccatgggattggagccccacagcttgcctgtccaaatgctc
+ccctagaggtttgagcagcagggcactgaagaagtgagccacacccccat
+cacatcccctgtgaggggaacaagggaacctttcctatttca
+>LTR2  
+taaggaaggagaccacctctcccattgtctcctgtttcatgagaaagcaa
+aaagttaaaaaaagaagcagaagtgagatcaatggccagatggtttagtg
+ccaagaaccaggcctggtagttaaacatcaactcctgacctaaccgcttg
+tgctatccatagattccagatattgtatgaggaagacttgtgaaactttc
+tgttctgttctgctagcccccatcactgatgcatgtagctctcagtcatg
+tagcccccacttgcacaatgtatcatgaccctttcacgtggacccctcag
+agttgtaagctcttaaaagggacaggaatctttactttggggagctcgga
+tcttgagacgcgagtctaccaatgctcccagctgattaaagcctcttcct
+tcatagaaccggtgtctaagaggttttgtctgtgactgttcctgctaca
+>LTR3  
+gttggaggccgaaagaatagggtcgtgaccaactcagtataccactggag
+gctatatgagcaaacagcaaactgttctcatgaatgcaggatgctggcaa
+gctgacaactgcatctgccaccagaaggaatgctgagggcagtcataccc
+cacgtgcagtgttccttgtggttatctataggaatatctggaggctgttg
+tataaagaaagcaattatgtgagcccgtgataaatcaagcagctgaccaa
+ccattacctcttcctccctgttgattctacctaataaatacaaagggctg
+tagaagctcagggcccttgttccctagaagaaaggagccgcctgtctcct
+tctttaaaacagatctttttgtctttgtcttcatttctgcatttgttctc
+ttttgttcagtcccaaaccgacagccata
+>LTR4  
+gaagcaggaaatataaaaggaaaaacaagtaaagggaaaacaagtccttt
+cctgaccagtctgactcactccaaagtcctgctggagctatgataattat
+ctgcaaggccaggcaggggctccgaaggagggctccaggagcagggatga
+gaaaaacaagttctccttatcagtttccctgtttgaaattctctccccat
+aacattattctttgttctgctctcacaactatttttgtaactatttctgc
+aagtctgtaaagattttgtaagttcttgtttttctttctgtagcatggca
+aggtcacaagacatgtttaagtaaggtaggctcatgttgcaaatcctgtt
+gtaaaacctgtcacggtatgattaactgcctttgttctgcttctgtaaga
+ctgctttctcacctcgcaggttttgcgccaaaaacccgacttgcccctgc
+ctgatgcatgtataaaagtcaagcccgtctttgttccgggctcagccttt
+ggatgttaatccgctgggccagtggccacctaaataaaaccttcctgttg
+cacccagtgatctctccggcctcctgatacccacaaca
+>LTR5  
+tgtggggaaaagcaacagaggtcagattgttactgtgtctgtatagaaag
+aagtagacataggagactccattttgttctgtactaagaaaaattattct
+gccttgagatgctgttaatctatgaccttacccccaaccccgtgctctct
+gaaacatgtgctgtgtcaaactcagggttaaatggattaagggcggtgca
+agatgtgctttgttaaacagatgcttgaaggcagcatgctcattaagagt
+catcaccactccctaatctcaagtacccagggacacaaaaactgcggaag
+gctgcaggggcctctgcctaggaaagccaggtattgtccaaggtttctcc
+ccatgtgagagtctgaaatatggcctcgtgggaagggaaagacctgaccg
+tcccccagcccgacacccataaagggtctgtgctgaggaggattagtata
+agaggaaagcatgcctcttgcagttgagacaagaggaaggcatctgtttc
+ccacccatccttgggcaatggaatgtctcggtataaaacccgattgtacg
+ttccacctactgagatagggagaaaccaccttagggctggaggtgggaca
+tgcaggcagcaatactgctttgtaaagcattgagatgtttatgtgtatgc
+atatctaaaagcacagcatttaatcctttaccttgtctatgatgcaaaga
+cctttgttcacgtgtttgtctgctcaccctctccccactattgtcttgtg
+accctgacacatctccctctcagagaaacacccacgaatgatcaataaat
+actaaggggactcagaggctggtgggatcctccatatgctgaacgttggt
+tccccgggcccccttatttctttctctatactttgtctctgtgtcttttt
+cttttccaagtctctcattgcaccttacgagaaacacccacaggtgtgga
+ggggcaacccaccccttca
+>LTR6  
+tggccagattcctgcttagattcatcactcacatcaaaaaggccaacaga
+gcccaacaagaaacataggtccccaagcataggccaggccccttaaaact
+gtgcctaagtcgagtgaagcctttagattaattctttttatttatctctc
+ttgtttatttccacctgttatgccctccgtgccttcctattcttctcact
+tctttcacgacaggacgtgtatttgcaaacactacttggaaggcaagaac
+ctccaagaaagtctcttttgcagtcgatttatgtgctttgttcccagagc
+ctgcccataaccttgaagaacaatgcaacctgccggtcatagaagcgggg
+aacatcaaccttgctacagggttcggacacacaggaagccggactggatg
+taaaaactctaaaagtgaaaaaaaaaggactccagagcattgacttttac
+ctctgtcctaaaaatcaccctgactctagttgtcacgattcttaccaatt
+tttctgccctcactggttttgtgtgaccctagcca
+>LTR7  
+tgtcaggcctctgagcccaagctaagccatcacatcccctgtgactagca
+catatacgctcagatggcctgaagtaactgaagaatcacaaagaagtgaa
+aatgccctgccccaccttaactgatgacattccaccacaaaagaagtgaa
+aatggccggtccttgccttaagtgatgacattaccttgtaagagtccttt
+tcctggctcatcctagctcaaaaatctcccctactgagcaccctgcgacc
+cccactcctacccgccaaagaacaacccccctttgactgtaattgtcctt
+tacctacccaaatcctataaaacagccccacccctatctccctttgctga
+ctctcttttcggactcagcccgcctgcacccaggtgattaaaagctttat
+tgctcacacaaagcctgtttggtggtctcttcacacggacgcgcatgaaa
+>LTR8  
+tgaaaccgtctttgcaaaattataactgagatagtgaaagagatttaact
+taactgcttttatcttgcttttaacctttaagctgtccttgtttattcct
+gggtgtgggctgaactaacttttggagaaacttagtttatagtttatagt
+ttaaacaaagacagtaacagccctttcccaagcagacctccttcatgcct
+ggggactagattgcttctgtaggactaatgttagcgaccaaattaaaaat
+tatggtttaggagttatgcagtttgaggctacaaaattttaaccctctct
+aaactgctcctaagatcagtgcttgagatattttgcagaccctgcccttg
+acggatcagctggcaccaaccagatcaatcaactggctcatctgatcttg
+cggcccccacccaggaactgactcagcgcaaaaagacagcttcaacttcc
+tatgatttcatccctgaccaatcaacactcctggctcactggcttccccc
+cacccaccaagttatccttaaaaactctgattcctgaatgctcagggaga
+ctgattggagtaacaataaaactccagtctcccacacagacggctctgtg
+tgaattactctttctccattgcaattcccctgtcttgttgaatcggctct
+gtccaggtagtgtgcaaggtgaaccccttgggtggttaca
+>LTR9  
+aaagaataaatcactgatataagagttaagaaaaaatcacttaggcagag
+agcaagggtatgggagtcctcagtaaggcttttatttttaatgaaaagca
+gccccaaatcattttctaacaaaaagcaccctgcaagctggaagtttgca
+caggtggatgctggcaggaactaaggattagatatgttcaagatggtggt
+tccatcttcccttctttgccagccaggtgtactgtaaaggagcagacaag
+atggcgctaatcaactggaaagcccagttgcataaaaagattaggcttcc
+ctgcgcaccatgcaaacgtcatatctgatcaaaccaatctatgagctcta
+tgtaaatcagacaccacttcctcaaactggactataaaactcgatggatt
+caccaccagctggtcttttccgcttggagaccccttcctctatagaggaa
+gctgtttctctttgtcttctctcctacccattaaacctctgctcctaaac
+tcctcatgtgtgtccatatcctaaattttcctggcacgtgacaacaaacc
+ccagtgtatacacaccccagacaacatagccacttcaaaatgggggctcg
+tctgggat
+>LTR10  
+tgttgtaaataaatttttggtgctgcaaaagaaataccactcaaacataa
+gtttaattttctcagcaaggcaattttacttctctagaagggtgcgactc
+gcagatggagcaatggccagagcacacctgaacaagggaggggaaggggt
+tctgattcctgacacaggtagcccctactgatgcgtcgttcccgtatcgg
+ctagggttggactgcacagtctaagctaattccgattggctactttaaag
+agagcaggggtatgagccagagtggcggggtgagtagtttggtgggaagg
+gtggtt
+>LTR11  
+tgtgtttctgcaggatgtacagccctcccagcacggtgctcgcttcccta
+atgccattccacagtatttgttgcagagaaggaaggcagcatgccaggac
+agatggagacaggactaatttggcctgaggtatgtaattttgaacttgag
+cctctctctgggactgtaaaactccaaatcaaagctaatctgagaataca
+tacatctgaaagatgattaggactgtaaacatctattaatattcaactct
+gatacaaagtacaagttgtttattcttaccacgcaaggccaaaaaagggg
+agaaaaaaaaaaaagcacacagcatatgcactggaaagtttcgcttattc
+aaaacagtatttgtcaagcacctccagtctggtgctgcaggggaaacaaa
+gattaaacagccaggcggacactgctctgcttccaaggtgcttacggtct
+taagaaggagacaagacatgtttataaatagccaaaatgcaacccagaaa
+aggctaaaaaacactgagagggagggagaaataaacgaagcaagaggtct
+ccggaggaagagatgaatgaattagcctattaataactccgtcactgtaa
+tcccaatgtaaagcaagaattccaaaccaggaaaggtcaaactgaagtat
+ttgaggaacacaggcgtcgcctaagcccttcaca
+>LTR12  
+tgtatctagttaatctggtggggagttggagaatctttatgtctagctaa
+gggattgtaaatacaccaatcagcactctgtatctagctcaaggtttgta
+aacacaccaatcagaaccctgtgtctagctcagggtttgtgaatgcacca
+atcagcactctgtatctagttaatctggtggggacttggagaatctttat
+gtctagctaagggattgtgaatgcaccaatcggcactctgtatctagctc
+aaggttgtaaatggaccaatcagcactctatgtctagctcagtgtttgta
+aatacaccaatcgacactctatctagctaatctagtggggacgtggagaa
+cttttgtgtctaactcagggatgtaaatgcaccaatcagaaccctgtcaa
+aatggaccaatagctctctgtaaaacagactgactttctgtaaaatggac
+caatcagcaggatgtgggtggggccagataagagaagaaaagcaggctgc
+ctgagccagcagtggcaacccgcttgggtccccttccacactgtggaagc
+tttgttctttcgctctttgcaataaatcttgctgctgctcactctttggg
+tccacactgcctttatgagctgtaacactcaccgcgaaggtctgcagctt
+catctgaagcagcgagacacgaacccaccaggaggaacaaacaactccga
+tgcgctgccttaagagctgtaacaccgcgaggtctcgagcttcactcctg
+agccagcaagaccacaaacccaccagaaggaagaaactcaggaaaacagc
+cgaacatcagaaggaataaactctggacacaccacctttaagaactgtga
+cactcgctgcgagcgtctgtggcttca
+>LTR13  
+tgtgggccgcaagccagggagctgcccaggcaagagcctgaaggcacaag
+ctgttccagtacagcaaagaaaataattagaataagaaaagttttactag
+agataggaaacggataggattatatctgactattattaatcattagtttg
+tagcatcactctttgttctattaccataatgatctctgttctattatgat
+taccttgggggaaaccaggccacacagagttaggagctgaagggccacag
+tgagaggtgaccagaagacgagagtgtgagccctcattcacgcccagaga
+agggccgctggagggctccttggcctagcggtaatgccagtgcctgggaa
+ggccctggttacttagcaggccttggtctagcggtggccccagtgcctgg
+gaaggcacccgttacttagcagacccggaaaggaatctccctctctccag
+gggagacagagaacgctccgctccaccacctcttgtgggaggtctgacat
+tagccaggccgggccgagtcatccggaggctccaacgtctgtctccctgt
+gatgctgtgcttcagtggtcacgctccttgttcactttcatgttcagcct
+gtgcacctggctcctccttttaagttcttagaagacagcagtagcagaac
+tagtaggagtaccacagtcttcgatctttctgataagtgcatagaagaaa
+cgctgacgtttgctgtcctccctctccacctcggctaccacaaagggaaa
+ggccccctgtccagtggacacgtgactcgcgtgacctatcgatcattgga
+gatgactggcactccttaccctgcccccttgccttgactacaataaatag
+cagcgcctccaggcactcggggccactacctgtctgtctccgcgctttgg
+tggcagtggtcccccgggcccagctgtctttcttcctatctctttgtctt
+ctgtctttatctcttcgatctctcgtctccgcacacacgcgaagagaaaa
+cccacagacccggtaggggtggaccctaca
+>MER1 
+caggggtccccaacccccgggccacggaccggtaccggtccgtggcctgt
+taggaaccgggctgcacagcaggaggtgagcggcgggcgagtgagcgaag
+cttcatctgtakttacagccgctccccatcactcgcattaccgcctgagc
+tccacctcctgtcagatcagcggtggcactagattctcataggagcgcga
+accctattgtgaactgcgcatgcgagggatctaggttgcgcgctccttat
+gagaatctaatgcctgatgatctgtcgctgtctcccatcacccccagatg
+ggaccgtctagttgcaggaaaacaagctcagggctcccactgattctaca
+ttatggtgagttgtrtaattatttcattatatattacaatgtaataataa
+tagaaataaagtgcacaataaatgtaatgcacttgaatcatcccgaaacc
+atcccccccccctggtccgtggaaaaattgtcttccacgaaaccggtccc
+tggtgccaaaaaggttggggaccactg
+>MER2  
+cagtcgyccctccgtatccgtgygttccacatccgtggattcaaccaacc
+gcggatcgaaaatattcaggyaaaaaattgyatggttgcgtctgtactga
+acatgtacagacttttttncttgtcattattccctaaacaatacagtata
+acaactatttacatagcatttacattgtattaggtattataagtaatcta
+gagatgatttaaagtatacgggaggatgtgcgtaggttatatgcaaatac
+tacgccattttatatcagggacttgagcatccgcggattttggtatctgc
+ggggggtcctggaaccaatcccccacggataccgagggatyactg
+>MER3  
+cagcgctgtccaatagaactttctgtggtgatggaaatgttctatatctg
+cgctgtccaatacggtagccactagccacatgtggctaytgagcacttga
+aatgtggytagtgcgactgaggaactgaatttttaattttatttaatttt
+aattaatttaaatttaaatagccacatgtggctagtggctaccatattgg
+acagcgcag
+>MER4
+gttrgngttrgngattgcnnntgtgaaaggaaaataaatctcgggrcccc
+maaatcactaagccaaagggaaaagtcaagctgggaactgcgtyaggcaa
+acctgcctcccattttattcctaaataagatagctacaaagataaaaggc
+tacatacctctctcacaatttycyacaaggaaattccttgcggacctcaa
+gatctttaccctaaaacagttctgytgamyttcaccttggcawtgyaaat
+ggrtacaggacaaaggtacagaactgaaagtcatccctctgctcacctga
+gacaaatgcatatctgattgcttcctctgccctattgtttatgtaaaaat
+gcagattcactgagccagactmaattgtgtattcagtgaaargctgatca
+rrgactcaaaagaatgmagccwtttgtctcttatctacctatgacctgga
+agcccctrcttcgagttgtcccgcctttccagaccgaaccaatgtacatc
+ttacatatattgattgatgtctcatgtctccctaaaatgtataaaascaa
+gctgtrccccgaccaccttgggcacatgtcgtcaggacctcctgaggctg
+tgtcacgggtgcgtccttaaccttggcaaaataaactttctaaattgayt
+gagacctgtctcagatacttttgggttcaca
+>MER5 
+cagtggttctcaaagtgtggtccccggaccagcagcatcagcatcacctg
+ggaacttgttagaaatgcagattctcgggccccaccccagacctactgaa
+tcagaaactctgggrgtggggcccagcaatctgtgttttaacaagcyctc
+caggtgattctgatgcatgctcaagtttgagaaccactg
+>MER6  
+cagcaggtcctcgaataacgccgtttcattcaacgtcgtttcgttataac
+gytgatgagraaaaaaatcgattcccggccggggccactgtctgtgtgga
+gtttgcacgttctccccatgtctgcgtgggttttctccaggtactccggt
+ttcctyccacatcccaaagatgtgcacgttaggttcaytggcgtgtctac
+atggtcccagtctgagtgagtgtgnntgtgtgtgtgagtgtgccctgcga
+tgggatggcgtcctgtccagggntggytcccgccttgcgccctgagctgc
+cgggataggctctggccacccgtgaccctgaamtggaataagtgnrttgr
+aaaatgaatraatgaatgartacgaattattataaaataaaaatttgtaa
+agtctatgntaatcttacacatacatgacaatacatgaaatggtaagaaa
+gtgatcagtgagcctgccatatatgttattgcttgtttctgaactgagtg
+gtgggaggaggtgttcctaacaatgttcactttgcagacatttatttctt
+tatttaatccattatcactatgaccactgtcattcagtkattcwccaaaa
+attgggtaaataattatcwtryttgtttttattaatctttcttaaatgta
+tgtatagctcacatttatttcagtgtttaatattagaagtgttttgggtc
+tttatttagaagtttggtgatgtttttgtgaccagaaatatgccatagga
+acttaactcttgtttatatcaattagcctrtggtaaaattggtttcgtta
+tacgtcgtttcacttaaagtcgcagtttccaagaacctatcaacgacgtt
+aagtgaggacttactg
+>MER7
+cagtcatgcgtcgcttaacgacggggatacgttctgagaaatgcgtcatt
+aggcaatttcgttgtgcgaacatcatagagtgtacttacacaaacctaga
+tggtatagcctactacacacctaggctatrtggtatagcctattgctcct
+aggctacaaacctgtacagcatgttactgtactgaatactgtaggcaatt
+gtaacacaatggtaagtatttgtgtatctaaacatagaaaaggtacagta
+aaaatacggtataaaagataaaaaatggtacacctgtatagrgcacttac
+catgaatggagcttgcaggactggaagttgctctgggtgagtcagtgagt
+gagtggtgagtgaatgtgaaggcctaggacattactgtacactactgtag
+actttataaacactgtacacttaggctatactaawtttatwwwwwwwwww
+wwwytttttcagcaataaattaaccatagcttactgtaacttttttactt
+tataaacttttgcatttttaacttttgactcttttgtaataacacttagc
+ttaaaacacaaacacattgtacagctgtacaaaaatattttctttcttta
+tatccttattctataagcttttttctatttwwaaatttttwattttttta
+ttttttaaaanatttttgttaaaaactaagacacaaacacacacattagc
+ctaggcctacacagggtcaggatcatyaatatcactgtcttccgcctcca
+cattttgtcccactggaaggtcttcaggggcaataacatgcatggagctg
+tcatctcctatgataacgatgcyttcttctggaatatctcctgaaggacc
+tgcctgagnctgttttacagttaacttttttttttaataagtagaaggag
+tayactctaaaataataataaaaagtatagtatagtaaatacataaacca
+gtaacatagtcatttattatcactatcaagtattatgtactgtacataat
+tgtatgtgctatacttttatacaactggcagcgcagtaggtttgtttaca
+ccagcatcgccacaaacgcgtgagtamtgagtratatgttgcactacaac
+gtcactaggcgataggaatttttcagctccattataatcttatgggacca
+ccgtcgtatatgtggtccatcgttgaccgaaacgtcgttatgcagcgcat
+gactg
+>MER8
+cagttgtccctctgtatanncgggggattggttccaggacccytgtgtat
+acmaaaatccgcgcatactcaagtcccgaagtcggccctgcggaacccac
+gnatatgaaaagtcggccctccatatatacgggtttcgcatcccgcgaat
+actgtattttcaatccgcgtttgattgaaaaaaatccgcgtataagtgga
+cccacgcagttcaaacccgtgttgttcaagggtcaactg
+>MER9  
+tgcgagaccagctcgactggggacagcctaacccagtggcactagaggaa
+ttaaagacacacacacagaaatatagaggtgtaaagtgggaaatcagggc
+ctcacagccttcagagctgagagccccaaacagagattacccatgtattt
+attaacagcaagccagtcattagcattgtttctatagatactcgattaac
+taaaagtatcccttatgggaaaagaagggatgggccgaaatgaaggggtg
+ggtctggctagttatctgcagcaggaacatgcccttaaggcacagattgc
+tcatgctattgttcatggtttaagaacgcctttaagcggttttccgacct
+gggtgggccaggtgttccttgtcctcattccagtaaacccacaaccttcc
+agcgtgggcgttanggccatcatgaacatgtcacagtgctgcagagattt
+tgtttatggccagttttggggccagtttatggccagatttgggggggcct
+gttcccaaca
+>MER11A  
+aggtgttgcgggaagtcagggaccccgaatgragggaccggctgragcca
+tggcagargaacgtrrattgtgaagatttcatggacatttatcggttccc
+aaattaatacttttataatttcttatgcctgtctttactttaatctctta
+atcctgttatcttcgtaagctgaggatgtatgtcacctcaggaccactgt
+gataattgtgttaactgtacaaattgattgtaaaacgtgtgtttgaacaa
+tatgaaatcagtgcaccttgaaaaagaacagaataacagcratttttagg
+gaacaagggaagacaaccataaggtctgactgcctgcagggtcgggcaaa
+aagagccatatttttcttcttgcagagagcctataaatggacatgcaagt
+agggaagatatcgctaaattcttttcctagcaaggaatattaatattaat
+accctgggaaaggaatgcattcctggggggaggtctataaacggccgctc
+tgggaatgtctgtcttatgtggttgagataaggactgagatacgccctgg
+tctcctgcagtaccctcaggcttactagggtggggaaaaactccaccctg
+gtaaatttgtggtcagaccggttctctgctctcgaaccctgttttctgtt
+gtttaagatgtttatcaagataatatgtgcaccgctgaacatagaccctt
+atcagtagttctgtttttgccctttgccttgtgatctttgttggaccctt
+atcagtggttctgcttttgccctttgtcctgttccctcagaagcatgtga
+tctttgttagacccttattagtagttctgctttttgccctttgaagcatg
+tgatctttgtacccactccctgttcttacaccccctccccttttgaaacc
+cttaataaaaaacttgctggtttgaggctcaggtgggcatcacagtccta
+ccgatatgtgatgtcacccccggcggcccagctgtaaaattcctctcttt
+atactgtctctctttatttctcagccggccgacacttagggaaaatagaa
+agaacctacgttgaaatattgggggcgggttcccccgatactaattntct
+t
+>MER20  
+cagtggttctcaaccgggggtgattttgccccccaggggacatttggcaa
+tgtctggagacatttttggttgtcacaactggggggggggratgctactg
+gcatctagtgggtagaggccagggatgctgctaaacatcctacaatgcac
+aggacagcccccacaacaaagaattatccggcccaaaatgtcgatagtgc
+caaggttgagaaaccctg
+>MER21  
+gccctyctrttkcagraaaacctctctcaaaccatgttttycctctgcts
+tcataccacgacaacagtcgtcaacacagaagacttctgtgaccaaatgt
+gtggaggattttccccacacaccaagcagcagacaccagctgggcgtcct
+ccaaytcagttccgacactgtctacctggagatagcgtcagatcccacag
+gttgaggtctcagtccccaagactgnccccaccttcagayacagttgcaa
+gyccgggyctctggaacttctgaccaactggcttcaarttggggttccca
+cgacacctctttaggttcgaytaatttgctagagtggytcacaaaactca
+rrgaaacacttattawgtttactggtttattaatagatgatatttcaaag
+gatacagatgaagagatacatacggggcggtctggaagrkcccagcgcag
+gagcttccgtcytgatagrrttggggttacaccctccagattcttcacct
+tctgtyagcctccacgtgttcagctctccagaagctcyctgaaccctgtc
+ctttgggccttttatggagayctcattggntgtccatgactgaagcatgg
+acgaytgnnawaatgtgattggrcaaaaagggtctgatctaatcccagca
+aggyctgtccagattcttcttggtctctttgtgcagcattccttcctcca
+gggtatggggcaggaccycctctggaatgagggtcttacgacccacaatc
+agattatagagtcctgccttgggcggmtgaaargaggrcargagaaggyc
+agagaratattctgtttcctgaggcctaaagcacctctacattatagcga
+aagactgtaaccatggtcatgtgagttatggacaagaaccatggacaaaa
+acacatatacaatcatatcccacctcccaacgc
+>MER22  
+gagctctgggcttccatacctgtgtgggacagggaagctctctcggtctc
+catggcccaagtgatggctgcacgctcggtccaggaagaggcggaggaag
+cccaccgctcctgacattggccttctaggaaaggcggtgttgcatcccac
+ctgcacttcctctctgattcttgagggccaaccgcttcctccgctcctgg
+ggaaagtgccttctagcaccgaatcttttggctgccacggatgtcaggga
+gccaacgggactgggttttggctgggtgcaggggaggttgcgtcaggggt
+actagccggcggcgggctgggggtggggtgtactttgtccaaactcccgg
+ctcctctggcgggcctccctgaacgtggcgtggactcgcgcacaggccct
+gtctcgcaggttttcaggtgcgcttggcttttcctccgctttgtggggca
+ggtctccagtgcccccggcgcacgcctggacatcactgtccgtctcgtcg
+tcgcccctacggcctcaaagacacacgctgcctgcatgtgctcttggggg
+acgacagtgcacatgtggacacactggctccagctcggactcgcctctgt
+ctctctttgcccgtgtcgccggaagccgcctcgggttgccggagccctcg
+ggccttggagatgaaggcaggcccctgctcctgccaggaaggagggaggc
+agtgggctcatgggtcggtgcctttgcagccgacagcacgtgcggccctg
+gggatcttcctgtgccccggcgagaccctttccgcctcactgcattggaa
+ccccattcccgatcacccgctgggatccatcatcggactccaagaggagt
+ccgcgcagccagccggcaccccgaagctcctccttcagcgggaaccgaag
+cagaagagcgatcaaggaggtcctcaccacaggactcctatgggtccgac
+cctgggtctcccgcaggcccctctggcagtcctcttcccacccgccgcct
+cggcttcgccgccgccgccgcaacctccagcaccgccccccaggccccgc
+agccgccgtcgccgccattttttaaagggtcgcagcctgactctgcggag
+taagggggggtggagcgggggagtcgctcgccagcatgcgcgagcccgag
+ccgccgcttgggtcacagtgaaagccaccgttgcccggggatgggtccct
+gacacttggggaagtaggagccctgtgtgatcgtgcgtctgagtctgggc
+tgagaccagtcctggccagggcagttaccaggacggtctcggaggccggg
+attcgcggagggtccagcagcaggaagaaaccccaggaggaagaaacctc
+agacagatcgccggcgaggcagcgcgggatcccagcctcaggcgtgcgcg
+gacggtgtgcgggtgagtctccccaaaagtggagcccttgtgatgacgag
+cacaggtccgcctgcgtgcccgtgggcggctctctcaccggtggctctca
+gtcgcggagagcagaacccgcagcttcaggggctgctgcgggagggtgtt
+ccctgctgtacgt
+>MER25  
+acaaantagggaaaaatggcggataggaggcaggactaaattgcagctcc
+cactcggatggacagagcagcatgtggagactcacatcgtgaacttttgc
+tccaagaaccaccgcaggaatataycaagaaagccgagagaatycacaga
+ccctctgaaggaagcagattgctcctgcargayccaggaaacggcccaaa
+aactgtgagtgcccaaagtgtgagaagggraaaatctgcccccgaacaca
+catcctyactggggaacctgaagatccagatcacaggagaaggatttgac
+cttacctggagctgagacaatttagagggccgagcaaaatacaggggtag
+aggaagcagcgggaaaagccccgtgggcactcccagtcyyyagnnaarcc
+cagggaagccatttctgacttatctcacaggggtcccttgggagggcagc
+cggaggaactgggaaagggscacagggaaaagaaaacctccagctgaact
+ttgtaataattccgaccgakagagaaatttcctggccagaactmagggca
+gggcgrcgkaagtgctggtgggagaccagaagtgctgttgggggggacac
+ggtrggagtgagacytgccttttgagctgcatgggagctgggtgaggcct
+gtnactgccagctttcccccacttycctggtgacctgcatgacacagaag
+aggcagccataatccccctgggaacgtaactccattrgcctgggaactac
+acccccatccctcacagtagccgcagcaagccccgcccaaggagactctg
+agctcagacatgcctaaccctgcccccacctgatggtctttctctaccca
+ccctggtagccgaagacaaaagacataawctcttgggagctctayggccc
+cacccatcgcctgagaaacwgaaatayttaycywggcmamcttagggcaa
+gcttrtatccwccctatactrtcgcagctgatgccctcttgaaagcgcca
+cctcttggctggaggccaaccaactcaagacattacagcaaytcayraca
+gaataaccctgcccctarrraaggagaaaacgacagctatcaccactgcc
+tgcaacatcctggctaaccagaggtcctgagtctgtccacgtgayaastt
+cactrctakyataaccagcattcgagaaarccagcacactaagtctatct
+acaaccaaggaatctcacagagtctayttcactcccctgccacctccatc
+agagctggtgctggtattcaccgctgrgagacttgaagacaggtcacatc
+acwggatycyttgcagacattccccagyaccagcccggagtctggtagct
+ccactgggtggctagayccagaagagcaataacgatcactgyagtccggc
+tctcaggaagtcccattcctaggrgaagggggagagcaccacatcaaggg
+aacaccctgtgggacaaaagaatctgaacggcagsccttgagtcccagat
+cttycctctgacatagcctacccaaatgagaaggaaccagaaaaayaatt
+ctggtaatatgacaaaacaaggttctttaacacccccaaaaratcacact
+agctcaccagcaatggatccaaaccaagaagaaatcyctgaattgccaga
+aaaagaattcagaaggtcgattattaagctactcaaggaggcaccgagga
+aggtgaanaccaacttaaagaaanttanaatataatacaggatatgaatg
+raraaatctycagwgaaanagatagcataaakaaaaaacaatcamaactt
+cwggaaatcgaagyacacttatagaaatgcgaaatgcwctggaaagtctc
+arcaatagaatngaacaagcagaagaaagaacttcagagctcgaagacaa
+ggytttcaaattaacccaatccgacaaagacaaagaaaaaagaataagaa
+aatatgaacaaagcctccaagaagtctgggattatgttaaacgaccaaac
+ctaagaataatcggcgttcctgagnaagaagagaaatctaaaagtttgga
+aaacttattcgnggaaataatcgaggaaaacttccccgrcsttgctarag
+ayctagayatccaamtacaaagaagctcwawraaca
+>MER30  
+caggggtgtccaatcttttggcttccctgggccacactggaagaagaaga
+attgtcttgggccacacataaaatacactaacactaacgatagctgatga
+gctwaaaaaaaaaaaamaatcccamaaaaatctcataatgttttaagaaa
+gtttacgaatttgtgttgggccgcattcaaagccatcctgggccgcgtgc
+ggcccgcgggccgcgggttggacaagcttg
+>MER31  
+caccctgcgtatctgaycaggttcctcartctccgccgtcccccaggtaa
+tgtttgrtcacctggcctgccttcagctagaatcctrttaggtcagttta
+gcagaatctccttactcctgatgtttcctcttrgtaattttccatccact
+gcccccgyactctgctcyttggctataaatccccacttgtccttgctrta
+ttcggagttgagyccaatctctctcccctaccgyaagacyccattgcagt
+ggtccctgtayctrtcgnratggtcctgaataaagtctkccttaccatgc
+tttaacaagtrtyattgaawaatttttttt
+>MER33  
+ctgcgctgtccaatacggtagccactagccacatgtggctattgagcact
+tgaaatgtggctagtccaaattgagatrtgctgtaagtrtaaaatataca
+ccagatttcaaagacttagtacgaaaaaaagaatgtaaaatatctcatta
+ataatttttatattgattacatgttraaatgataatattttggatatatt
+rggttaaataaaatatattattaaaattaatttcacctgtttctttttac
+ttttattaatgtggctactagaaaatttaaaattacatatgtggctcgca
+ttrtatttctattggacaacgctg
+>MER34  
+taggggagtgagagatcacctccaaccctccctcccctttgctcttatgt
+gggctctttggtgaatctaggaaccaaattgacacaaggcagattaacaa
+gagaaaagcatacaaatttcattagttttacatgtgcataggaaycctca
+caaaagtcaagyccagagaagcggccaaagtaagatgcytttatactttt
+tnnacaaagnacaataarytnnrraartgtcagaagaaaggggatctggc
+taggggcagtaaatttctcgcggagtcattaggagaaaagtgtgtgtgtt
+ggggtgtaaacttagtggaagataacggttacttcggaaagtatattcag
+gtccaaagcagcccccagtttcgtctctggtgataggtgctattttctcc
+ctctggtaagggacgggtactccagaggaatcctggaggaagctttatgc
+gcttgctgcatgcaggaagagataggtcatcaaaccttttctgaaactac
+aatttctccaatattttcaactcgaaataatcaatgtaccaattccatat
+atttttgggatggcacatccatcagtccttc
+>MER35  
+gatgtggcgtttgagtggacacgggggaagaaacaagtaatatgaataac
+atggtgagacagaaagagttgtggacagagctgtgggaaatatgagagat
+aaggagagagatactgaaaagagcgttaagagagatgaagatagggtgtc
+tggcccatgaaggccctcgtgaagagcaatgctgaatagatgaatgaacc
+tcaatgcccagcagtggtgggatgaaaaggggatcctgtgcagaaaccac
+actacccatcagagaagcaactctgctcgtttccccttga
+>MER39  
+gggcattannnctgtaggggcagaaaggtgtgatnccttccctacccatc
+ataagggtcacggcnnacactcctataataaaanayaggttagcaagaga
+aaagcataayagatttatttaatcaaagttttatgtgacatgrgagcctt
+cagaaatgaagacmcaaakactcagggaaaactctatttttatgyttaga
+tttgatgaagaatgganagctgcgcagaaatgtgattrgacaaaaggggw
+atgatctaatggtmataractgrgtgtggraacccagcaaggcttgtctg
+ttcgtattcttcttggtctmtctgtgcggcattccttcctcccgggtata
+gggcgggaccccttctggaatgagggtcttatgacctacwatcagacgag
+ataggtcagawaatttctttacggscagcycyaagacagaaaggcgggkr
+awgattagagggcnagagaaggtcagaaaatgannttctgtttyctgagg
+nctgcttctgaggcttagagcgccccaacattntaacaaaagnctgtccn
+tcacctttaccgctctgaagctgttccaaagctgctacatgaaccaagga
+caaaaagccanatanttcaacaaaagatatncttatngttttagtcactc
+aggaaacagcaaggcttataggagctgagaacccggaattatg
+>MER41  
+aacctgccaagaacagaaactggcagaatctgtcacaagaaaaagtccca
+atcagacttcaagagagggttcttggatcttgtgcaagaaagaattcatg
+gggagtctgagtaaagtgaaagcaagtttattaagaaagaggaataagag
+aatggctactccaaagacagagcagccctgagggctgctggttgcctatt
+tttatggttatttcttgattatatgctaagcaaggggtgcattatttaag
+cctcccctttttaggccatatggggttatatcctgatgttactatggcat
+ttgtaaactattatggtgctggtgggagtgtagcagtgaggacgaccagc
+agtcactcccatggccatattggttttggtgggttttagccggcttcttt
+ctgcaacctgttttatcagcaaggttttaaggacctgtatcttgtgctga
+cctcttatctcatcctgtgacttagaatgccttaactgtctgaggatgca
+gcccagtaggtttcagccttattttactcagctcctattcaggatgaagt
+tgctctagttcatatgtcttagacatttcctccttcccttt
+>MER42 
+atgtayagkaggattgatcaaataagtaaacgtattnaagataatgggag
+ccaggtttctcactgtcggagaagggagttacaaatatggaaagggrgaa
+grctagaatgaaccctgtggtattrgattrgaattggaggtatcagtrtg
+aactcatgrtttttaatatayryryryryrtttttcctagtcctgtccac
+tgagagggcctagaagcaacgacaccccagtagcaacgagcacacctagc
+acccagatcttggtttctaaataccattctccactaaaaggaaccagggc
+tccttggagaaatggctgattctaggactagggcaggaaatgtacaagat
+gagcctggaacatcttgttrtgccagaaaataaggaagtgctcaaaaaac
+gatrrgggcatrtcaaaaggacacagaagccagcttgaaggggctcccac
+tggccaaatctgggacaatttgagcatcaaaataaataatrgtagtaatg
+gattataactcattgaataaaataaatatccatgagttcatactaatata
+aataaatgaataaaawaaataaatgagaarggaaagctcttcttacagtn
+gaatgccaantaataaatntagaargaataataatagaaaaatcaccatt
+aggcaaayaccgcagtaataactgtttyaggcaagatccatcgatagatg
+ctmtaattagtgggcgaaartttgatgagaaacggratatttgcatagtc
+tcaaagtatctcctcacaagatatttattaattacaaagggaaaaayagt
+gactttacagtagagaaacctggcagacaccaccttaaccaagtgatcaa
+rgttancatcaccaaaaatgagacaaaytgacatcatgcgcyncctgatr
+tgatgcgccgagaagaacaacatsgcttctgtgatattcctgccaaagat
+gcataacctgaatctaatcatragaaaatatcagacaaacccaaattgag
+ggacaktctacaaaataactggnctgtactcatcaaaartgtcaaggtca
+taaaagacaargaaagactgaggaactttctacntttgacggaagactag
+arncatgacaactaaatgcaacgcgggattctgrantggatcctggrtcg
+agaaatagtgggagtttktayctataaaggacattattgggacanttgrc
+gaaatttgaatanggtctgnagattagataatagtattgtatcaatgtta
+atttcctgattttgataattgtaytgtggttatgtaagagaatgtccttg
+tttttaggaaanacacactgaagtatttaggggtaaaaggncatsatgtc
+tgcaacttactctcaaatrgttcagraaaaaaaatnnatatayataarya
+gagaatgataaagcaaatgcggyaaaatgttaacaattggtgaatctggg
+tgaagggtatacgggwgttctttgtactattcttgcaacttttctgtaag
+tttgaaattacttcaaaataaa
+>MER43  
+cccaagcccagtaacgctgtggctcttgcagactcntagaggtactgcct
+tnrtggtcttggataagatctggaagaattccctggattaccaggcagag
+actcttgttctcttcccttactttctcccaaacaaacaaatggagtctct
+ctctctntctgtgctgagctgcctaganctgngggwggggtgacacaagc
+acccctgtggccaccaccactgggactgtgctgggtcagacctgaagcca
+gcacagcattgggtctcaccca
+>MER44C  
+cagtagtccccccttatccacgggggatacgttccaagacccccagtgga
+tgcctgaaaccacggatagtaccgaaccctattgctatcagtcttttgga
+acatgtttctgttcatgtcttctgcccacaaatttaatgcctcttccacc
+tcaactaaacacgtatcatgcactccggccatcacttttgcagtttgagg
+tatgacatcaaaactagcatgaatttatttttccttcttcacaattccaa
+agatggaagattctttcttaccgtagatcttagcaacctcagcatacgat
+tatttttcytttctttttaagtcaagaactttcaccttttcgcttaaagg
+aagcactttacagcttctytttggcatgtccgaattgccaccaacactac
+tcttgtgcttttgggccattattaagtaaaacgggagttacttgaacaca
+agcactgtgataccaagacagtcggtctgataactgagatggctactaag
+tgattaacaggcaggtagcgtanacggcgtggatacgctggacaaaggga
+tgattcacatcccggatgggacggcgcgaaatttcatcacgctactcaga
+acggcgcgyaatttaaaacttatgaattgtttatttctgnaattttcaat
+ttaatattttcggaccgcagttgaccacgggtaactgaaaccacagaaag
+traaaccacggataaggggggactgctg
+>MER45  
+caggaccggctacataatttgcgggrcccagtgcaaaatgaaaatgcggg
+gccccttgttcaaaaattattaagaatttcaagacggcgacagcagagca
+ttaaaccaagcacggggcccttctragcgcggggccctgtgtgactgcac
+aggtcgcacgcccatgaagccggccctg
+>MER46  
+caggttgagtatcccttatccaaaatgcttgggaccagaagtgtttcgga
+tttcggatttttggattttggaatatttgcattatacttaccggttgagc
+atcccaaatctgaaaatccgaaatccaaaacgctccaatgagcatttcct
+ttgagcgtcatgtcggcgytcaaaaagtttcggattttggagcatttcgg
+atttcggattttcggattwgggatgctcaayctg
+>LOR1  
+tgttactgaacaccaggggttcggtctaggtcctgctgctcgccacacag
+aaagccaatcactgagacaataagtattgccaaggaagaaggctttaatc
+gggtgctgcagccgaggagacgggagatcagtctcaaatccatctccctg
+accgactaaaattaggggtttatatagcagggaagaaatgtaaccgtgtg
+tgggaaaacaggaattagggaggggtaaggaagagaatttggtcaacagg
+aagcaggtggtcagttaggcaatcatgatgggtgaggggtctgacgtctc
+attgtccggatgcagtgatctggtaagtttcagctccttgatactatctg
+ggaggcctgatggttggtttcctgaaaaaggaactcagataagacaaatg
+taactttctcgagttttaagactgggagaatcartttctatgtttattca
+aagaaaccataaacatcagttctatgggacaattgggtcagtttcaattg
+>ALR  
+aattctcagtaacttccttgtgttgtgtgtattcaactcacagagttgaa
+cgatcctttacacagagcagacttgaaacactctttttgtggaatttgca
+agtggagatttcagccgctttgaggtcaatggtagaataggaaatatctt
+cctatagaaactagacagaat
+>MSR1  
+agtcaagacccccagcccctcctccctcagacccaggagtcaagaacccc
+cagcccctcctccctcagacccaggagtcaagaacccccagcccctcctc
+cctcagacccaggagtcaagaccccccagcccctcctccctcagactcat
+gagtccagacccccagcccctcctccctcagacccaggagtccagacccc
+cagcccctcctccctcagacccaggagtccagacccccagcccctcctcc
+ctcagacccaggagtccaggccccacccctc
+>TAR1  
+gatcaacagtgaggaggtcccacaaggctaagtggggcaagtcggggacc
+taaggcagtagcaggaaaaccaaagaaaacaggcggagacttgagacaga
+ggcaggaatgtgaagaagtccaaaataaaaatccctgcacaggactctta
+ggctgttatcatgcactatcagcctactcctccctatttttgtacaataa
+gctctttacactgtatttcttttcaatgaagttatcttccatctttgtac
+tgcctcttggtgaaaagctgtcttccaagttaataactgggacatcagct
+ctctgcagtaatagctccttttcagttttaatttgcagaactgatgggga
+ttaataactggcgctctgactttaagtggtgcaggaggcggccagtaggg
+gacgccagccgttacgccgggagcaagagggccctgcgtagtccccatct
+gcctgcatgtggcgtgcagccacgacaatggcagcaagagggcccggcag
+tgtgcccagctgccagcaggcgggtgtgctgccactataatgtgaggaag
+agggccctgcaatgtccctagctgccagcaggcggcgtgccaccactata
+ctgcgagcaagagagccctgccgtgccccggcgccagcagggggcgctgg
+acagcactgtaagcaagagggccctgcagttgtcctagtcgccagtaggg
+gacgcaatggcagagcaccgtgggcaagctggtcctgtagtgcccggctg
+caagcagggggcgcccgaaacgggcttttcagattactcaggttccactc
+gtctctgcgccgccggggacgtgtgtctctgcgcgtgcaccgcgccaccc
+ccgcgctccccgcccggcggcgcgcgactgtgcgactgcaacactccccg
+ccaccctcagcccagcgacgtgcgtctctgcgcctgcgccgcgcctcact
+cccgcccgctcagcgacccctcccttccggggaggcgccggcgtgcgtct
+acgccctgcgccgcgtctccccaacagcggcgcgcctctctgcgcctgcg
+ccggcgcgccgcgcctctctgcgcctgcgccggcgcgccgcgcctctctg
+cgcctgcgccggcgccccgcgcctctctgcgcctgcgccggcgccccgcg
+cctctctgcgcctgcgccggcgccccgcgcctctctgcgcctgcgccggc
+gccccgcgcctctctgcgcctgcgccggcgccccgcgcctctctgcgcct
+gcgccggcgccccgcgcctctctgcgcctgcgccggcgccccgcgcctct
+ctgcgcctgcgccggcgccccgcgcctctctgcgcctgcgccggcgcccc
+gcgcctctctgcgcctgcgccggcgccccgcgcctctctgcgcctgcgcc
+ggcgccccgcgcctctctgcgcctgcgccggcgccccgcgcctctctgcg
+cctgcgccggcgccccgcgcctctctgcgcctgcgccggcgccccgcgcc
+tctctgcgcctgcgccggcgccccgcgcctctctgcgcctgcgccggcgc
+gccgcctttgcgagggcggagttgcgttctctttagcacacacccggaga
+gcatcgcgagggcggagctgcgttctcctctgcacagacttcgggggtat
+tgcgaaggcggagcagagttcttctcaggtcagacccgggcgggcgggct
+gagggcactgcgagggtggagctgcgttctgttcagcacagacgtggggg
+gcaccgtaaaggcggagcagcattcttctcagcacagacgttgggggtac
+tgcctgcctttgggataactcggggccgcatcgagggtgaataaaatctt
+tcccgtttgctgccctgaataatcaaggtcagagaccagttagaacggtt
+tagtgtggaaagcgggaaacgaaaagcctctctgaatcctgcgcaccgag
+attctcccaaggcaaggcgaggggctgtattgcagggttcaagtgcagcg
+tcagaactcaaatgcagcattcctaatgcacacatgacaccctaaatata
+acaggcatattactcatggagggttagggttcaggttcgggttcgggttc
+gggttcgggtt
+>CER  
+ctgcagaacactacttccagggtctaaatgtctgtccttcacataggatt
+ccagaacactgctacgagagtgtgaatgtttgtccttcacatagcatttc
+acaactgccatggtctgaatggttgtccctcacatagtattccagaacac
+tgctatgagggtctgaatgtttgtacctcacataggattccagaacactg
+ctatgagggtctgaatgtttgtacctcacataggattccagaacactgct
+atgagtgtttgaaagtttgtccctcacataggattccagaagactgctgc
+tggggtctgaatgtctgtccctcacatcggattccagaaccctgctgctg
+gggtttgaatgtctgtccctcacatagaattc
+>BSR  
+gatcagtgcagagatatgtcacaatgcccctgtaggcagagcctagacaa
+gagttacatcacctgggt
+>HSATII  
+antccattcgggtccattcgatgatgatcacactggatttcattccataa
+ttctattcg
+>HSATI  
+gantcngctcnngacacaactctctgagccttcggtgacctttcngtctn
+gtgtaanngcactcntgtcyycctggcagcagttggacctcgcgatgtgg
+attgtgccctcacccagcnntntttatgccctntcnccatggtgacngga
+ttaggggtctcctgctcttcnntcctaaggaccactgtctgtgctgtgtc
+tttcaaaggtcagaagagattgnacctttgtgtttttattttccctgtgt
+ttgctttttctcnntggggaacctgtgttgctgctttgaaggtatattca
+tactggccnntcanntgnncaacatcnncaaantnactagttanggcttt
+caaaatatgntatttcaaaaaattanccgtctgtattttccatatgcagt
+tataagtaggtttcatcggttatgttttattcctcagtttatacatttga
+ttattgtaccaagcagagtacctttgaaattttttttcatttaaaaaata
+tggatctttaaaaaaaaattatatatgatatatattacatgttatgtgct
+atgccttatntgtaacatataacctcatatattttntatgtcatagtata
+taatatttatcctgtgtcatcttatatatac
+>SAR  
+acataaaatatcaaagtacatcaaatatatattttattctgt
+>SN5  
+cttcccttcagggacctcaaagtgaccagcttccccttgaagaatgactc
+tccaaggcccaggagcccagcttctgggcctccaagccaggccatctggc
+gagggagtcggtggacgtgccctggcttcttccatgttgagttggtacta
+cccaccaaggggggtagagaggcgagcagatgttgtctctggcctgtgtc
+ttgttatcatggtgctgactaggcctggtacagggccctgatggggttgt
+cctgggtggtcacgggggtgatgagaagaagatgcagaatggattgctgt
+gaggatgaatgagacgactgtcagtacagacaggcacacggtgaagtgtt
+cagggattcccctcagtagctgcccagacccaaaacctgactcctgagtc
+acgttactgtcccactatacgttaagaggagggaaagctgggtcgcgcag
+gtccc
+>HY3  
+tagtcaantgaagcagcgggagtggagaaggaacaaagaaatttgtaact
+ggttgtgatcaattagttgtaaacancgctgcactccaaccagcc
+>HIR  
+gattcccaggtgcacagagatcctaatccgcatccatcgaaatctcacaa
+agtgtccataaatcactcagggagggcccccatggatacagggccgtagt
+aggatgctcctatagtgggcattaatatgagaatgaccgaaaagtgcatt
+taggaccatattataattttcgggttcccaggtgcacgtttccaataacc
+aggtgcacggatgtatagggtcccccccatggatagaggtccgtgttagg
+gtgctccatatcgggcatgaatatcaggaacaccggcatgtgcacttagg
+accatgttttaatttttca
+>7SK  
+gatgtgagggcaatctggctgcgacatctgtccccactgattaccagggt
+tgattcggctgatctggctggctaggcgggtctcctcttcctccctcagc
+cctccatgtgtgtacctcctgaagcggactggtcttcagtcaagggtaga
+cgagtagctgtgctcccctgctagaacctccaaacaagctctc
+>KER  
+agctcatctgtccactgaagatgcttggacagagttaggaatgcttcctg
+ggagaggtaacatttgagactttcctggaagaatggtcagagtaaaccaa
+gtaagtaggaatggaaagaggatgggaggccccagcttcccagaggcata
+aggtgaggangnccctatgcattcagatgtggcccaccctggggtctggt
+ggactaaagncttggacaccccagatcagccttagtgggatgaggcagga
+aagacagctgagggtcagaacccaggcaggtccaatgccagggtgggcat
+ttcgagttggtgagacatttcaccctggtgccaagct
+>XTR  
+ttaatttgagagaaattaattattctgcaacttagggacaagtcatgtct
+ttgaatattctgtagtttgaggagaatatttgttatatttgcaaaataaa
+a
+>XBR  
+aattgataggtcacgttctcactctatttgcctttaagggaagaaagcaa
+tcaagttaatatgttttccttcattgtatagtatgtaactacggacacta
+ttagaggagggatttgtgtagcacttaggacattatacttgataatttcc
+aagggtctttctagatttaaaagtctgattctaacgtagtaataaaaata
+aaggcccaattttctctttaatattgcctgaagatattactctattattg
+cattaaaattaaacattcacacattgtttgcactgctaaataaaattatg
+taa
+>Mariner1  
+ttaggtcggtrcaaaagtaattrcggtttttgcaytgttggaatttgyca
+tttgatattggaatacattcttaaataaatgtggttatgttatacatcat
+tttaatgggcatttctcgctttacgtttttttgctaatgacttattactt
+gctgtttatttkrtgtttattttagactatgnaaatgatgttagacaaaa
+agcarattcgagcgattttcttattcaagktcaaamtgrrtcgtaaagcg
+gcggagacaactcgcaacatcagcaacgcatttggcccaggaactgctaa
+taaacatacagtgcagtggtggttcaagaagttttncaaaggagacgaga
+gccttgaagatgaggagtgtaatgacgggccatcagaagttgacaacgac
+cagttgagagcaatcatcgaarycgatcctcttacaactanacgagaagt
+tgctgaagaactcgacgttgaccattctacggtcgttcggcatttgaagc
+aaattggraagnaaaaactcgataagtgggtgcctcataaagtgagcaaa
+actttttnaaattgtcattttaaagtgtcatctcttattctatgcaataa
+caacgaaccatttcttgatcagattgtgacgtagaacgaaaagtggattt
+tatacgacaaccggcgacgaccagctcagtggttggaccgaaagaagctc
+caaagcacttcccaaagccaaacttgcaccaaaaaagtcgcggtcgcggt
+ctggtggtctgctgccagtgtgatccaccacagctttctgaatcctggca
+aaaccattacatctgagaagtatcttcagcaaattgatgagatgcaccaa
+aaactgcaatgcctgcacctggcattggtcaacagaaagggcccaattct
+tctccacgacaacgcccgaccgcacgtygcacaaccaacgcttcaaaagt
+tgaataaattgggctacgaacttttgcctcatccgccatattcacctgac
+ctctcgccaacaaactaccacttcttcaagcatctcgtcaactttttgca
+gggaaaacgcttccacaaccagcaggatgcagaaaatgctttccaagagt
+tcgtcgaatcccaaagcacggatttttatgctacaggaataaacaaactt
+atttctcgttggcaaaaatgtgttgattgtaatggttcctattttgatta
+ataaagatgtgyttgagcctagttatgattatgatttaatggccaaaacc
+acaattacttttgcaccaacctaa
+>Tigger1  
+caggcatacctcgttttattgcgcttcgctttattgcgcttcgcagatac
+tgcgttttttacaaattgaaggtttgtggcaaccctgcgttgagcaagtc
+tgtcggcgccatttttccaacagcatgtgctcacttcgtgtctctgtgtc
+acattttggtaattctcgcaatatttcaaactttttcattattattatat
+ctgttatggtgatctgtgatcagtgatctttgatgttactattgtaattg
+ttttggggtgccacgaaccgcacccatataagacggcgaacttaatcgat
+aaatgttgtgtgtgttctgactgctccaccgaccggccgttcccccgtct
+ctctccctctcytcgggcctccctattccctgagacacaacaatattgaa
+attaggccaattaataaccctacaatggcctctaagtgttcaagtgaaag
+gaagagtmrcacatctctcactttaaatcaaaagctagaaatgattaagc
+ttagtgaggaaggcatgtcaaaagccgagataggccaaaagctaggcctc
+ttgcgccaaacagttagccaagttgtgaatgcaaaggaaaagttcttgaa
+ggaaattaaaagtgctactccagtgaacacacgaatgataagaaagyaaa
+acagccttattgctgatatggagaaagttttagtggtctggatagaagat
+caaaccagccacaayattcccttaagccaaagcctaatccagagcaaggc
+cctaactctcttcaattctatgaaggctgagagaggtgaggaagctgcag
+aagaaaagtttgaagctagcagaggttggttcatgaggtttaaggaaaga
+agccatctccataacataaaagtgcaaggtgaagcagcaagtgctgatgt
+agaagctgcagcaagttatccagaagatctagctaagatcaytgatgaag
+gtggctacactaaacaacagattttcartgtagatgaaacagccttctat
+tggaagaagatgccatctaggactttcatagctagagaggagaagtcaat
+gcctggcttcaaagcttcaaaggacaggctgactctcttgttaggggcta
+atgcagctggtgactttaagttgaagccaatgctcatttaccattctgaa
+aatcctagagcccttaagaattatgctaaatctactctgcctgtgctcta
+taaatggaacaacaaagcctggatgacagcacatctgtttacagcatggt
+ttactgaatattttaagcccactgttgagacctactgctcagaaaaaaag
+attcctttcaaaatattactgctcattgacaacgcacctggtcacccaag
+agctctgatggagatgtacaaggagattaatgttgttttcatgcctgcta
+acacaacatccattctgcagcccatggatcaaggagtaatttcgactttc
+aagtcttattatttaagaaatacattttataaggctatagctgccataga
+tagtgattcctctgatggatctgggcaaagtaaattgaaaaccttctgga
+aaggattcaccattctagatgccattaagaacattcgtgattcatgggag
+gaggtcaaaatatcaacattaacaggagtttggaagaagttgattccaac
+cctcatggatgactttgaggggttyaagacttcagtggaggaagtaactg
+cagatgtggtggaaatagcaagagaactagaattagaagtggagcctgaa
+gatgtgactgaattgctgcaatctcatgataaaacttgaacggatgagga
+gttgcttcttatggatgagcaaagaaagtggtttcttgagatggaatcta
+ctcctggtgaagatgctgtgaacattgttgaaatgacaacaaaggattta
+gaatattacataaacttagttgataaagcagcggcagggtttgagaggat
+tgactccaattttgaaagaagttctactgtgggtaaaatgctgtcaaaca
+gcatcacatgctacagagaaatctttcatgaaaggaagagtcaattgatg
+cggcaaacttcattgttgtcttattttaagaaattgccacagccacccca
+accttcagcaaccaccaccctgatcagtcagcagccatcaacatcaaggc
+aagaccctccaccagcaaaaagattacgactcgctgaaggctcagatgat
+cgttagcattttttagcaataaagtatttttaaattaaggtatgtacatt
+gttttttagacataatgctattgcacacttaatagactacagtatagcgt
+aaacataacttttatatgcactgggaaaccaaaaaattcgtgtgactcgc
+tttattgcgatattcgctttattgcggtggtctggaaccgaacccgcaat
+atctccgaggtatgcctg
+>Tigger2  
+cagttgacccttgaacaacacgggtttgaactgcgcgggtccacttatac
+gtgrattttttycaataaatatattggaaaaawttytggagatttgcaac
+aatttgaaaaaactcgcagacgaaccgcgtagcctagaaatattgaaaaa
+attaagaaaaaggtatgtcatgaatgtataaaatatatgtagatactagt
+ctattttatcatttactaccataaaatayacacaaanctattataaaaag
+ttaaaatttatcaaaacttayayayayacttacagactgtacgtggtacc
+attcgaagtngagagaaatataaacaaacntaaagatgcagtattaaatc
+acaactgcgtaaaattaactgtagtacatactatactaccgtaataattt
+tgtagccacctcctgttgctattgcagcgagctcaagtgttgtgagtacc
+tgcttaaaacgctskgtgatgctaatcatctccgcgcgagcagttyatct
+ctccagtaaattgcgtattgcagtaaaaagtgatctctcacggttctcgc
+gtatttttcattgtgtttartgcaatattgtaaaccttgaataacaccat
+gggacccatacgaagtgccactagtgatgctggaagtgctcccaagaagc
+agagaaaagtcatgacattacaagaaaaagttgaattgcttgatatgtac
+catagattgaggtctgcagctggggttgcctgccatttcaagayagatga
+atccggcgtaaggaccgttgtmaaaaaagaaaaggaaattcgtgaaracc
+gtcgctgcagttatgcccagcaggcacaaaaacttgtnactttttgcgaa
+atacctttttatgttgtattgaaaatgcagcttttntgtgggtgcaggat
+tgctataagaaaggmatacctanagactctaatatgattagagaaaaagc
+gaagtcattatgtgannacttaaagcaaaarraagatgamrgatctaaag
+ctgganaatttaatgccagcaaakgatggtttgacaattttagaaagarg
+twtggcttaaaaaatktcaagakaacaggagaagcasyttctgctgacca
+agagacagcagacgagttnccagatgccattaacaaaatcattgaggaga
+aaggatatctgcctgaacaggtttttaatgcagatgaragtgccctattc
+tggggggaaaaaatgccacaaagracatttattagtaagnaagagaagcg
+agcaccaggatttaaggcargaagggataggctaactctactgttttgtg
+caaatgcagttaggtttatgatcaggactgcccttatctataaagctgct
+aacccccgagccttgaagggaaaagataaacgccagctgccagtcttttg
+gttgtacaacaagaaggcctggacaacgagaaccctttttctggattggt
+tccattkatgctttgtccctgawgtcaggaagtaccttgccagtaagrga
+ctgccttttaaagttcttttgatattggacaatgcccytggccacccaga
+accccatgagttcaacaccgaaggtgtcgaagtggtctacttgcccccaa
+acacaacgtctctaattcagcctctagatcagggggtcataaggaccttt
+aaggctcattacacacggtactctatggaaaggattgtcaacgctatgga
+agagaaccccgatagaragaacatcatgaaagtctggaaggattacacca
+ttgaagatgccattgttrttatagaaaaagccgtgaaagccatcaagccc
+aaaacagtaaattcctgctggagaaaactgtgtccagatgttgtacatga
+cttcacaggatttacgacagagccaatcaaggaaatcatgaaagagattg
+tggatatggcaaaaaagttggggggtaaagggtttcaagatgcgaatctt
+ggagaaattcaagagcwaatagacaccacaccagaggaattaacagaaga
+cgacttgatggagatgagtgcttccgaaccagtgccagacgatgaggaag
+aagacatngaagaagcagtgccagaaaacaaattgacattagacaatctr
+ggcagaagggttccaattattcaagactgcttttgacttcttttacaaca
+tggacccttctatgatacgggcactgaaactaaagcaaacagtggaagaa
+ggattggtaytatacagaaacatttttagagaaatgaaaaggcaaaaayr
+tcagacagaaattacgatgtatttccgtaaagttacaccgagtgtgcctg
+cctctcctgcctccccttccacctcctccacctcttccacctctgccacc
+ctgagacagcaagaccaacccctcctcctcctcagcctwctcaatgtgaa
+gacgacgaggatgaagacctttatgatgatccacttccacttaatgaata
+gtaaatatattttctcttccttatgattttcttaataacattttcttttc
+tctagcttactttattgtaagaatacggtatataatacatataacataca
+aaatatgtgttaatcgactgtttatgttatcggtaaggcttccagtcaac
+agtaggctattagtagttaagttttkggggagtcaaaagttatacgtgga
+tttttnactgcgcggggggtcagcgcccctaacccccgcgttgttcaagg
+gtcaactg
+>PAB  
+ccttaccagccccctactgtggcaggccaggtcccactaacacaggcctc
+cataacaactgtttcagctctgactgagtggttaagttaaatactaaaag
+ccgagagagccagtccccttatacagaggctggaatgtaacaaaagccca
+ccaagagttttgcctaggcctttcctgggccttgaagcatgacaaaataa
+caaaagaattcttaacagaatctatttaggattaaacaagttttactggg
+ggttctgaagaaactccccagtcctccacaaacaagtttactggggtctg
+aaagaactccccaaacctccatgatttagcaggagacaagataagggtaa
+tcaccccagcacctggacccagctagatttagtcaatttactgaggctac
+aaaggaaggtcttcaggactcagacctcagttatagattagaagaagtta
+atcacttatgtctttagatgattgcacacttacacatagacatatagctt
+agaaggtgtataagctctggaaaactttgtaattttgagttggtctggtg
+atattttccaggccttctccctatacccggttacagaaataaaaactttc
+ttcctccccagttcatctgcatcttgttaatgggctgccagaaatagcag
+cccaaccctcagttaggtctgggaacactaccccccaacacacacacaca
+cac
+
diff --git a/jpred/data/blast/lineages.txt b/jpred/data/blast/lineages.txt

new file mode 100755 (executable)

index 0000000..0b33e23
--- /dev/null
+++ b/jpred/data/blast/lineages.txt
@@ -0,0 +1,833 @@
+13
+9      Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Buchnera
+34     Bacteria; Proteobacteria; Deltaproteobacteria; Myxococcales; Cystobacterineae; Myxococcaceae; Myxococcus
+139    Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Borrelia; Borrelia burgdorferi group
+160    Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Treponema
+173    Bacteria; Spirochaetes; Spirochaetales; Leptospiraceae; Leptospira
+188    Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Magnetospirillum
+197    Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales; Campylobacteraceae; Campylobacter
+210    Bacteria; Proteobacteria; Epsilonproteobacteria; Campylobacterales; Helicobacteraceae; Helicobacter
+263    Bacteria; Proteobacteria; Gammaproteobacteria; Thiotrichales; Francisellaceae; Francisella
+274    Bacteria; Deinococcus-Thermus; Deinococci; Thermales; Thermaceae; Thermus
+287    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas
+292    Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex
+294    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas
+303    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas
+305    Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia
+316    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas
+317    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Pseudomonas
+339    Bacteria; Proteobacteria; Gammaproteobacteria; Xanthomonadales; Xanthomonadaceae; Xanthomonas
+354    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Pseudomonadaceae; Azotobacter
+358    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Agrobacterium
+375    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium
+382    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Sinorhizobium/Ensifer group; Sinorhizobium
+384    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
+394    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
+446    Bacteria; Proteobacteria; Gammaproteobacteria; Legionellales; Legionellaceae; Legionella
+480    Bacteria; Proteobacteria; Gammaproteobacteria; Pseudomonadales; Moraxellaceae; Moraxella
+485    Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
+487    Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
+518    Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Alcaligenaceae; Bordetella
+520    Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Alcaligenaceae; Bordetella
+529    Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Ochrobactrum
+549    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pantoea
+550    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Enterobacter
+552    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Erwinia
+554    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pectobacterium
+562    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia
+571    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Klebsiella
+573    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Klebsiella
+602    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella
+615    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Serratia
+623    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Shigella
+630    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia
+632    Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia
+644    Bacteria; Proteobacteria; Gammaproteobacteria; Aeromonadales; Aeromonadaceae; Aeromonas
+666    Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio
+670    Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio
+672    Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Vibrio
+714    Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Actinobacillus
+715    Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Actinobacillus
+727    Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Haemophilus
+731    Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Histophilus
+747    Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Pasteurella
+770    Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Anaplasmataceae; Anaplasma
+782    Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Rickettsiaceae; Rickettsieae; Rickettsia; typhus group
+813    Bacteria; Chlamydiae; Chlamydiales; Chlamydiaceae; Chlamydia
+817    Bacteria; Bacteroidetes; Bacteroides (class); Bacteroidales; Bacteroidaceae; Bacteroides
+837    Bacteria; Bacteroidetes; Bacteroides (class); Bacteroidales; Porphyromonadaceae; Porphyromonas
+851    Bacteria; Fusobacteria; Fusobacterales; Fusobacteriaceae; Fusobacterium
+876    Bacteria; Proteobacteria; Deltaproteobacteria; Desulfovibrionales; Desulfovibrionaceae; Desulfovibrio
+920    Bacteria; Proteobacteria; Gammaproteobacteria; Acidithiobacillales; Acidithiobacillaceae; Acidithiobacillus
+948    Bacteria; Proteobacteria; Alphaproteobacteria; Rickettsiales; Anaplasmataceae; Anaplasma; phagocytophilum group
+1063   Bacteria; Proteobacteria; Alphaproteobacteria; Rhodobacterales; Rhodobacteraceae; Rhodobacter
+1085   Bacteria; Proteobacteria; Alphaproteobacteria; Rhodospirillales; Rhodospirillaceae; Rhodospirillum
+1097   Bacteria; Chlorobi; Chlorobia; Chlorobiales; Chlorobiaceae; Chlorobium
+1108   Bacteria; Chloroflexi; Chloroflexales; Chloroflexaceae; Chloroflexus
+1126   Bacteria; Cyanobacteria; Chroococcales; Microcystis
+1206   Bacteria; Cyanobacteria; Oscillatoriales; Trichodesmium
+1245   Bacteria; Firmicutes; Lactobacillales; Leuconostoc
+1247   Bacteria; Firmicutes; Lactobacillales; Oenococcus
+1265   Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae; Ruminococcus
+1280   Bacteria; Firmicutes; Bacillales; Staphylococcus
+1282   Bacteria; Firmicutes; Bacillales; Staphylococcus
+1299   Bacteria; Deinococcus-Thermus; Deinococci; Deinococcales; Deinococcaceae; Deinococcus
+1303   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1307   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1308   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1309   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1311   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1313   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1314   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1334   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1336   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+1351   Bacteria; Firmicutes; Lactobacillales; Enterococcaceae; Enterococcus
+1352   Bacteria; Firmicutes; Lactobacillales; Enterococcaceae; Enterococcus
+1358   Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Lactococcus
+1392   Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
+1396   Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
+1402   Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus
+1422   Bacteria; Firmicutes; Bacillales; Bacillaceae; Geobacillus
+1423   Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus
+1428   Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
+1488   Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
+1496   Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
+1502   Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
+1515   Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
+1575   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Micrococcineae; Microbacteriaceae; Leifsonia
+1580   Bacteria; Firmicutes; Lactobacillales; Lactobacillaceae; Lactobacillus
+1584   Bacteria; Firmicutes; Lactobacillales; Lactobacillaceae; Lactobacillus
+1590   Bacteria; Firmicutes; Lactobacillales; Lactobacillaceae; Lactobacillus
+1639   Bacteria; Firmicutes; Bacillales; Listeriaceae; Listeria
+1642   Bacteria; Firmicutes; Bacillales; Listeriaceae; Listeria
+1718   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Corynebacteriaceae; Corynebacterium
+1719   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Corynebacteriaceae; Corynebacterium
+1764   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Mycobacteriaceae; Mycobacterium; Mycobacterium avium complex (MAC)
+1765   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Mycobacteriaceae; Mycobacterium; Mycobacterium tuberculosis complex
+1769   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Mycobacteriaceae; Mycobacterium
+1772   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Mycobacteriaceae; Mycobacterium
+1773   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Mycobacteriaceae; Mycobacterium; Mycobacterium tuberculosis complex
+1833   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Corynebacterineae; Nocardiaceae; Rhodococcus
+1902   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Streptomycineae; Streptomycetaceae; Streptomyces
+1916   Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Streptomycineae; Streptomycetaceae; Streptomyces
+2095   Bacteria; Firmicutes; Mollicutes; Mycoplasmataceae; Mycoplasma
+2097   Bacteria; Firmicutes; Mollicutes; Mycoplasmataceae; Mycoplasma
+2098   Bacteria; Firmicutes; Mollicutes; Mycoplasmataceae; Mycoplasma
+2130   Bacteria; Firmicutes; Mollicutes; Mycoplasmataceae; Ureaplasma
+2208   Archaea; Euryarchaeota; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina
+2209   Archaea; Euryarchaeota; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina
+2214   Archaea; Euryarchaeota; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina
+2234   Archaea; Euryarchaeota; Archaeoglobi; Archaeoglobales; Archaeoglobaceae; Archaeoglobus
+2238   Archaea; Euryarchaeota; Halobacteria; Halobacteriales; Halobacteriaceae; Haloarcula
+2247   Archaea; Euryarchaeota; Halobacteria; Halobacteriales; Halobacteriaceae; Halorubrum
+2261   Archaea; Euryarchaeota; Thermococci; Thermococcales; Thermococcaceae; Pyrococcus
+2287   Archaea; Crenarchaeota; Thermoprotei; Sulfolobales; Sulfolobaceae; Sulfolobus
+2336   Bacteria; Thermotogae; Thermotogales; Thermotogaceae; Thermotoga
+2371   Bacteria; Proteobacteria; Gammaproteobacteria; Xanthomonadales; Xanthomonadaceae; Xylella
+2711   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Sapindales; Rutaceae; Citrus
+2777   Eukaryota; Rhodophyta; Florideophyceae; Gracilariales; Gracilariaceae; Gracilaria
+2788   Eukaryota; Rhodophyta; Bangiophyceae; Bangiales; Bangiaceae; Porphyra
+2850   Eukaryota; stramenopiles; Bacillariophyta; Bacillariophyceae; Bacillariophycidae; Naviculales; Phaeodactylaceae; Phaeodactylum
+2903   Eukaryota; Haptophyceae; Isochrysidales; Emiliania
+2926   Eukaryota; Alveolata; Dinophyceae; Gonyaulacales; Gonyaulacaceae; Alexandrium
+2961   Eukaryota; Alveolata; Dinophyceae; Gymnodiniales; Gymnodiniaceae; Amphidinium
+2972   Eukaryota; Alveolata; Dinophyceae; Pyrocystales; Pyrocystis
+3012   Eukaryota; stramenopiles; Phaeophyceae; Fucales; Fucaceae; Fucus
+3046   Eukaryota; Viridiplantae; Chlorophyta; Chlorophyceae; Volvocales; Dunaliellaceae; Dunaliella
+3055   Eukaryota; Viridiplantae; Chlorophyta; Chlorophyceae; Volvocales; Chlamydomonadaceae; Chlamydomonas
+3190   Eukaryota; Viridiplantae; Chlorophyta; Prasinophyceae; Chlorodendrales; Chlorodendraceae; Scherffelia
+3197   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Marchantiophyta; Marchantiopsida; Marchantiidae; Marchantiales; Marchantiineae; Marchantiaceae; Marchantia
+3218   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Bryophyta; Bryopsida; Funariidae; Funariales; Funariaceae; Physcomitrella
+3225   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Bryophyta; Bryopsida; Dicranidae; Dicranales; Ditrichaceae; Ceratodon
+3311   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Ginkgophyta; Ginkgoales; Ginkgoaceae; Ginkgo
+3329   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Pinaceae; Picea
+3347   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Pinaceae; Pinus; Pinus
+3352   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Pinaceae; Pinus; Pinus
+3357   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Pinaceae; Pseudotsuga
+3369   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Cupressaceae; Cryptomeria
+3382   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Gnetophyta; Gnetopsida; Gnetales; Gnetaceae; Gnetum
+3467   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; Ranunculales; Papaveraceae; Eschscholzioideae; Eschscholzia
+3505   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fagales; Betulaceae; Betula
+3544   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Aizoaceae; Mesembryanthemum
+3562   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Amaranthaceae; Spinacia
+3570   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Caryophyllaceae; Dianthus
+3605   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Vitaceae; Vitis
+3634   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Malvoideae; Gossypium
+3635   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Malvoideae; Gossypium
+3641   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Byttnerioideae; Theobroma
+3649   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Caricaceae; Carica
+3654   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Cucurbitales; Cucurbitaceae; Citrullus
+3656   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Cucurbitales; Cucurbitaceae; Cucumis
+3659   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Cucurbitales; Cucurbitaceae; Cucumis
+3693   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+3695   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+3702   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Arabidopsis
+3707   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Brassica
+3708   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Brassica
+3711   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Brassica
+3712   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Brassica
+3726   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Raphanus
+3747   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Rosoideae; Fragaria
+3750   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Maloideae; Malus
+3755   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Amygdaloideae; Prunus
+3760   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Amygdaloideae; Prunus
+3818   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Aeschynomeneae; Arachis
+3827   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Cicereae; Cicer
+3847   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Glycine
+3870   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Genisteae; Lupinus
+3873   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Genisteae; Lupinus
+3879   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Trifolieae; Medicago
+3880   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Trifolieae; Medicago
+3885   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Phaseolus
+3886   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Phaseolus
+3888   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Vicieae; Pisum
+3895   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Robinieae; Sesbania
+3899   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Trifolieae; Trifolium
+3906   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Vicieae; Vicia
+3917   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Vigna
+3981   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Euphorbiaceae; Crotonoideae; Micrandreae; Hevea
+3983   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Euphorbiaceae; Crotonoideae; Manihoteae; Manihot
+3988   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Euphorbiaceae; Acalyphoideae; Acalypheae; Ricinus
+3993   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Euphorbiaceae; Euphorbioideae; Euphorbieae; Euphorbia
+4006   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Linaceae; Linum
+4039   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Apiales; Apiaceae; Apioideae; Scandiceae; Daucinae; Daucus
+4045   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Apiales; Apiaceae; Apioideae; apioid superclade; Apium clade; Apium
+4054   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Apiales; Araliaceae; Panax
+4072   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Capsicum
+4081   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Solanum; Lycopersicon
+4096   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Nicotiana
+4097   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Nicotiana
+4100   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Nicotiana
+4102   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Petunia
+4113   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Solanum
+4120   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Convolvulaceae; Ipomoea
+4146   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Oleaceae; Olea
+4151   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Antirrhinaceae; Antirrhineae; Antirrhinum
+4182   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Pedaliaceae; Sesamum
+4232   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Asteroideae; Heliantheae; Helianthus
+4236   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Cichorioideae; Cichorieae; Lactuca
+4498   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Aveneae; Avena
+4513   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Hordeum
+4530   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Ehrhartoideae; Oryzeae; Oryza
+4543   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Paniceae; Pennisetum
+4547   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Andropogoneae; Saccharum
+4550   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Secale
+4558   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Andropogoneae; Sorghum
+4560   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Andropogoneae; Sorghum
+4565   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Triticum
+4568   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Triticum
+4571   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Triticum
+4573   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Aegilops
+4577   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Andropogoneae; Zea
+4641   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Zingiberales; Musaceae; Musa
+4679   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Asparagales; Alliaceae; Allium
+4682   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Asparagales; Alliaceae; Allium
+4686   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Asparagales; Asparagaceae; Asparagus
+4754   Eukaryota; Fungi; Ascomycota; Pneumocystidomycetes; Pneumocystidaceae; Pneumocystis
+4787   Eukaryota; stramenopiles; Oomycetes; Pythiales; Pythiaceae; Phytophthora
+4790   Eukaryota; stramenopiles; Oomycetes; Pythiales; Pythiaceae; Phytophthora
+4876   Eukaryota; Fungi; Glomeromycota; Glomeromycetes; Glomerales; Glomeraceae; Glomus
+4896   Eukaryota; Fungi; Ascomycota; Schizosaccharomycetes; Schizosaccharomycetales; Schizosaccharomycetaceae; Schizosaccharomyces
+4905   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Pichia
+4911   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Kluyveromyces
+4916   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Kluyveromyces
+4920   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Pichia
+4931   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+4932   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+4934   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+4952   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Dipodascaceae; Yarrowia
+4956   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Zygosaccharomyces
+4959   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Debaryomyces
+5037   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Onygenales; Onygenaceae; Ajellomyces
+5059   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+5061   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+5062   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+5068   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+5085   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+5116   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetidae; Diaporthales; Valsaceae; Cryphonectria-Endothia complex; Cryphonectria
+5141   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetidae; Sordariales; Sordariaceae; Neurospora
+5180   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Leotiomycetes; Helotiales; Sclerotiniaceae; Sclerotinia
+5207   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Heterobasidiomycetes; Tremellomycetidae; Tremellales; Tremellaceae; Filobasidiella
+5270   Eukaryota; Fungi; Basidiomycota; Ustilaginomycetes; Ustilaginomycetidae; Ustilaginales; Ustilaginaceae; Ustilago
+5272   Eukaryota; Fungi; Basidiomycota; Urediniomycetes; Microbotryomycetidae; Microbotryales; Microbotryaceae; Microbotryum
+5306   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Aphyllophorales; Corticiaceae; Phanerochaete
+5322   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Pleurotaceae; Pleurotus
+5334   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Schizophyllaceae; Schizophyllum
+5341   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Agaricaceae; Agaricus
+5346   Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Psathyrellaceae; Coprinopsis
+5457   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetes incertae sedis; Phyllachorales; Phyllachoraceae; Glomerella
+5466   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetes incertae sedis; Phyllachorales; Phyllachoraceae; mitosporic Phyllachoraceae; Colletotrichum
+5476   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; mitosporic Saccharomycetales; Candida
+5478   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; mitosporic Saccharomycetales; Candida
+5482   Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; mitosporic Saccharomycetales; Candida
+5499   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Dothideomycetes et Chaetothyriomycetes incertae sedis; Mycosphaerellaceae; mitosporic Mycosphaerellaceae; Cladosporium
+5501   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Onygenales; mitosporic Onygenales; Coccidioides
+5507   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; mitosporic Hypocreales; Fusarium; Fusarium oxysporum complex
+5514   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; mitosporic Hypocreales; Fusarium
+5518   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Gibberella
+5530   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Clavicipitaceae; mitosporic Clavicipitaceae; Metarhizium
+5544   Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Hypocreaceae; Hypocrea
+5660   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Leishmania; Leishmania braziliensis species complex
+5661   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Leishmania
+5664   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Leishmania
+5671   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Leishmania
+5691   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Trypanosoma
+5693   Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Trypanosoma; Schizotrypanum
+5722   Eukaryota; Parabasalidea; Trichomonadida; Trichomonadidae; Trichomonadinae; Trichomonas
+5741   Eukaryota; Diplomonadida; Hexamitidae; Giardiinae; Giardia
+5759   Eukaryota; Entamoebidae; Entamoeba
+5802   Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Eimeriidae; Eimeria
+5807   Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Cryptosporidiidae; Cryptosporidium
+5811   Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Sarcocystidae; Toxoplasma
+5821   Eukaryota; Alveolata; Apicomplexa; Haemosporida; Plasmodium
+5825   Eukaryota; Alveolata; Apicomplexa; Haemosporida; Plasmodium
+5833   Eukaryota; Alveolata; Apicomplexa; Haemosporida; Plasmodium
+5855   Eukaryota; Alveolata; Apicomplexa; Haemosporida; Plasmodium
+5861   Eukaryota; Alveolata; Apicomplexa; Haemosporida; Plasmodium
+5875   Eukaryota; Alveolata; Apicomplexa; Piroplasmida; Theileriidae; Theileria
+5888   Eukaryota; Alveolata; Ciliophora; Oligohymenophorea; Peniculida; Paramecium
+5911   Eukaryota; Alveolata; Ciliophora; Oligohymenophorea; Hymenostomatida; Tetrahymenina; Tetrahymena
+5932   Eukaryota; Alveolata; Ciliophora; Oligohymenophorea; Hymenostomatida; Ophryoglenina; Ichthyophthirius
+5936   Eukaryota; Alveolata; Ciliophora; Spirotrichea; Hypotrichia; Euplotida; Euplotidae; Moneuplotes
+6085   Eukaryota; Metazoa; Cnidaria; Hydrozoa; Hydroida; Anthomedusae; Hydridae; Hydra
+6100   Eukaryota; Metazoa; Cnidaria; Hydrozoa; Hydroida; Leptomedusae; Aequoreidae; Aequorea
+6161   Eukaryota; Metazoa; Platyhelminthes; Turbellaria; Seriata; Tricladida; Paludicola; Dugesiidae; Dugesia
+6182   Eukaryota; Metazoa; Platyhelminthes; Trematoda; Digenea; Strigeidida; Schistosomatoidea; Schistosomatidae; Schistosoma
+6183   Eukaryota; Metazoa; Platyhelminthes; Trematoda; Digenea; Strigeidida; Schistosomatoidea; Schistosomatidae; Schistosoma
+6204   Eukaryota; Metazoa; Platyhelminthes; Cestoda; Eucestoda; Cyclophyllidea; Taeniidae; Taenia
+6210   Eukaryota; Metazoa; Platyhelminthes; Cestoda; Eucestoda; Cyclophyllidea; Taeniidae; Echinococcus
+6211   Eukaryota; Metazoa; Platyhelminthes; Cestoda; Eucestoda; Cyclophyllidea; Taeniidae; Echinococcus
+6238   Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Rhabditoidea; Rhabditidae; Peloderinae; Caenorhabditis
+6239   Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Rhabditoidea; Rhabditidae; Peloderinae; Caenorhabditis
+6248   Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Panagrolaimoidea; Strongyloididae; Strongyloides
+6252   Eukaryota; Metazoa; Nematoda; Chromadorea; Ascaridida; Ascaridoidea; Ascarididae; Ascaris
+6253   Eukaryota; Metazoa; Nematoda; Chromadorea; Ascaridida; Ascaridoidea; Ascarididae; Ascaris
+6265   Eukaryota; Metazoa; Nematoda; Chromadorea; Ascaridida; Ascaridoidea; Toxocaridae; Toxocara
+6279   Eukaryota; Metazoa; Nematoda; Chromadorea; Spirurida; Filarioidea; Onchocercidae; Brugia
+6282   Eukaryota; Metazoa; Nematoda; Chromadorea; Spirurida; Filarioidea; Onchocercidae; Onchocerca
+6287   Eukaryota; Metazoa; Nematoda; Chromadorea; Spirurida; Filarioidea; Onchocercidae; Dirofilaria
+6289   Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Haemonchidae; Haemonchinae; Haemonchus
+6293   Eukaryota; Metazoa; Nematoda; Chromadorea; Spirurida; Filarioidea; Onchocercidae; Wuchereria
+6303   Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+6304   Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+6305   Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+6306   Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+6317   Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Haemonchidae; Ostertagiinae; Ostertagia
+6334   Eukaryota; Metazoa; Nematoda; Enoplea; Trichocephalida; Trichinellidae; Trichinella
+6500   Eukaryota; Metazoa; Mollusca; Gastropoda; Orthogastropoda; Apogastropoda; Heterobranchia; Euthyneura; Opisthobranchia; Anaspidea; Aplysioidea; Aplysiidae; Aplysia
+6526   Eukaryota; Metazoa; Mollusca; Gastropoda; Pulmonata; Basommatophora; Lymnaeoidea; Planorbidae; Biomphalaria
+6550   Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Mytiloida; Mytiloidea; Mytilidae; Mytilus
+6551   Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Mytiloida; Mytiloidea; Mytilidae; Mytilus
+6565   Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Ostreoida; Ostreoidea; Ostreidae; Crassostrea
+6661   Eukaryota; Metazoa; Arthropoda; Crustacea; Branchiopoda; Anostraca; Artemiidae; Artemia
+6687   Eukaryota; Metazoa; Arthropoda; Crustacea; Malacostraca; Eumalacostraca; Eucarida; Decapoda; Dendrobranchiata; Penaeoidea; Penaeidae; Penaeus
+6689   Eukaryota; Metazoa; Arthropoda; Crustacea; Malacostraca; Eumalacostraca; Eucarida; Decapoda; Dendrobranchiata; Penaeoidea; Penaeidae; Litopenaeus
+6720   Eukaryota; Metazoa; Arthropoda; Crustacea; Malacostraca; Eumalacostraca; Eucarida; Decapoda; Pleocyemata; Astacidea; Astacoidea; Astacidae; Pacifastacus
+6941   Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Parasitiformes; Ixodida; Ixodidae; Boophilus
+6943   Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Parasitiformes; Ixodida; Ixodidae; Amblyomma
+6945   Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Parasitiformes; Ixodida; Ixodidae; Ixodes
+7029   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aphidiformes; Aphidoidea; Aphididae; Macrosiphini; Acyrthosiphon
+7038   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aleyrodiformes; Aleyrodoidea; Aleyrodidae; Aleyrodinae; Bemisia
+7070   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Tenebrionidae; Tribolium
+7091   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Bombycoidea; Bombycidae; Bombyx
+7092   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Bombycoidea; Bombycidae; Bombyx
+7111   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Noctuoidea; Noctuidae; Plusiinae; Trichoplusia
+7121   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Bombycoidea; Saturniidae; Saturniinae; Saturniini; Antheraea
+7130   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Sphingiodea; Sphingidae; Sphinginae; Manduca
+7159   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Aedes; Stegomyia
+7165   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Anopheles
+7173   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Anopheles
+7175   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Culex; Culex
+7200   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Psychodoidea; Psychodidae; Lutzomyia; Lutzomyia
+7213   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Tephritoidea; Tephritidae; Ceratitis
+7217   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7226   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7227   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7229   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7234   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7237   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7240   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7241   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7244   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7245   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7264   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+7368   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Muscoidea; Muscidae; Haematobia
+7370   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Muscoidea; Muscidae; Musca
+7394   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Hippoboscoidea; Glossinidae; Glossina
+7460   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Hymenoptera; Apocrita; Aculeata; Apoidea; Apidae; Apis
+7515   Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Siphonaptera; Pulicidae; Pulicinae; Ctenocephalides
+7634   Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Echinoidea; Euechinoidea; Echinacea; Echinoida; Echinometridae; Heliocidaris
+7650   Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Echinoidea; Euechinoidea; Echinacea; Echinoida; Strongylocentrotidae; Hemicentrotus
+7668   Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Echinoidea; Euechinoidea; Echinacea; Echinoida; Strongylocentrotidae; Strongylocentrotus
+7719   Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Enterogona; Phlebobranchia; Cionidae; Ciona
+7723   Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Stolidobranchia; Styelidae; Polyandrocarpa
+7729   Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Stolidobranchia; Pyuridae; Halocynthia
+7739   Eukaryota; Metazoa; Chordata; Cephalochordata; Branchiostomidae; Branchiostoma
+7741   Eukaryota; Metazoa; Chordata; Cephalochordata; Branchiostomidae; Branchiostoma
+7757   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Hyperoartia; Petromyzontiformes; Petromyzontidae; Petromyzon
+7801   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Chondrichthyes; Elasmobranchii; Galeomorphii; Galeoidea; Orectolobiformes; Ginglymostomatidae; Ginglymostoma
+7937   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Anguilliformes; Anguillidae; Anguilla
+7955   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Danio
+7957   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Carassius
+7959   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Ctenopharyngodon
+7962   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Cyprinus
+7998   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Siluriformes; Ictaluridae; Ictalurus
+8018   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Oncorhynchus
+8022   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Oncorhynchus
+8023   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Oncorhynchus
+8030   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Salmo
+8032   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Salmo
+8036   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Salvelinus
+8049   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Paracanthopterygii; Gadiformes; Gadidae; Gadus
+8078   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Atherinomorpha; Cyprinodontiformes; Fundulidae; Fundulus
+8081   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Atherinomorpha; Cyprinodontiformes; Poeciliidae; Poecilia
+8090   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Atherinomorpha; Beloniformes; Adrianichthyidae; Oryziinae; Oryzias
+8128   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Labroidei; Cichlidae; Oreochromis
+8150   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Labroidei; Cichlidae; Tropheus
+8161   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Carangoidei; Carangidae; Seriola
+8175   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Percoidei; Sparidae; Sparus
+8222   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Gobioidei; Gobiidae; Gillichthys
+8245   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Scombroidei; Xiphiidae; Xiphias
+8255   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Pleuronectiformes; Pleuronectoidei; Paralichthyidae; Paralichthys
+8260   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Pleuronectiformes; Pleuronectoidei; Pleuronectidae; Platichthys
+8262   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Pleuronectiformes; Pleuronectoidei; Pleuronectidae; Pleuronectes
+8265   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Pleuronectiformes; Pleuronectoidei; Pleuronectidae; Pseudopleuronectes
+8267   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Pleuronectiformes; Pleuronectoidei; Pleuronectidae; Hippoglossus
+8296   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Caudata; Salamandroidea; Ambystomatidae; Ambystoma
+8355   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Anura; Mesobatrachia; Pipoidea; Pipidae; Xenopodinae; Xenopus
+8364   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Anura; Mesobatrachia; Pipoidea; Pipidae; Xenopodinae; Silurana
+8400   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Anura; Neobatrachia; Ranoidea; Ranidae; Rana; Aquarana
+8723   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Lepidosauria; Squamata; Scleroglossa; Serpentes; Colubroidea; Viperidae; Crotalinae; Bothrops
+8801   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Palaeognathae; Struthioniformes; Struthionidae; Struthio
+8839   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Anseriformes; Anatidae; Anas
+8932   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Columbiformes; Columbidae; Columba
+9031   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Galliformes; Phasianidae; Phasianinae; Gallus
+9091   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Galliformes; Phasianidae; Phasianinae; Coturnix
+9103   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Galliformes; Phasianidae; Meleagris
+9157   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Passeriformes; Paridae; Parus
+9238   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Sphenisciformes; Spheniscidae; Pygoscelis
+9258   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Monotremata; Ornithorhynchidae; Ornithorhynchus
+9315   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Metatheria; Diprotodontia; Macropodidae; Macropus
+9337   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Metatheria; Diprotodontia; Phalangeridae; Trichosurus
+9361   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Edentata; Dasypodidae; Dasypus
+9438   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Chiroptera; Microchiroptera; Molossidae; Tadarida
+9447   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Strepsirhini; Lemuridae; Lemur
+9483   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Platyrrhini; Callitrichidae; Callithrix
+9490   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Platyrrhini; Callitrichidae; Saguinus
+9509   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Platyrrhini; Cebidae; Atelinae; Ateles
+9521   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Platyrrhini; Cebidae; Cebinae; Saimiri
+9534   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Cercopithecus
+9541   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Macaca
+9542   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Macaca
+9544   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Macaca
+9545   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Macaca
+9555   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Papio
+9557   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Cercopithecidae; Cercopithecinae; Papio
+9580   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hylobatidae; Hylobates
+9593   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Gorilla
+9597   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan
+9598   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan
+9600   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pongo
+9606   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo
+9615   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Fissipedia; Canidae; Canis
+9644   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Fissipedia; Ursidae; Ursus
+9660   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Fissipedia; Mustelidae; Mustelinae; Martes
+9685   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Fissipedia; Felidae; Felis
+9720   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Pinnipedia; Phocidae; Phoca
+9783   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Proboscidea; Elephantidae; Elephas
+9785   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Proboscidea; Elephantidae; Loxodonta
+9796   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Perissodactyla; Equidae; Equus
+9823   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Suina; Suidae; Sus
+9838   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Tylopoda; Camelidae; Camelus
+9844   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Tylopoda; Camelidae; Lama
+9860   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Cervoidea; Cervidae; Cervinae; Cervus
+9870   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Cervoidea; Cervidae; Odocoileinae; Rangifer
+9897   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Aepycerotinae; Aepyceros
+9913   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Bovinae; Bos
+9915   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Bovinae; Bos
+9925   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Caprinae; Capra
+9940   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Caprinae; Ovis
+9970   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Bovinae; Syncerus
+9986   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Lagomorpha; Leporidae; Oryctolagus
+9995   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Sciuridae; Sciurinae; Marmota
+10029  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Cricetinae; Cricetulus
+10036  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Cricetinae; Mesocricetus
+10041  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Sigmodontinae; Peromyscus
+10042  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Sigmodontinae; Peromyscus
+10047  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Gerbillinae; Meriones
+10090  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus
+10096  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus
+10116  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Rattus
+10117  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Rattus
+10129  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Apodemus
+10141  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Hystricognathi; Caviidae; Cavia
+10245  Viruses; dsDNA viruses, no RNA stage; Poxviridae; Chordopoxvirinae; Orthopoxvirus
+10298  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Alphaherpesvirinae; Simplexvirus
+10335  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Alphaherpesvirinae; Varicellovirus
+10345  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Alphaherpesvirinae; Varicellovirus
+10359  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Betaherpesvirinae; Cytomegalovirus
+10376  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Gammaherpesvirinae; Lymphocryptovirus
+10407  Viruses; Retroid viruses; Hepadnaviridae; Orthohepadnavirus
+10497  Viruses; dsDNA viruses, no RNA stage; Asfarviridae; Asfivirus
+10566  Viruses; dsDNA viruses, no RNA stage; Papillomaviridae; Papillomavirus
+10581  Viruses; dsDNA viruses, no RNA stage; Papillomaviridae; Papillomavirus
+10632  Viruses; dsDNA viruses, no RNA stage; Polyomaviridae; Polyomavirus
+10633  Viruses; dsDNA viruses, no RNA stage; Polyomaviridae; Polyomavirus
+10760  Viruses; dsDNA viruses, no RNA stage; Caudovirales; Podoviridae; T7-like viruses
+10798  Viruses; ssDNA viruses; Parvoviridae; Parvovirinae; Erythrovirus
+10995  Viruses; dsRNA viruses; Birnaviridae; Avibirnavirus
+11034  Viruses; ssRNA positive-strand viruses, no DNA stage; Togaviridae; Alphavirus; WEEV complex
+11041  Viruses; ssRNA positive-strand viruses, no DNA stage; Togaviridae; Rubivirus
+11047  Viruses; ssRNA positive-strand viruses, no DNA stage; Nidovirales; Arteriviridae; Arterivirus
+11072  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Flavivirus; Japanese encephalitis virus group
+11082  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Flavivirus; Japanese encephalitis virus group
+11099  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Pestivirus
+11103  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Hepacivirus
+11120  Viruses; ssRNA positive-strand viruses, no DNA stage; Nidovirales; Coronaviridae; Coronavirus
+11161  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Paramyxovirinae; Rubulavirus
+11176  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Paramyxovirinae; Rubulavirus
+11234  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Paramyxovirinae; Morbillivirus
+11246  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Pneumovirinae; Pneumovirus
+11250  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Pneumovirinae; Pneumovirus
+11264  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Pneumovirinae; Metapneumovirus
+11276  Viruses; ssRNA negative-strand viruses; Mononegavirales; Rhabdoviridae; Vesiculovirus
+11292  Viruses; ssRNA negative-strand viruses; Mononegavirales; Rhabdoviridae; Lyssavirus
+11660  Viruses; Retroid viruses; Retroviridae; Lentivirus; Ovine/caprine lentivirus
+11665  Viruses; Retroid viruses; Retroviridae; Lentivirus; Equine lentiviruses
+11673  Viruses; Retroid viruses; Retroviridae; Lentivirus; Feline lentiviruses
+11676  Viruses; Retroid viruses; Retroviridae; Lentivirus; Primate lentivirus group
+11709  Viruses; Retroid viruses; Retroviridae; Lentivirus; Primate lentivirus group
+11723  Viruses; Retroid viruses; Retroviridae; Lentivirus; Primate lentivirus group
+11768  Viruses; Retroid viruses; Retroviridae; Gammaretrovirus
+11786  Viruses; Retroid viruses; Retroviridae; Gammaretrovirus
+11827  Viruses; Retroid viruses; Retroviridae
+11886  Viruses; Retroid viruses; Retroviridae; Alpharetrovirus
+11966  Viruses; Retroid viruses; Retroviridae
+11983  Viruses; ssRNA positive-strand viruses, no DNA stage; Caliciviridae; Norovirus
+12092  Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Hepatovirus
+12111  Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Aphthovirus; Foot-and-mouth disease virus
+12118  Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Aphthovirus; Foot-and-mouth disease virus
+12162  Viruses; ssRNA positive-strand viruses, no DNA stage; Closteroviridae; Closterovirus
+12216  Viruses; ssRNA positive-strand viruses, no DNA stage; Potyviridae; Potyvirus
+12230  Viruses; ssRNA positive-strand viruses, no DNA stage; Potyviridae; Potyvirus
+12232  Viruses; ssRNA positive-strand viruses, no DNA stage; Potyviridae; Potyvirus
+12305  Viruses; ssRNA positive-strand viruses, no DNA stage; Bromoviridae; Cucumovirus
+12461  Viruses; ssRNA positive-strand viruses, no DNA stage; Hepatitis E-like viruses
+12475  Viruses; Deltavirus
+12637  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Flavivirus; Dengue virus group
+12702  Viruses; ssRNA positive-strand viruses, no DNA stage; Astroviridae; Mamastrovirus
+12721  Viruses; Retroid viruses; Retroviridae; Lentivirus; Primate lentivirus group
+12814  Viruses; ssRNA negative-strand viruses; Mononegavirales; Paramyxoviridae; Pneumovirinae; Pneumovirus
+13323  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Scombroidei; Scombridae; Acanthocybium
+13333  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; stem Magnoliophyta; Amborellaceae; Amborella
+13443  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Gentianales; Rubiaceae; Ixoroideae; Coffeeae; Coffea
+13489  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Percoidei; Moronidae; Dicentrarchus
+13515  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Strepsirhini; Lemuridae; Eulemur
+13563  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Schizophyllaceae; Heterobasidion; Heterobasidion annosum species complex
+13616  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Metatheria; Didelphimorphia; Didelphidae; Monodelphis
+13773  Archaea; Crenarchaeota; Thermoprotei; Thermoproteales; Thermoproteaceae; Pyrobaculum
+23211  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Maloideae; Pyrus
+27288  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+27291  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+27293  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+27294  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+27337  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; mitosporic Hypocreales; Verticillium
+27405  Eukaryota; Metazoa; Arthropoda; Crustacea; Malacostraca; Eumalacostraca; Eucarida; Decapoda; Dendrobranchiata; Penaeoidea; Penaeidae; Marsupenaeus
+27689  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Chondrostei; Acipenseriformes; Acipenseridae; Acipenser
+27828  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Cooperiidae; Cooperia
+27835  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Heligmonellidae; Nippostrongylinae; Nippostrongylus
+27923  Eukaryota; Metazoa; Ctenophora; Cyclocoela; Lobata; Bolinopsidae; Mnemiopsis
+28037  Bacteria; Firmicutes; Lactobacillales; Streptococcaceae; Streptococcus
+28232  Bacteria; Proteobacteria; Deltaproteobacteria; Desulfuromonadales; Geobacteraceae; Geobacter
+28344  Viruses; ssRNA positive-strand viruses, no DNA stage; Nidovirales; Arteriviridae; Arterivirus
+28450  Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; pseudomallei group
+28526  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Solanum; Lycopersicon
+28532  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Cleome
+28610  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Tephritoidea; Tephritidae; Rhagoletis
+28875  Viruses; dsRNA viruses; Reoviridae; Rotavirus
+28901  Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella
+28909  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Chloridoideae; Cynodonteae; Cynodon
+28985  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Kluyveromyces
+29058  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Noctuoidea; Noctuidae; Heliothinae; Helicoverpa
+29158  Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Mytiloida; Mytiloidea; Mytilidae; Mytilus
+29159  Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Ostreoida; Ostreoidea; Ostreidae; Crassostrea
+29170  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Ancylostomatoidea; Ancylostomatidae; Ancylostomatinae; Ancylostoma
+29176  Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Sarcocystidae; Neospora
+29449  Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
+29459  Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Brucellaceae; Brucella
+29471  Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pectobacterium
+29488  Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Photorhabdus
+29501  Bacteria; Firmicutes; Mollicutes; Mycoplasmataceae; Mycoplasma
+29518  Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Borrelia; Borrelia burgdorferi group
+29519  Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Borrelia; Borrelia burgdorferi group
+29546  Bacteria; Proteobacteria; Deltaproteobacteria; Desulfovibrionales; Desulfovibrionaceae; Lawsonia
+29729  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Malvoideae; Gossypium
+29730  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Malvoideae; Gossypium
+29760  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Vitaceae; Vitis
+29883  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Tricholomataceae; Laccaria
+30286  Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Stolidobranchia; Molgulidae; Molgula
+30301  Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Stolidobranchia; Botryllidae; Botryllus
+31033  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Tetraodontiformes; Tetradontoidea; Tetraodontidae; Takifugu
+31199  Eukaryota; Metazoa; Mollusca; Bivalvia; Pteriomorphia; Pectinoida; Pectinoidea; Pectinidae; Argopecten
+31216  Eukaryota; Metazoa; Mollusca; Gastropoda; Orthogastropoda; Apogastropoda; Caenogastropoda; Sorbeoconcha; Hypsogastropoda; Littorinimorpha; Littorinoidea; Littorinidae; Littorina
+31243  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Heteroderinae; Globodera
+32538  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Carnivora; Fissipedia; Felidae; Leopardus
+33085  Eukaryota; Entamoebidae; Entamoeba
+33169  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Eremothecium
+33178  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Aspergillus
+34245  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Asteroideae; Heliantheae; Zinnia
+34256  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Lamiaceae; Nepetoideae; Mentheae; Mentha
+34274  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Malvales; Malvaceae; Malvoideae; Gossypium
+34317  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Myrtales; Myrtaceae; Eucalyptus
+34358  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+34373  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Leotiomycetes; Erysiphales; Erysiphaceae; Blumeria
+34488  Eukaryota; Fungi; Zygomycota; Zygomycetes; Entomophthorales; Ancylistaceae; Conidiobolus
+34506  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Panagrolaimoidea; Strongyloididae; Strongyloides
+34594  Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Parasitiformes; Ixodida; Argasidae; Ornithodoros
+34610  Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Parasitiformes; Ixodida; Ixodidae; Amblyomma
+34740  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata; Ditrysia; Papilionoidea; Nymphalidae; Heliconiinae; Heliconius
+34765  Eukaryota; Metazoa; Chordata; Urochordata; Appendicularia; Oikopleuridae; Oikopleura
+34816  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Percoidei; Moronidae; Morone
+35520  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Paniceae; Pennisetum
+35632  Eukaryota; Metazoa; Annelida; Clitellata; Oligochaeta; Haplotaxida; Lumbricina; Lumbricidae; Lumbricus
+35845  Eukaryota; Viridiplantae; Chlorophyta; Ulvophyceae; Dasycladales; Dasycladaceae; Acetabularia
+35876  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Asparagales; Iridaceae; Iris
+35883  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Convolvulaceae; Ipomoea
+35884  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Convolvulaceae; Ipomoea
+35938  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Robinieae; Robinia
+36090  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Heteroderinae; Globodera
+36452  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; unclassified Herpesviridae; stealth viruses
+36596  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Amygdaloideae; Prunus
+36825  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Orthopteroidea; Phasmatodea; Euphasmida; Phyllioidea; Bacillidae; Bacillus
+37293  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Platyrrhini; Cebidae; Aotinae; Aotus
+37296  Viruses; dsDNA viruses, no RNA stage; Herpesviridae; Gammaherpesvirinae; Rhadinovirus
+37468  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Boletales; Sclerodermatineae; Pisolithaceae; Pisolithus
+37656  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Sapindales; Rutaceae; Citrus
+37657  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Caryophyllaceae; Silene
+37682  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Aegilops
+37690  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Sapindales; Rutaceae; Poncirus
+37727  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; mitosporic Trichocomaceae; Penicillium
+37769  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Heterobasidiomycetes; Tremellomycetidae; Tremellales; Tremellaceae; Filobasidiella
+38033  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetidae; Sordariales; Chaetomiaceae; Chaetomium
+38249  Eukaryota; Euglenozoa; Kinetoplastida; Trypanosomatidae; Trypanosoma
+38666  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Heteromyidae; Perognathinae; Chaetodipus
+38937  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Lepidosauria; Squamata; Iguania; Iguanidae; Polychrotinae; Anolis
+39984  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Rhizophoraceae; Bruguiera
+40051  Viruses; dsRNA viruses; Reoviridae; Orbivirus
+40352  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Trichostrongylidae; Trichostrongylinae; Trichostrongylus
+40366  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Brachycera; Muscomorpha; Ephydroidea; Drosophilidae; Drosophila
+40559  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Leotiomycetes; Helotiales; Sclerotiniaceae; Botryotinia
+40686  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Salix
+40930  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aphidiformes; Coccoidea; Pseudococcidae; Planococcus
+40932  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aphidiformes; Aphidoidea; Aphididae; Aphidini; Rhopalosiphum
+41429  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Anopheles
+42156  Eukaryota; Metazoa; Nematoda; Chromadorea; Spirurida; Filarioidea; Onchocercidae; Litomosoides
+42251  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Pezizomycetes; Pezizales; Tuberaceae; Tuber
+42329  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Cycadophyta; Cycadales; Zamiaceae; Zamia
+42439  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Limnanthaceae; Limnanthes
+42677  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Gibberella; Gibberella fujikuroi complex
+42890  Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Sarcocystidae; Sarcocystis
+43114  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Caudata; Salamandroidea; Ambystomatidae; Ambystoma
+43425  Eukaryota; Fungi; Glomeromycota; Glomeromycetes; Glomerales; Glomeraceae; Glomus
+43928  Archaea; Euryarchaeota; Halobacteria; Halobacteriales; Halobacteriaceae; Halobaculum
+44015  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Glycine
+44689  Eukaryota; Mycetozoa; Dictyosteliida; Dictyostelium
+45249  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Arabidopsis
+45464  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Trichostrongyloidea; Haemonchidae; Ostertagiinae; Teladorsagia
+45687  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Glycine
+45929  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Pratylenchidae; Pratylenchinae; Pratylenchus
+45954  Eukaryota; Metazoa; Mollusca; Bivalvia; Heteroconchia; Veneroida; Dreissenoidea; Dreissenidae; Dreissena
+46761  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Amphibia; Batrachia; Caudata; Salamandroidea; Plethodontidae; Plethodon
+47247  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Loteae; Lotus
+47664  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+47834  Bacteria; Firmicutes; Mollicutes; Entomoplasmatales; Spiroplasmataceae; Spiroplasma
+47853  Bacteria; Actinobacteria; Actinobacteridae; Actinomycetales; Micromonosporineae; Micromonosporaceae; Micromonospora
+48215  Eukaryota; Metazoa; Platyhelminthes; Trematoda; Digenea; Echinostomida; Echinostomata; Echinostomatidae; Echinostoma
+48935  Bacteria; Proteobacteria; Alphaproteobacteria; Sphingomonadales; Sphingomonadaceae; Novosphingobium
+49338  Bacteria; Firmicutes; Clostridia; Clostridiales; Peptococcaceae; Desulfitobacterium
+49351  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Cephaloboidea; Cephalobidae; Zeldia
+49451  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Nicotiana
+49495  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Moniliformopses; Filicophyta; Filicopsida; Filicales; Pteridaceae; Ceratopteris
+51029  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Heteroderinae; Heterodera
+51031  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Ancylostomatoidea; Ancylostomatidae; Bunostominae; Necator
+51240  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fagales; Juglandaceae; Juglans
+51453  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Hypocreaceae; Hypocrea
+51511  Eukaryota; Metazoa; Chordata; Urochordata; Ascidiacea; Enterogona; Phlebobranchia; Cionidae; Ciona
+51657  Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Kluyveromyces
+52283  Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Acariformes; Sarcoptiformes; Astigmata; Psoroptidia; Sarcoptoidea; Sarcoptidae; Sarcoptes
+52714  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Pooideae; Triticeae; Leymus
+52792  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Passeriformes; Turdidae; Luscinia
+53326  Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Strongylida; Ancylostomatoidea; Ancylostomatidae; Ancylostomatinae; Ancylostoma
+53413  Bacteria; Proteobacteria; Gammaproteobacteria; Xanthomonadales; Xanthomonadaceae; Xanthomonas
+54126  Eukaryota; Metazoa; Nematoda; Chromadorea; Diplogasterida; Neodiplogasteridae; Pristionchus
+54290  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; GBV-C/HGV group
+54314  Viruses; ssRNA positive-strand viruses, no DNA stage; Flaviviridae; Pestivirus
+54672  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Euphorbiaceae; Euphorbioideae; Euphorbieae; Euphorbia
+54734  Eukaryota; Fungi; Ascomycota; Pezizomycotina; Dothideomycetes et Chaetothyriomycetes incertae sedis; Mycosphaerellaceae; Mycosphaerella
+55088  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Orthopteroidea; Phasmatodea; Euphasmida; Phyllioidea; Bacillidae; Bacillus
+55188  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Sapindales; Rutaceae; Citrus
+55529  Eukaryota; Cryptophyta; Cryptomonadaceae; Guillardia
+55670  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Asteroideae; Eupatorieae; Stevia
+55987  Viruses; ssRNA negative-strand viruses; Orthomyxoviridae; unclassified Orthomyxoviridae
+57667  Viruses; Retroid viruses; Retroviridae; Lentivirus; Primate lentivirus group
+57870  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Orthopteroidea; Phasmatodea; Euphasmida; Phyllioidea; Bacillidae; Bacillus
+58002  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aphidiformes; Phylloxeroidea; Phylloxeridae; Daktulosphaira
+58031  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Cycadophyta; Cycadales; Cycadaceae; Cycas
+59479  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Chiroptera; Microchiroptera; Rhinolophidae; Rhinolophinae; Rhinolophus
+59689  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Arabidopsis
+59747  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+59777  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Lycopodiophyta; Isoetopsida; Selaginellales; Selaginellaceae; Selaginella
+59861  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Coregonus
+61147  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Rhizophoraceae; Kandelia
+62324  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Diptera; Nematocera; Culicoidea; Anopheles
+62890  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Solanum; Lycopersicon
+63629  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; Ehrhartoideae; Oryzeae; Oryza
+63737  Bacteria; Cyanobacteria; Nostocales; Nostocaceae; Nostoc
+64091  Archaea; Euryarchaeota; Halobacteria; Halobacteriales; Halobacteriaceae; Halobacterium
+64093  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Orobanchaceae; Rhinantheae; Triphysaria
+64391  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Phytophaga; Chrysomeloidea; Chrysomelidae; Bruchinae; Bruchini; Callosobruchus
+64468  Eukaryota; Metazoa; Arthropoda; Crustacea; Malacostraca; Eumalacostraca; Eucarida; Decapoda; Dendrobranchiata; Penaeoidea; Penaeidae; Litopenaeus
+64602  Archaea; Euryarchaeota; Halobacteria; Halobacteriales; Halobacteriaceae; Natrialba
+64679  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Sciuridae; Sciurinae; Tamias
+64717  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Arvicolinae; Microtus
+65661  Eukaryota; Acanthamoebidae; Acanthamoeba
+66189  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Testudines; Cryptodira; Testudinoidea; Testudinidae; Geochelone
+66913  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Siluriformes; Ictaluridae; Ictalurus
+67593  Eukaryota; stramenopiles; Oomycetes; Pythiales; Pythiaceae; Phytophthora
+68887  Viruses; ssDNA viruses; Circoviridae; Anellovirus
+69266  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; Ericales; Ericaceae; Vaccinioideae; Vaccinieae; Vaccinium
+69293  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Gasterosteiformes; Gasterosteidae; Gasterosteus
+70415  Eukaryota; Metazoa; Nematoda; Enoplea; Trichocephalida; Trichuridae; Trichuris
+70448  Eukaryota; Viridiplantae; Chlorophyta; Prasinophyceae; Mamiellales; Mamiellaceae; Ostreococcus
+70863  Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Shewanella
+71139  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Myrtales; Myrtaceae; Eucalyptus
+71150  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Boletales; Paxilineae; Paxillaceae; Paxillus
+71223  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Elateriformia; Cantharoidea; Lampyridae; Pyrocoelia
+71647  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Coniferopsida; Coniferales; Pinaceae; Pinus; Pinus
+72088  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Scorpaeniformes; Scorpaenoidei; Scorpaenidae; Sebastes
+73107  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Gruiformes; Otididae; Otis
+73234  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Orthopteroidea; Phasmatodea; Euphasmida; Phyllioidea; Bacillidae; Bacillus
+73275  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Asteroideae; Heliantheae; Helianthus
+73304  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Asteroideae; Heliantheae; Helianthus
+73824  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+74081  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Lepidosauria; Squamata; Scleroglossa; Scincomorpha; Lacertoidea; Lacertidae; Podarcis
+74649  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Rosoideae; Rosa
+74940  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Protacanthopterygii; Salmoniformes; Salmonidae; Oncorhynchus
+75846  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Anseriformes; Anatidae; Anas
+75943  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Asteraceae; Cichorioideae; Cichorieae; Lactuca
+76149  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Plumbaginaceae; Plumbago
+76340  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Percoidei; Sciaenidae; Sciaenops
+76593  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Acrossocheilus
+76867  Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Agaricales; Cortinariaceae; Hebeloma
+77108  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; stem Magnoliophyta; Nymphaeaceae; Nuphar
+78584  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Strepsirhini; Megaladapidae; Lepilemur
+79327  Eukaryota; Metazoa; Platyhelminthes; Turbellaria; Seriata; Tricladida; Paludicola; Dugesiidae; Schmidtea
+79517  Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Phytophaga; Chrysomeloidea; Chrysomelidae; Chrysomelinae; Timarchini; Timarcha
+79880  Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus
+79923  Eukaryota; Metazoa; Platyhelminthes; Trematoda; Digenea; Opisthorchiida; Opisthorchiata; Opisthorchioidea; Opisthorchiidae; Clonorchis
+80365  Eukaryota; stramenopiles; Phaeophyceae; Laminariales; Laminariaceae; Laminaria
+80379  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Solanales; Solanaceae; Capsicum
+80863  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+82528  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Asparagales; Iridaceae; Crocus
+82927  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Lamiales; Acanthaceae; Acanthaceae incertae sedis; Avicennia
+83288  Eukaryota; Rhodophyta; Florideophyceae; Ceramiales; Ceramiaceae; Griffithsia
+83558  Bacteria; Chlamydiae; Chlamydiales; Chlamydiaceae; Chlamydophila
+83675  Eukaryota; Alveolata; Apicomplexa; Coccidia; Eimeriida; Sarcocystidae; Neospora
+83912  Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Acari; Acariformes; Sarcoptiformes; Astigmata; Psoroptidia; Sarcoptoidea; Psoroptidae; Psoroptes
+84072  Eukaryota; Metazoa; Platyhelminthes; Turbellaria; Acoelomorpha; Acoela; Sagittiferidae; Symsagittifera
+85571  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Sapindales; Rutaceae; Citrus
+86005  Bacteria; Firmicutes; Bacillales; Alicyclobacillaceae; Pasteuria
+86304  Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Microbulbifer
+87841  Eukaryota; Metazoa; Mollusca; Gastropoda; Pulmonata; Stylommatophora; Sigmurethra; Helicoidea; Bradybaenidae; Euhadra
+89411  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Descurainia
+89462  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; Bovidae; Bovinae; Bubalus
+92652  Viruses; dsDNA viruses, no RNA stage; Nimaviridae; Whispovirus
+93678  Viruses; ssDNA viruses; Circoviridae; Anellovirus
+93934  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Galliformes; Phasianidae; Phasianinae; Coturnix
+94289  Eukaryota; Alveolata; Ciliophora; Spirotrichea; Stichotrichia; Stichotrichida; Oxytrichidae; Sterkiella
+94961  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Chiroptera; Microchiroptera; Mystacinidae; Mystacina
+95145  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Paracanthopterygii; Batrachoididae; Opsanus
+96939  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Vitaceae; Vitis
+97005  Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Heteroderinae; Heterodera
+97393  Archaea; Euryarchaeota; Thermoplasmata; Thermoplasmatales; Ferroplasmaceae; Ferroplasma
+98038  Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids II; Brassicales; Brassicaceae; Thellungiella
+99878  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Passeriformes; Sturnidae; Toxostoma
+99883  Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Tetraodontiformes; Tetradontoidea; Tetraodontidae; Tetraodon
+100452 Eukaryota; Metazoa; Mollusca; Gastropoda; Pulmonata; Stylommatophora; Sigmurethra; Helicoidea; Hygromiidae; Candidula
+102803 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Phytophaga; Scolytidae; Ips
+103999 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Asterales; Campanulaceae; Codonopsis
+105358 Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Echinoidea; Euechinoidea; Diadematacea; Diadematoida; Diadematidae; Diadema
+105886 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; campanulids; Apiales; Araliaceae; Acanthopanax
+107832 Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Heterobasidiomycetes; Heterobasidiomycetidae; Ceratobasidiales; Ceratobasidiaceae; Thanatephorus
+107907 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Adephaga; Dytiscidae; Colymbetinae; Colymbetini; Meladema
+108098 Viruses; dsDNA viruses, no RNA stage; Adenoviridae; Mastadenovirus
+108607 Eukaryota; Pelobiontida; Mastigamoebidae; Mastigamoeba
+110365 Eukaryota; Alveolata; Apicomplexa; Gregarinia; Eugregarinida; Gregarinidae; Gregarina
+112525 Eukaryota; Metazoa; Mollusca; Gastropoda; Pulmonata; Basommatophora; Lymnaeoidea; Planorbidae; Biomphalaria
+113636 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+114524 Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+114525 Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+114526 Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes; Saccharomycetales; Saccharomycetaceae; Saccharomyces
+117187 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Gibberella
+118799 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Adephaga; Carabidae; Carabini; Carabina; Carabus; Carabus
+119072 Bacteria; Firmicutes; Clostridia; Thermoanaerobacteriales; Thermoanaerobacteriaceae; Thermoanaerobacter
+119219 Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia
+121225 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Phthiraptera; Anoplura; Pediculidae; Pediculus
+121759 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Onygenales; mitosporic Onygenales; Paracoccidioides
+123226 Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Scorpiones; Buthida; Buthoidea; Buthidae; Mesobuthus
+123792 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Sciuridae; Sciurinae; Tamias
+126740 Bacteria; Thermotogae; Thermotogales; Thermotogaceae; Thermotoga
+126913 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Amaranthaceae; Suaeda
+128735 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Rosales; Rosaceae; Rosoideae; Rosa
+129883 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Ostariophysi; Cypriniformes; Cyprinidae; Telestes
+129951 Viruses; dsDNA viruses, no RNA stage; Adenoviridae; Mastadenovirus
+131310 Eukaryota; Metazoa; Nematoda; Chromadorea; Rhabditida; Panagrolaimoidea; Strongyloididae; Parastrongyloides
+132711 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACCAD clade; Panicoideae; Andropogoneae; Sorghum
+134537 Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia
+135974 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Passeriformes; Furnariidae; Glyphorynchus
+136966 Viruses; ssDNA viruses; Circoviridae; Anellovirus
+137523 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Piciformes; Picidae; Dendrocopos
+138948 Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Enterovirus
+138949 Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Enterovirus
+138950 Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Enterovirus
+138953 Viruses; ssRNA positive-strand viruses, no DNA stage; Picornaviridae; Enterovirus
+140110 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria
+145262 Archaea; Euryarchaeota; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanothermobacter
+148305 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Sordariomycetes incertae sedis; Magnaporthaceae; Magnaporthe
+150234 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Adephaga; Cicindelidae; Cicindela; Cicindela
+153471 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Malpighiales; Salicaceae; Saliceae; Populus
+155892 Bacteria; Proteobacteria; Alphaproteobacteria; Caulobacterales; Caulobacteraceae; Caulobacter
+156889 Bacteria; Proteobacteria; Magnetococcus
+157791 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; eurosids I; Fabales; Fabaceae; Papilionoideae; Phaseoleae; Vigna
+160621 Eukaryota; Alveolata; Dinophyceae; Gonyaulacales; Lingulodinium
+161934 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Amaranthaceae; Beta
+162425 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Eurotiomycetes; Eurotiales; Trichocomaceae; Emericella
+164405 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Myrtales; Myrtaceae; Melaleuca
+172680 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Gruiformes; Otididae; Chlamydotis
+176275 Eukaryota; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Clavicipitaceae; Cordyceps
+178872 Eukaryota; Fungi; Basidiomycota; Hymenomycetes; Homobasidiomycetes; Boletales; Sclerodermatineae; Pisolithaceae; Pisolithus
+180448 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Archosauria; Aves; Neognathae; Passeriformes; Motacillidae; Motacilla
+182803 Eukaryota; Metazoa; Arthropoda; Chelicerata; Arachnida; Araneae; Araneomorphae; Entelegynae; Araneoidea; Araneidae; Araneus
+183855 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Myrtales; Myrtaceae; Eucalyptus
+186039 Eukaryota; stramenopiles; Bacillariophyta; Bacillariophyceae; Bacillariophycidae; Bacillariales; Bacillariaceae; Fragilariopsis
+189293 Eukaryota; Metazoa; Nematoda; Chromadorea; Tylenchida; Tylenchina; Tylenchoidea; Heteroderidae; Meloidogyninae; Meloidogyne
+189785 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; Caryophyllales; Tamaricaceae; Tamarix
+194440 Viruses; Retroid viruses; Retroviridae; Deltaretrovirus
+194441 Viruses; Retroid viruses; Retroviridae; Deltaretrovirus
+197003 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Biphyllidae; Biphyllus
+197009 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Phytophaga; Anthribidae; Anthribinae; Platystomini; Platystomus
+197013 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Endopterygota; Coleoptera; Polyphaga; Cucujiformia; Phytophaga; Curculionidae; Curculioninae; Curculionini; Curculio
+197043 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Euhemiptera; Membracoidea; Cicadellidae; Cicadellinae; Homalodisca
+212795 Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Actinopterygii; Neopterygii; Teleostei; Euteleostei; Neoteleostei; Acanthomorpha; Acanthopterygii; Percomorpha; Perciformes; Percoidei; Serranidae; Epinephelus
+213425 Eukaryota; Metazoa; Mollusca; Gastropoda; Orthogastropoda; Apogastropoda; Caenogastropoda; Sorbeoconcha; Hypsogastropoda; Neogastropoda; Muricoidea; Muricidae; Ocinebrellus
+216816 Bacteria; Actinobacteria; Actinobacteridae; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium
+219666 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Gentianales; Rubiaceae; Rubioideae; Spermacoceae; Hedyotis
+219667 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; asterids; lamiids; Gentianales; Rubiaceae; Rubioideae; Spermacoceae; Hedyotis
+219738 Eukaryota; Metazoa; Nematoda; Enoplea; Trichocephalida; Trichuridae; Trichuris
+221420 Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Holothuroidea; Aspidochirotacea; Aspidochirotida; Holothuriidae; Holothuria
+223153 Eukaryota; Alveolata; Ciliophora; Litostomatea; Trichostomatia; Vestibuliferida; Isotrichidae; Isotricha
+223852 Eukaryota; Metazoa; Arthropoda; Hexapoda; Insecta; Pterygota; Neoptera; Paraneoptera; Hemiptera; Sternorrhyncha; Aphidiformes; Aphidoidea; Aphididae; Aphidini; Toxoptera
+232323 Eukaryota; Metazoa; Tardigrada; Eutardigrada; Apochela; Hypsibiidae; Hypsibius
+241073 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Vitaceae; Vitis
+245552 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Liliales; Alstroemeriaceae; Alstroemeria
+246827 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicots; rosids; Vitaceae; Vitis
diff --git a/jpred/data/blast/makerpt.prt b/jpred/data/blast/makerpt.prt

new file mode 100755 (executable)

index 0000000..c5a6545
--- /dev/null
+++ b/jpred/data/blast/makerpt.prt
@@ -0,0 +1,2448 @@
+PrintTemplateSet ::= {
+  {
+    name "StdSeqDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.mol-type" ,
+              label "Molecule type" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.modif" ,
+              label "Modifiers" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seqdesc.modif.E" ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seqdesc.method" ,
+              label "Method" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.name" ,
+              label "Name" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.title" ,
+              label "Title" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.org" ,
+              label "Organism" ,
+              prefix "\n" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "Seqdesc.comment" ,
+              label "Comment" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.num" ,
+              label "Numbering" ,
+              prefix "\n" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "Seqdesc.maploc" ,
+              label "Map location" ,
+              prefix "\n" ,
+              form
+                use-template "StdDbtag" } ,
+            {
+              asn1 "Seqdesc.pir" ,
+              label "PIR block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.genbank" ,
+              label "GenBank block" ,
+              prefix "\n" ,
+              form
+                use-template "StdGBBlock" } ,
+            {
+              asn1 "Seqdesc.pub" ,
+              label "Citation" ,
+              prefix "\n" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "Seqdesc.region" ,
+              label "Region" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.user" ,
+              label "User Type" ,
+              prefix "\n" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seqdesc.sp" ,
+              label "SWISS-PROT block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.dbxref" ,
+              label "Cross reference" ,
+              prefix "\n" ,
+              form
+                use-template "StdDbtag" } ,
+            {
+              asn1 "Seqdesc.embl" ,
+              label "EMBL block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.create-date" ,
+              label "Create date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.update-date" ,
+              label "Update date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.prf" ,
+              label "PRF block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.pdb" ,
+              label "PDB block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.het" ,
+              label "Heterogen" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.source" ,
+              label "Source" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.molinfo" ,
+              label "Mol info" ,
+              prefix "\n" ,
+              form
+                null NULL } } } } } ,
+  {
+    name "StdReportSeqDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.mol-type" ,
+              label "Molecule type" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.modif" ,
+              label "Modifiers" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seqdesc.modif.E" ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seqdesc.method" ,
+              label "Method" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.name" ,
+              label "Name" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.title" ,
+              label "Title" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.org" ,
+              label "Organism" ,
+              prefix "\n" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "Seqdesc.comment" ,
+              label "Comment" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.num" ,
+              label "Numbering" ,
+              prefix "\n" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "Seqdesc.maploc" ,
+              label "Map location" ,
+              prefix "\n" ,
+              form
+                use-template "StdDbtag" } ,
+            {
+              asn1 "Seqdesc.pir" ,
+              label "PIR block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.genbank" ,
+              prefix "\n" ,
+              form
+                use-template "StdReportGBBlock" } ,
+            {
+              asn1 "Seqdesc.pub" ,
+              label "Citation" ,
+              prefix "\n" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "Seqdesc.region" ,
+              label "Region" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.user" ,
+              label "User Type" ,
+              prefix "\n" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seqdesc.sp" ,
+              label "SWISS-PROT block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.neighbors" ,
+              label "Neighbors" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.embl" ,
+              label "EMBL block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.create-date" ,
+              label "Create date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.update-date" ,
+              label "Update date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.prf" ,
+              label "PRF block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.pdb" ,
+              label "PDB block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.het" ,
+              label "Heterogen" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.source" ,
+              label "Source" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.molinfo" ,
+              label "Mol info" ,
+              prefix "\n" ,
+              form
+                null NULL } } } } } ,
+  {
+    name "StdSourceDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.genbank" ,
+              prefix "\n" ,
+              form
+                use-template "StdSourceInGBBlock" } } } } } ,
+  {
+    name "StdTaxDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.genbank" ,
+              prefix "\n" ,
+              form
+                use-template "StdTaxInGBBlock" } } } } } ,
+  {
+    name "StdDivDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.genbank" ,
+              prefix "\n" ,
+              form
+                use-template "StdDivInGBBlock" } } } } } ,
+  {
+    name "StdSequenceId" ,
+    format {
+      asn1 "Seq-id" ,
+      form
+        block {
+          components {
+            {
+               asn1 "Seq-id.gi" ,
+             label "gi|" ,
+              form
+               text {
+                         } } ,
+            {
+              asn1 "Seq-id.genbank" ,
+              form
+                use-template "ReportTextseqId" } ,
+            {
+              asn1 "Seq-id.local" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdPubSeqId" ,
+    format {
+      asn1 "Seq-id" ,
+      label "" ,
+      prefix "; " ,
+      form
+        block {
+          components {
+            {
+               asn1 "Seq-id.gi" ,
+             label "gi|" ,
+              form
+               text {
+                         } } ,
+            {
+              asn1 "Seq-id.local" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StartingPubSeqId" ,
+    format {
+      asn1 "Seq-id" ,
+      label "Location:" ,
+      prefix "\t" ,
+      form
+        block {
+          components {
+            {
+               asn1 "Seq-id.gi" ,
+             label "gi|" ,
+              form
+               text {
+                         } } ,
+            {
+              asn1 "Seq-id.local" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdObjectId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdTextseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+              form
+                null NULL } ,
+                   } } } } ,
+  {
+    name "ReportTextseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+             suffix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+             suffix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+              form
+                null NULL } ,
+                   } } } } ,
+  {
+    name "StdPDBseqId" ,
+    format {
+      asn1 "PDB-seq-id" ,
+      label "PDB Id: " ,
+      form
+        block {
+          components {
+            {
+              asn1 "PDB-seq-id.mol" ,
+             label "molecule" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                text {
+                 } } ,
+            {
+              asn1 "PDB-seq-id.chain" ,
+             label "chain" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "PDB-seq-id.rel" ,
+             label "release" ,
+             prefix " " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdEMBLseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix ", " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label "accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.release" ,
+             label "release" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.version" ,
+              form
+                null NULL } ,
+                   } } } } ,
+  {
+    name "StdPIRseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdPRFseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdPDBseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdSPseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "," ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdLocalId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+             prefix " " ,
+             suffix "" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdGPseqId" ,
+    format {
+      asn1 "Textseq-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Textseq-id.name" ,
+             label "locus" ,
+             prefix " " ,
+             suffix "," ,
+              form
+                text { 
+                 } } ,
+            {
+              asn1 "Textseq-id.accession" ,
+             label " accession" ,
+             prefix " " ,
+              form
+                text { 
+                 } } ,
+                   } } } } ,
+  {
+    name "StdIdPat" ,
+    format {
+      asn1 "Id-pat" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Id-pat.country" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.number" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.app-number" ,
+              prefix "Appl: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdPatentSeqId" ,
+    format {
+      asn1 "Patent-seq-id" ,
+      label "patent: " ,
+      form
+        block {
+          components {
+            {
+              asn1 "Patent-seq-id.seqid" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Patent-seq-id.cit" ,
+              prefix " " ,
+             form
+                use-template "StdIdPat" } } } } } ,
+  {
+    name "StdSeqFeatLocation" ,
+    format {
+      asn1 "Seq-feat.location" ,
+      label "Location" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "StdSeqFeatProduct" ,
+    format {
+      asn1 "Seq-feat.product" ,
+      label "Product" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "EntrySeqFeatData" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat.data" ,
+      prefix "\t" ,
+      form
+        use-template "StdSeqFeatData" } } ,
+  {
+    name "StdSeqFeat" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat" ,
+      prefix "\n" ,
+      suffix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Seq-feat.data" ,
+              form
+                use-template "StdSeqFeatData" } ,
+            {
+              asn1 "Seq-feat" ,
+              form
+                use-template "StdSeqFeatCommon" } ,
+            {
+              asn1 "Seq-feat.product" ,
+              label "Product" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.location" ,
+              label "Location" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.cit" ,
+              label "Citations" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.cit.pub.E" ,
+                      form
+                        use-template "StdPub" } } } } ,
+            {
+              asn1 "Seq-feat.xref" ,
+              label "Cross-reference" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.xref.E" ,
+                      form
+                        use-template "StdSeqFeatXref" } } } } } } } } ,
+  {
+    name "StdSeqFeatData" ,
+    format {
+      asn1 "SeqFeatData" ,
+      form
+        block {
+          components {
+            {
+              asn1 "SeqFeatData.gene" ,
+              label "Gene" ,
+              form
+                use-template "StdGeneRef" } ,
+            {
+              asn1 "SeqFeatData.org" ,
+              label "Organism" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "SeqFeatData.cdregion" ,
+              label "Coding Region" ,
+              form
+                use-template "StdCdRegion" } ,
+            {
+              asn1 "SeqFeatData.prot" ,
+              label "Protein" ,
+              form
+                use-template "StdProtRef" } ,
+            {
+              asn1 "SeqFeatData.rna" ,
+              label "RNA" ,
+              form
+                use-template "StdRNARef" } ,
+            {
+              asn1 "SeqFeatData.pub" ,
+              label "Citation" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "SeqFeatData.seq" ,
+              label "Sequence" ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "SeqFeatData.imp.key" ,
+              label "Import" ,
+              form
+                use-template "StdImpFeat" } ,
+            {
+              asn1 "SeqFeatData.region" ,
+              label "Region" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.comment" ,
+              label "Comment" ,
+              form
+                null NULL } ,
+            {
+              asn1 "SeqFeatData.bond" ,
+              label "Bond" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.site" ,
+              label "Site" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.rsite" ,
+              label "Rest. Site" ,
+              form
+                use-template "StdRsiteRef" } ,
+            {
+              asn1 "SeqFeatData.user" ,
+              label "User Type" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "SeqFeatData.txinit" ,
+              label "TxInit" ,
+              form
+                use-template "StdTxInit" } ,
+            {
+              asn1 "SeqFeatData.num" ,
+              label "Numbering" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "SeqFeatData.psec-str" ,
+              label "Sec. Struct" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.non-std-residue" ,
+              label "NonStd Residue" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.het" ,
+              label "Heterogen" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.biosrc" ,
+              label "BioSource" ,
+              form
+                null NULL } } } } } ,
+  {
+    name "StdGeneRef" ,
+    format {
+      asn1 "Gene-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Gene-ref" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Gene-ref.locus" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Gene-ref.allele" ,
+                      prefix " " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is a pseudogene." } } ,
+            {
+              asn1 "Gene-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.maploc" ,
+              label "Map Location" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } } } } } ,
+  {
+    name "StdUserObj" ,
+    format {
+      asn1 "User-object" ,
+      label "User-object" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "User-object.class" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "User-object.type" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StartingPubFeatLocation" ,
+    format {
+      asn1 "Seq-feat.location" ,
+      label "Location:" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "StdPubFeatLocation" ,
+    format {
+      asn1 "Seq-feat.location" ,
+      label "" ,
+      prefix "; " ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "StdPubOnFeat" ,
+    format {
+      asn1 "Pub" ,
+      label "Citation" ,
+      prefix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub" ,
+              form
+                use-template "StdPub" } } } } } ,
+  {
+    name "StdPub" ,
+    format {
+      asn1 "Pub" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub.gen" ,
+              form
+                use-template "StdCitGen" } ,
+            {
+              asn1 "Pub.sub" ,
+              form
+                use-template "StdCitSub" } ,
+            {
+              asn1 "Pub.medline" ,
+              form
+                use-template "StdMedlineEntry" } ,
+            {
+              asn1 "Pub.muid" ,
+              label "MEDLINE uid: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Pub.article" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Pub.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Pub.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Pub.proc" ,
+              form
+                use-template "StdCitProc" } ,
+            {
+              asn1 "Pub.patent" ,
+              form
+                use-template "StdCitPat" } ,
+            {
+              asn1 "Pub.pat-id" ,
+              form
+                use-template "StdIdPat" } ,
+            {
+              asn1 "Pub.man" ,
+              form
+                use-template "StdCitLet" } ,
+            {
+              asn1 "Pub.equiv" ,
+              form
+                use-template "StdPubEquiv" } } } } } ,
+  {
+    name "StdCitGen" ,
+    format {
+      asn1 "Cit-gen" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-gen.serial-number" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-gen.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-gen.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.cit" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Cit-gen.journal" ,
+                      suffix ":" ,
+                      form
+                        use-template "StdTitle" } ,
+                    {
+                      asn1 "Cit-gen.issue" ,
+                      suffix ";" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-gen.pages" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitSub" ,
+    format {
+      asn1 "Cit-sub" ,
+      prefix "Data Submission " ,
+      form
+        block {
+          components {
+            {
+              asn1 "Cit-sub.medium" ,
+              prefix "on " ,
+              suffix " " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-sub.imp.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-sub.authors" ,
+              prefix "\n" ,
+              form
+                use-template "StdAuthList" } } } } } ,
+  {
+    name "StdMedlineEntry" ,
+    format {
+      asn1 "Medline-entry" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Medline-entry" ,
+              form
+                block {
+                  separator "   " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.uid" ,
+                      label "uid" ,
+                      prefix ": " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Medline-entry.em" ,
+                      label "entry month" ,
+                      prefix ": " ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } ,
+            {
+              asn1 "Medline-entry.cit" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Medline-entry.abstract" ,
+              label "abstract" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Medline-entry.mesh" ,
+              label "Mesh Terms" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.mesh.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-mesh.term" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-mesh.mp" ,
+                              form
+                                boolean {
+                                  true " (Main Point)" } } ,
+                            {
+                              asn1 "Medline-mesh.qual" ,
+                              form
+                                block {
+                                  separator "\n" ,
+                                  components {
+                                    {
+                                      asn1 "Medline-mesh.qual.E" ,
+                                      form
+                                        block {
+                                          components {
+                                            {
+                                              asn1 "Medline-qual.subh" ,
+                                              form
+                                                text {
+                                                   } } ,
+                                            {
+                                              asn1 "Medline-qual.mp" ,
+                                              form
+                                                boolean {
+                                                  true " (Main Point)" } } } } } } } } } } } } } } ,
+            {
+              asn1 "Medline-entry.substance" ,
+              label "Substance" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.substance.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-rn.name" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-rn.type" ,
+                              form
+                                enum {
+                                  values {
+                                    "" ,
+                                    " CAS: " ,
+                                    "EC " } } } ,
+                            {
+                              asn1 "Medline-rn.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.xref" ,
+              label "Cross Reference" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.xref.E" ,
+                      form
+                        block {
+                          separator ": " ,
+                          components {
+                            {
+                              asn1 "Medline-si.type" ,
+                              form
+                                enum {
+                                   } } ,
+                            {
+                              asn1 "Medline-si.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.gene" ,
+              label "Possible Gene Symbols" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.gene.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Medline-entry.idnum" ,
+              label "Support" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.idnum.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitArt" ,
+    format {
+      asn1 "Cit-art" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-art.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-art.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-art.from.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Cit-art.from.book" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-art.from.proc" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitProc" } } } } } ,
+  {
+    name "StdCitJour" ,
+    format {
+      asn1 "Cit-jour" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-jour.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-jour.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitBook" ,
+    format {
+      asn1 "Cit-book" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-book.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.coll" ,
+              prefix "Collection: " ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-book.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitProc" ,
+    format {
+      asn1 "Cit-proc" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-proc.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-proc.meet" ,
+              label "Meeting " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Meeting.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Meeting.date" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Meeting.place" ,
+                      form
+                        use-template "StdAffil" } } } } } } } } ,
+  {
+    name "StdCitPat" ,
+    format {
+      asn1 "Cit-pat" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-pat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-pat.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-pat" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Cit-pat.country" ,
+                      suffix " " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.doc-type" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.date-issue" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Cit-pat.app-number" ,
+                      prefix " Appl: " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.app-date" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } } } } } ,
+  {
+    name "StdIdPat" ,
+    format {
+      asn1 "Id-pat" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Id-pat.country" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.number" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.app-number" ,
+              prefix "Appl: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdCitLet" ,
+    format {
+      asn1 "Cit-let" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-let.type" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-let.man-id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-let.cit" ,
+              form
+                use-template "StdCitBook" } } } } } ,
+  {
+    name "StdPubEquiv" ,
+    format {
+      asn1 "Pub-equiv" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub-equiv.E" ,
+              form
+                use-template "StdPub" } } } } } ,
+  {
+    name "StdTitle" ,
+    format {
+      asn1 "Title" ,
+      form
+        block {
+          separator ", " ,
+          components {
+            {
+              asn1 "Title.E.trans" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.name" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.tsub" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.abr" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.iso-jta" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.ml-jta" ,
+              label "MEDLINE" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.jta" ,
+              label "jta" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.issn" ,
+              label "ISSN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.coden" ,
+              label "CODEN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.isbn" ,
+              label "ISBN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdAuthList" ,
+    format {
+      asn1 "Auth-list" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Auth-list" ,
+              form
+                user {
+                  printfunc "StdAuthListNamesPrint" } } ,
+            {
+              asn1 "Auth-list.affil" ,
+              form
+                use-template "StdAffil" } } } } } ,
+  {
+    name "StdAffil" ,
+    format {
+      asn1 "Affil" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Affil.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.affil" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.div" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.street" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Affil.std.city" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.sub" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.country" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdImprint" ,
+    format {
+      asn1 "Imprint" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Imprint.date" ,
+              prefix "(" ,
+              suffix ") " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Imprint.volume" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.issue" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.section" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.part-sup" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.pages" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.prepub" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Imprint.pub" ,
+              label "\nPublisher: " ,
+              form
+                use-template "StdAffil" } ,
+            {
+              asn1 "Imprint.cprt" ,
+              label " Copyright: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdSeqFeatXref" ,
+    format {
+      asn1 "SeqFeatXref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "SeqFeatXref.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "SeqFeatXref.data" ,
+              form
+                use-template "StdSeqFeatData" } } } } } ,
+  {
+    name "StdOrgRef" ,
+    format {
+      asn1 "Org-ref" ,
+      label "Org-ref" ,
+      prefix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Org-ref" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Org-ref.taxname" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Org-ref.common" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.mod" ,
+              label "Modifiers" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.mod.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } ,
+            {
+              asn1 "Org-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCdRegion" ,
+    format {
+      asn1 "Cdregion" ,
+      label "Cdregion" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cdregion.orf" ,
+              form
+                boolean {
+                  true "Uncharacterized Open Reading Frame" } } ,
+            {
+              asn1 "Cdregion.frame" ,
+              label "Reading Frame = " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cdregion.code" ,
+              label "Genetic Code: " ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Genetic-code.E.name" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Genetic-code.E.id" ,
+                      label "id= " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Cdregion.conflict" ,
+              form
+                boolean {
+                  true "Translation conflicts with protein sequence" } } ,
+            {
+              asn1 "Cdregion.stops" ,
+              prefix "Translation contains " ,
+              suffix " stop codons" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.gaps" ,
+              prefix "Translation contains " ,
+              suffix " gaps when aligned to protein" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.mismatch" ,
+              prefix "Translation contains " ,
+              suffix " mismatches when aligned to protein" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdProtRef" ,
+    format {
+      asn1 "Prot-ref" ,
+      label "Prot-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Prot-ref.name" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.name.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Prot-ref.ec" ,
+              label "ec" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.ec.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.activity" ,
+              label "activity" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.activity.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.db" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdRNARef" ,
+    format {
+      asn1 "RNA-ref" ,
+      label "RNA-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "RNA-ref.type" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "RNA-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is an RNA pseudogene." } } ,
+            {
+              asn1 "RNA-ref.ext.name" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdPubdesc" ,
+    format {
+      asn1 "Pubdesc" ,
+      label "Pubdesc" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pubdesc.pub" ,
+              form
+                use-template "StdPubEquiv" } ,
+            {
+              asn1 "Pubdesc" ,
+              prefix "In this article:\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Pubdesc.name" ,
+                      label "name=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.fig" ,
+                      label "figure=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.poly-a" ,
+                      form
+                        boolean {
+                          true "poly(A) shown" } } ,
+                    {
+                      asn1 "Pubdesc.maploc" ,
+                      label "map location=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.num" ,
+                      form
+                        use-template "StdNumbering" } ,
+                    {
+                      asn1 "Pubdesc.numexc" ,
+                      form
+                        boolean {
+                          true "numbering inconsistent" } } } } } ,
+            {
+              asn1 "Pubdesc.comment" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdImpFeat" ,
+    format {
+      asn1 "Imp-feat.key" ,
+      label "Imp-feat" ,
+      form
+        text {
+           } } } ,
+  {
+    name "StdRsiteRef" ,
+    format {
+      asn1 "Rsite-ref" ,
+      label "Rsite-ref" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Rsite-ref.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Rsite-ref.std" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdTxInit" ,
+    format {
+      asn1 "Txinit" ,
+      label "TxInit" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Txinit.name" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdNumbering" ,
+    format {
+      asn1 "Numbering" ,
+      label "Numbering" ,
+      form
+        null NULL } } ,
+  {
+    name "StdGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      label "GenBank-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.extra-accessions" ,
+              label "Extra accessions" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.extra-accessions.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.keywords" ,
+              label "Keywords" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.keywords.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.source" ,
+              label "Source: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.origin" ,
+              label "Origin: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.div" ,
+              label "Division: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.taxonomy" ,
+              label "Taxonomy: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.date" ,
+              label "Date: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.entry-date" ,
+              label "Entry date: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdReportGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.extra-accessions" ,
+              label "Extra accessions" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.extra-accessions.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.keywords" ,
+              label "Keywords" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.keywords.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.origin" ,
+              label "Origin: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.date" ,
+              label "Date: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.entry-date" ,
+              label "Entry date: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdSourceInGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.source" ,
+              label "Source: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdDivInGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.div" ,
+              label "Division: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdTaxInGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.taxonomy" ,
+              label "Taxonomy: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdFeatId" ,
+    format {
+      asn1 "Feat-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Feat-id.gibb" ,
+              label "GenInfo Backbone: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.giim.id" ,
+              label "GenInfo Import Id: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.local" ,
+              label "Local: " ,
+              form
+                use-template "StdObjectId" } ,
+            {
+              asn1 "Feat-id.general" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdSeqFeatCommon" ,
+    format {
+      asn1 "Seq-feat" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Seq-feat.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "Seq-feat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat" ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.partial" ,
+                      form
+                        boolean {
+                          true "Partial" } } ,
+                    {
+                      asn1 "Seq-feat.except" ,
+                      form
+                        boolean {
+                          true "Biological Exception" } } ,
+                    {
+                      asn1 "Seq-feat.exp-ev" ,
+                      label "Evidence" ,
+                      prefix " is " ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seq-feat.comment" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat.ext" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seq-feat.qual" ,
+              label "Qualifiers" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.qual.E" ,
+                      prefix "/" ,
+                      form
+                        block {
+                          separator "= " ,
+                          components {
+                            {
+                              asn1 "Gb-qual.qual" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Gb-qual.val" ,
+                              form
+                                text {
+                                   } } } } } } } } } } } } ,
+  {
+    name "StdDbtag" ,
+    format {
+      asn1 "Dbtag" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Dbtag.db" ,
+              suffix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Dbtag.tag" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdObjectId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+              form
+                text {
+                   } } } } } } }
diff --git a/jpred/data/blast/objprt.prt b/jpred/data/blast/objprt.prt

new file mode 100755 (executable)

index 0000000..ffcb2e4
--- /dev/null
+++ b/jpred/data/blast/objprt.prt
@@ -0,0 +1,1802 @@
+PrintTemplateSet ::= {
+  {
+    name "StdSeqDesc" ,
+    format {
+      asn1 "Seqdesc" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Seqdesc.mol-type" ,
+              label "Molecule type" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.modif" ,
+              label "Modifiers" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seqdesc.modif.E" ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seqdesc.method" ,
+              label "Method" ,
+              prefix "\n" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Seqdesc.name" ,
+              label "Name" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.title" ,
+              label "Title" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.org" ,
+              label "Organism" ,
+              prefix "\n" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "Seqdesc.comment" ,
+              label "Comment" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.num" ,
+              label "Numbering" ,
+              prefix "\n" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "Seqdesc.maploc" ,
+              label "Map location" ,
+              prefix "\n" ,
+              form
+                use-template "StdDbtag" } ,
+            {
+              asn1 "Seqdesc.pir" ,
+              label "PIR block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.genbank" ,
+              label "GenBank block" ,
+              prefix "\n" ,
+              form
+                use-template "StdGBBlock" } ,
+            {
+              asn1 "Seqdesc.pub" ,
+              label "Citation" ,
+              prefix "\n" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "Seqdesc.region" ,
+              label "Region" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.user" ,
+              label "User Type" ,
+              prefix "\n" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seqdesc.sp" ,
+              label "SWISS-PROT block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.dbxref" ,
+              label "Cross reference" ,
+              prefix "\n" ,
+              form
+                use-template "StdDbtag"  } ,
+            {
+              asn1 "Seqdesc.embl" ,
+              label "EMBL block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.create-date" ,
+              label "Create date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.update-date" ,
+              label "Update date" ,
+              prefix "\n" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Seqdesc.prf" ,
+              label "PRF block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.pdb" ,
+              label "PDB block" ,
+              prefix "\n" ,
+              form
+                null NULL } ,
+            {
+              asn1 "Seqdesc.het" ,
+              label "Heterogen" ,
+              prefix "\n" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seqdesc.source" ,
+              label "Biological Source" ,
+              prefix "\n" ,
+              form
+                use-template "StdBioSource" } ,
+            {
+              asn1 "Seqdesc.molinfo" ,
+              label "Molecule Information" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "MolInfo.biomol" ,
+                      form
+                        enum {
+                           } } ,
+                    {
+                      asn1 "MolInfo.tech" ,
+                      form
+                        enum {
+                           } } ,
+                    {
+                      asn1 "MolInfo.completeness" ,
+                      form
+                        enum {
+                           } } } } } } } } } ,
+  {
+    name "StdSeqFeatLocation" ,
+    format {
+      asn1 "Seq-feat.location" ,
+      label "Location" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "StdSeqFeatProduct" ,
+    format {
+      asn1 "Seq-feat.product" ,
+      label "Product" ,
+      prefix "\t" ,
+      form
+        user {
+          printfunc "StdSeqLocPrint" } } } ,
+  {
+    name "EntrySeqFeatData" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat.data" ,
+      prefix "\t" ,
+      form
+        use-template "StdSeqFeatData" } } ,
+  {
+    name "StdSeqFeat" ,
+    labelfrom "Seq-feat.data" ,
+    format {
+      asn1 "Seq-feat" ,
+      prefix "\n" ,
+      suffix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Seq-feat.data" ,
+              form
+                use-template "StdSeqFeatData" } ,
+            {
+              asn1 "Seq-feat" ,
+              form
+                use-template "StdSeqFeatCommon" } ,
+            {
+              asn1 "Seq-feat.product" ,
+              label "Product" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.location" ,
+              label "Location" ,
+              prefix " " ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "Seq-feat.cit" ,
+              label "Citations" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.cit.pub.E" ,
+                      form
+                        use-template "StdPub" } } } } ,
+            {
+              asn1 "Seq-feat.xref" ,
+              label "Cross-reference" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.xref.E" ,
+                      form
+                        use-template "StdSeqFeatXref" } } } } } } } } ,
+  {
+    name "StdSeqFeatData" ,
+    format {
+      asn1 "SeqFeatData" ,
+      form
+        block {
+          components {
+            {
+              asn1 "SeqFeatData.gene" ,
+              label "Gene" ,
+              form
+                use-template "StdGeneRef" } ,
+            {
+              asn1 "SeqFeatData.org" ,
+              label "Organism" ,
+              form
+                use-template "StdOrgRef" } ,
+            {
+              asn1 "SeqFeatData.cdregion" ,
+              label "Coding Region" ,
+              form
+                use-template "StdCdRegion" } ,
+            {
+              asn1 "SeqFeatData.prot" ,
+              label "Protein" ,
+              form
+                use-template "StdProtRef" } ,
+            {
+              asn1 "SeqFeatData.rna" ,
+              label "RNA" ,
+              form
+                use-template "StdRNARef" } ,
+            {
+              asn1 "SeqFeatData.pub" ,
+              label "Citation" ,
+              form
+                use-template "StdPubdesc" } ,
+            {
+              asn1 "SeqFeatData.seq" ,
+              label "Sequence" ,
+              form
+                user {
+                  printfunc "StdSeqLocPrint" } } ,
+            {
+              asn1 "SeqFeatData.imp.key" ,
+              label "Import" ,
+              form
+                use-template "StdImpFeat" } ,
+            {
+              asn1 "SeqFeatData.region" ,
+              label "Region" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.comment" ,
+              label "Comment" ,
+              form
+                null NULL } ,
+            {
+              asn1 "SeqFeatData.bond" ,
+              label "Bond" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.site" ,
+              label "Site" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.rsite" ,
+              label "Rest. Site" ,
+              form
+                use-template "StdRsiteRef" } ,
+            {
+              asn1 "SeqFeatData.user" ,
+              label "User Type" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "SeqFeatData.txinit" ,
+              label "TxInit" ,
+              form
+                use-template "StdTxInit" } ,
+            {
+              asn1 "SeqFeatData.num" ,
+              label "Numbering" ,
+              form
+                use-template "StdNumbering" } ,
+            {
+              asn1 "SeqFeatData.psec-str" ,
+              label "Sec. Struct" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "SeqFeatData.non-std-residue" ,
+              label "NonStd Residue" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.het" ,
+              label "Heterogen" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "SeqFeatData.biosrc" ,
+              label "Biological Source" ,
+              prefix "\n" ,
+              form
+                use-template "StdBioSource" } } } } } ,
+  {
+    name "StdGeneRef" ,
+    format {
+      asn1 "Gene-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Gene-ref" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Gene-ref.locus" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Gene-ref.allele" ,
+                      prefix " " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is a pseudogene." } } ,
+            {
+              asn1 "Gene-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Gene-ref.maploc" ,
+              label "Map Location" ,
+              prefix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Gene-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Gene-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } } } } } ,
+  {
+    name "StdUserObj" ,
+    format {
+      asn1 "User-object" ,
+      label "User-object" ,
+      prefix "\n" ,
+      form
+        block {
+          separator ": " ,
+          components {
+            {
+              asn1 "User-object.class" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "User-object.type" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdPubOnFeat" ,
+    format {
+      asn1 "Pub" ,
+      label "Citation" ,
+      prefix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub" ,
+              form
+                use-template "StdPub" } } } } } ,
+  {
+    name "StdPub" ,
+    format {
+      asn1 "Pub" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub.gen" ,
+              form
+                use-template "StdCitGen" } ,
+            {
+              asn1 "Pub.sub" ,
+              form
+                use-template "StdCitSub" } ,
+            {
+              asn1 "Pub.medline" ,
+              form
+                use-template "StdMedlineEntry" } ,
+            {
+              asn1 "Pub.muid" ,
+              label "MEDLINE uid: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Pub.pmid" ,
+              label "PubMed id: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Pub.article" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Pub.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Pub.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Pub.proc" ,
+              form
+                use-template "StdCitProc" } ,
+            {
+              asn1 "Pub.patent" ,
+              form
+                use-template "StdCitPat" } ,
+            {
+              asn1 "Pub.pat-id" ,
+              form
+                use-template "StdIdPat" } ,
+            {
+              asn1 "Pub.man" ,
+              form
+                use-template "StdCitLet" } ,
+            {
+              asn1 "Pub.equiv" ,
+              form
+                use-template "StdPubEquiv" } } } } } ,
+  {
+    name "StdCitGen" ,
+    format {
+      asn1 "Cit-gen" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-gen.serial-number" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-gen.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-gen.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen.cit" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-gen" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Cit-gen.journal" ,
+                      suffix ":" ,
+                      form
+                        use-template "StdTitle" } ,
+                    {
+                      asn1 "Cit-gen.issue" ,
+                      suffix ";" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-gen.pages" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitSub" ,
+    format {
+      asn1 "Cit-sub" ,
+      prefix "Data Submission " ,
+      form
+        block {
+          components {
+            {
+              asn1 "Cit-sub.medium" ,
+              prefix "on " ,
+              suffix " " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-sub.imp.date" ,
+              prefix "(" ,
+              suffix ")" ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Cit-sub.authors" ,
+              prefix "\n" ,
+              form
+                use-template "StdAuthList" } } } } } ,
+  {
+    name "StdMedlineEntry" ,
+    format {
+      asn1 "Medline-entry" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Medline-entry" ,
+              form
+                block {
+                  separator "   " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.uid" ,
+                      label "uid" ,
+                      prefix ": " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Medline-entry.em" ,
+                      label "entry month" ,
+                      prefix ": " ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } ,
+            {
+              asn1 "Medline-entry.cit" ,
+              form
+                use-template "StdCitArt" } ,
+            {
+              asn1 "Medline-entry.abstract" ,
+              label "abstract" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Medline-entry.mesh" ,
+              label "Mesh Terms" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.mesh.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-mesh.term" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-mesh.mp" ,
+                              form
+                                boolean {
+                                  true " (Main Point)" } } ,
+                            {
+                              asn1 "Medline-mesh.qual" ,
+                              form
+                                block {
+                                  separator "\n" ,
+                                  components {
+                                    {
+                                      asn1 "Medline-mesh.qual.E" ,
+                                      form
+                                        block {
+                                          components {
+                                            {
+                                              asn1 "Medline-qual.subh" ,
+                                              form
+                                                text {
+                                                   } } ,
+                                            {
+                                              asn1 "Medline-qual.mp" ,
+                                              form
+                                                boolean {
+                                                  true " (Main Point)" } } } } } } } } } } } } } } ,
+            {
+              asn1 "Medline-entry.substance" ,
+              label "Substance" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.substance.E" ,
+                      form
+                        block {
+                          components {
+                            {
+                              asn1 "Medline-rn.name" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Medline-rn.type" ,
+                              form
+                                enum {
+                                  values {
+                                    "" ,
+                                    " CAS: " ,
+                                    "EC " } } } ,
+                            {
+                              asn1 "Medline-rn.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.xref" ,
+              label "Cross Reference" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Medline-entry.xref.E" ,
+                      form
+                        block {
+                          separator ": " ,
+                          components {
+                            {
+                              asn1 "Medline-si.type" ,
+                              form
+                                enum {
+                                   } } ,
+                            {
+                              asn1 "Medline-si.cit" ,
+                              form
+                                text {
+                                   } } } } } } } } ,
+            {
+              asn1 "Medline-entry.gene" ,
+              label "Possible Gene Symbols" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.gene.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Medline-entry.idnum" ,
+              label "Support" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Medline-entry.idnum.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdCitArt" ,
+    format {
+      asn1 "Cit-art" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-art.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-art.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-art.from.journal" ,
+              form
+                use-template "StdCitJour" } ,
+            {
+              asn1 "Cit-art.from.book" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-art.from.proc" ,
+              prefix "(in) " ,
+              form
+                use-template "StdCitProc" } } } } } ,
+  {
+    name "StdCitJour" ,
+    format {
+      asn1 "Cit-jour" ,
+      form
+        block {
+          separator " " ,
+          components {
+            {
+              asn1 "Cit-jour.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-jour.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitBook" ,
+    format {
+      asn1 "Cit-book" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-book.title" ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.coll" ,
+              prefix "Collection: " ,
+              form
+                use-template "StdTitle" } ,
+            {
+              asn1 "Cit-book.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-book.imp" ,
+              form
+                use-template "StdImprint" } } } } } ,
+  {
+    name "StdCitProc" ,
+    format {
+      asn1 "Cit-proc" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-proc.book" ,
+              form
+                use-template "StdCitBook" } ,
+            {
+              asn1 "Cit-proc.meet" ,
+              label "Meeting " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Meeting.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Meeting.date" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Meeting.place" ,
+                      form
+                        use-template "StdAffil" } } } } } } } } ,
+  {
+    name "StdCitPat" ,
+    format {
+      asn1 "Cit-pat" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-pat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-pat.authors" ,
+              form
+                use-template "StdAuthList" } ,
+            {
+              asn1 "Cit-pat" ,
+              form
+                block {
+                  components {
+                    {
+                      asn1 "Cit-pat.country" ,
+                      suffix " " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.doc-type" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.number" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.date-issue" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } ,
+                    {
+                      asn1 "Cit-pat.app-number" ,
+                      prefix " Appl: " ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Cit-pat.app-date" ,
+                      prefix " (" ,
+                      suffix ")" ,
+                      form
+                        user {
+                          printfunc "StdDatePrint" } } } } } } } } } ,
+  {
+    name "StdIdPat" ,
+    format {
+      asn1 "Id-pat" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Id-pat.country" ,
+              suffix " " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.number" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Id-pat.id.app-number" ,
+              prefix "Appl: " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdCitLet" ,
+    format {
+      asn1 "Cit-let" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cit-let.type" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cit-let.man-id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cit-let.cit" ,
+              form
+                use-template "StdCitBook" } } } } } ,
+  {
+    name "StdPubEquiv" ,
+    format {
+      asn1 "Pub-equiv" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pub-equiv.E" ,
+              form
+                use-template "StdPub" } } } } } ,
+  {
+    name "StdTitle" ,
+    format {
+      asn1 "Title" ,
+      form
+        block {
+          separator ", " ,
+          components {
+            {
+              asn1 "Title.E.trans" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.name" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.tsub" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.abr" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.iso-jta" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.ml-jta" ,
+              label "MEDLINE" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.jta" ,
+              label "jta" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.issn" ,
+              label "ISSN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.coden" ,
+              label "CODEN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Title.E.isbn" ,
+              label "ISBN" ,
+              prefix ": " ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdAuthList" ,
+    format {
+      asn1 "Auth-list" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Auth-list" ,
+              form
+                user {
+                  printfunc "StdAuthListNamesPrint" } } ,
+            {
+              asn1 "Auth-list.affil" ,
+              form
+                use-template "StdAffil" } } } } } ,
+  {
+    name "StdAffil" ,
+    format {
+      asn1 "Affil" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Affil.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.affil" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.div" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std.street" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Affil.std" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Affil.std.city" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.sub" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Affil.std.country" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdImprint" ,
+    format {
+      asn1 "Imprint" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Imprint.date" ,
+              prefix "(" ,
+              suffix ") " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } ,
+            {
+              asn1 "Imprint.volume" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.issue" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.section" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.part-sup" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.pages" ,
+              prefix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Imprint.prepub" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Imprint.pub" ,
+              label "\nPublisher: " ,
+              form
+                use-template "StdAffil" } ,
+            {
+              asn1 "Imprint.cprt" ,
+              label " Copyright: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdSeqFeatXref" ,
+    format {
+      asn1 "SeqFeatXref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "SeqFeatXref.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "SeqFeatXref.data" ,
+              form
+                use-template "StdSeqFeatData" } } } } } ,
+  {
+    name "StdOrgRef" ,
+    format {
+      asn1 "Org-ref" ,
+      label "Org-ref" ,
+      prefix "\n" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Org-ref" ,
+              form
+                block {
+                  separator " " ,
+                  components {
+                    {
+                      asn1 "Org-ref.taxname" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Org-ref.common" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.mod" ,
+              label "Modifiers" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.mod.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Org-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } ,
+            {
+              asn1 "Org-ref.syn" ,
+              label "Synonyms" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Org-ref.syn.E" ,
+                      form
+                        text {
+                           } } } } } } } } } ,
+  {
+    name "StdBioSource" ,
+    format {
+      asn1 "BioSource" ,
+      label "BioSource" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "BioSource.genome" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "BioSource.org" ,
+              label "Organism" ,
+              form
+                use-template "StdOrgRef" } } } } } ,
+  {
+    name "StdCdRegion" ,
+    format {
+      asn1 "Cdregion" ,
+      label "Cdregion" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Cdregion.orf" ,
+              form
+                boolean {
+                  true "Uncharacterized Open Reading Frame" } } ,
+            {
+              asn1 "Cdregion.frame" ,
+              label "Reading Frame = " ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Cdregion.code" ,
+              label "Genetic Code: " ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Genetic-code.E.name" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Genetic-code.E.id" ,
+                      label "id= " ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Cdregion.conflict" ,
+              form
+                boolean {
+                  true "Translation conflicts with protein sequence" } } ,
+            {
+              asn1 "Cdregion.stops" ,
+              prefix "Translation contains " ,
+              suffix " stop codons" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.gaps" ,
+              prefix "Translation contains " ,
+              suffix " gaps when aligned to protein" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Cdregion.mismatch" ,
+              prefix "Translation contains " ,
+              suffix " mismatches when aligned to protein" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdProtRef" ,
+    format {
+      asn1 "Prot-ref" ,
+      label "Prot-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Prot-ref.name" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.name.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.desc" ,
+              prefix "[" ,
+              suffix "]" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Prot-ref.processed" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "Prot-ref.ec" ,
+              label "ec" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.ec.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.activity" ,
+              label "activity" ,
+              prefix ": " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.activity.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "Prot-ref.db" ,
+              label "Cross Reference" ,
+              prefix " " ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Prot-ref.db.E" ,
+                      prefix "(" ,
+                      suffix ")" ,
+                      form
+                        use-template "StdDbtag" } } } } } } } } ,
+  {
+    name "StdRNARef" ,
+    format {
+      asn1 "RNA-ref" ,
+      label "RNA-ref" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "RNA-ref.type" ,
+              form
+                enum {
+                   } } ,
+            {
+              asn1 "RNA-ref.pseudo" ,
+              form
+                boolean {
+                  true "This is an RNA pseudogene." } } ,
+            {
+              asn1 "RNA-ref.ext.name" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdPubdesc" ,
+    format {
+      asn1 "Pubdesc" ,
+      label "Pubdesc" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Pubdesc.pub" ,
+              form
+                use-template "StdPubEquiv" } ,
+            {
+              asn1 "Pubdesc" ,
+              prefix "In this article:\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Pubdesc.name" ,
+                      label "name=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.fig" ,
+                      label "figure=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.poly-a" ,
+                      form
+                        boolean {
+                          true "poly(A) shown" } } ,
+                    {
+                      asn1 "Pubdesc.maploc" ,
+                      label "map location=" ,
+                      form
+                        text {
+                           } } ,
+                    {
+                      asn1 "Pubdesc.num" ,
+                      form
+                        use-template "StdNumbering" } ,
+                    {
+                      asn1 "Pubdesc.numexc" ,
+                      form
+                        boolean {
+                          true "numbering inconsistent" } } } } } ,
+            {
+              asn1 "Pubdesc.comment" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdImpFeat" ,
+    format {
+      asn1 "Imp-feat.key" ,
+      label "Imp-feat" ,
+      form
+        text {
+           } } } ,
+  {
+    name "StdRsiteRef" ,
+    format {
+      asn1 "Rsite-ref" ,
+      label "Rsite-ref" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Rsite-ref.str" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Rsite-ref.std" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdTxInit" ,
+    format {
+      asn1 "Txinit" ,
+      label "TxInit" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Txinit.name" ,
+              form
+                text {
+                   } } } } } } ,
+  {
+    name "StdNumbering" ,
+    format {
+      asn1 "Numbering" ,
+      label "Numbering" ,
+      form
+        null NULL } } ,
+  {
+    name "StdGBBlock" ,
+    format {
+      asn1 "GB-block" ,
+      label "GenBank-block" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "GB-block.extra-accessions" ,
+              label "Extra accessions" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.extra-accessions.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.keywords" ,
+              label "Keywords" ,
+              prefix " (" ,
+              suffix ")" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "GB-block.keywords.E" ,
+                      form
+                        text {
+                           } } } } } ,
+            {
+              asn1 "GB-block.source" ,
+              label "Source: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.origin" ,
+              label "Origin: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.div" ,
+              label "Division: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.taxonomy" ,
+              label "Taxonomy: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.date" ,
+              label "Date: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "GB-block.entry-date" ,
+              label "Entry date: " ,
+              form
+                user {
+                  printfunc "StdDatePrint" } } } } } } ,
+  {
+    name "StdFeatId" ,
+    format {
+      asn1 "Feat-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Feat-id.gibb" ,
+              label "GenInfo Backbone: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.giim.id" ,
+              label "GenInfo Import Id: " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Feat-id.local" ,
+              label "Local: " ,
+              form
+                use-template "StdObjectId" } ,
+            {
+              asn1 "Feat-id.general" ,
+              form
+                use-template "StdDbtag" } } } } } ,
+  {
+    name "StdSeqFeatCommon" ,
+    format {
+      asn1 "Seq-feat" ,
+      form
+        block {
+          separator "\n" ,
+          components {
+            {
+              asn1 "Seq-feat.id" ,
+              label "Id=" ,
+              form
+                use-template "StdFeatId" } ,
+            {
+              asn1 "Seq-feat.title" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat" ,
+              suffix ";" ,
+              form
+                block {
+                  separator ", " ,
+                  components {
+                    {
+                      asn1 "Seq-feat.partial" ,
+                      form
+                        boolean {
+                          true "Partial" } } ,
+                    {
+                      asn1 "Seq-feat.except" ,
+                      form
+                        boolean {
+                          true "Biological Exception" } } ,
+                    {
+                      asn1 "Seq-feat.exp-ev" ,
+                      label "Evidence" ,
+                      prefix " is " ,
+                      form
+                        enum {
+                           } } } } } ,
+            {
+              asn1 "Seq-feat.comment" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Seq-feat.ext" ,
+              form
+                use-template "StdUserObj" } ,
+            {
+              asn1 "Seq-feat.qual" ,
+              label "Qualifiers" ,
+              prefix "\n" ,
+              form
+                block {
+                  separator "\n" ,
+                  components {
+                    {
+                      asn1 "Seq-feat.qual.E" ,
+                      prefix "/" ,
+                      form
+                        block {
+                          separator "= " ,
+                          components {
+                            {
+                              asn1 "Gb-qual.qual" ,
+                              form
+                                text {
+                                   } } ,
+                            {
+                              asn1 "Gb-qual.val" ,
+                              form
+                                text {
+                                   } } } } } } } } } } } } ,
+  {
+    name "StdDbtag" ,
+    format {
+      asn1 "Dbtag" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Dbtag.db" ,
+              suffix ": " ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Dbtag.tag" ,
+              form
+                use-template "StdObjectId" } } } } } ,
+  {
+    name "StdObjectId" ,
+    format {
+      asn1 "Object-id" ,
+      form
+        block {
+          components {
+            {
+              asn1 "Object-id.id" ,
+              form
+                text {
+                   } } ,
+            {
+              asn1 "Object-id.str" ,
+              form
+                text {
+                   } } } } } } }
diff --git a/jpred/data/blast/pubkey.enc b/jpred/data/blast/pubkey.enc

new file mode 100755 (executable)

index 0000000..f1272c6
--- /dev/null
+++ b/jpred/data/blast/pubkey.enc
@@ -0,0 +1,22 @@
+-- $Revision: 1.1.1.1.2.1 $
+-- What follows is the public encryption key to be used in NCBI Network
+-- services, effective 18 May 1994.
+-- 
+-- This key can be confirmed in several possible ways:
+-- (1) It will appear in the "data" directory on Entrez CD-ROMs release 11.0
+--     and higher
+-- (2) Beginning in June of 1994, it will appear within the NCBI toolbox
+--     on ftp.ncbinih.gov:/toolbox/ncbi_tools
+-- (3) As a last resort, if you wish to confirm this information, call
+--     (301)496-2475 and ask for "NCBI network services".
+
+RSA-Pubkey ::= {
+  bits 508 ,
+  modulus '0000000000000000000000000000000000000000000000000000000000000000000
+00000000000000000000000000000000000000000000000000000000000000D7AA28FCB6508A85
+F63C439AA60AF7B7B0DB7570683FB457C9E3918BFF90EFF15CFE2893D3FE1AED81C1FDFE1107DA
+0AFB349870F2F9CF729B34001C73A2365'H ,
+  exponent '000000000000000000000000000000000000000000000000000000000000000000
+000000000000000000000000000000000000000000000000000000000000000000000000000000
+000000000000000000000000000000000000000000000000000000000000000000000000000000
+0000000000000000000000000000010001'H }
diff --git a/jpred/data/blast/seqcode.val b/jpred/data/blast/seqcode.val

new file mode 100755 (executable)

index 0000000..88eac76

Binary files /dev/null and b/jpred/data/blast/seqcode.val differ
diff --git a/jpred/data/blast/sequin.hlp b/jpred/data/blast/sequin.hlp

new file mode 100755 (executable)

index 0000000..805854b
--- /dev/null
+++ b/jpred/data/blast/sequin.hlp
@@ -0,0 +1,4006 @@
+<HTML> <HEAD>
+
+<TITLE>Sequin help documentation</TITLE>
+
+<!-- if you use the following meta tags, uncomment them.
+ <meta name="author" content="sequindoc">
+ <META NAME="keywords" CONTENT="national center for biotechnology information, ncbi, national library of medicine, nlm, national institutes of health, nih, database, archive, bookshelf, pubmed, pubmed central, bioinformatics, biomedicine, sequence submission, sequin, bankit, submitting sequences">
+ <META NAME="description" CONTENT="Sequin is a stand-alone software tool developed by the National Center for Biotechnology Information (NCBI) for submitting and updating entries to the GenBank, EMBL, or DDBJ sequence databases. "> -->
+ <link rel="stylesheet" href="ncbi_sequin.css">
+
+</HEAD> 
+
+<body bgcolor="#FFFFFF" text="#000000" link="#0033CC" vlink="#0033CC">
+<!-- change the link and vlink colors from the original orange (link="#CC6600" vlink="#CC6600") -->
+
+<!--  the header   --> 
+<table border="0" width="600" cellspacing="0" cellpadding="0">
+  <tr> 
+    <td width="140"><a href="http://www.ncbi.nlm.nih.gov"> <img src="http://www.ncbi.nlm.nih.gov/corehtml/left.GIF" width="130" height="45" border="0"></a></td>
+    <td width="360" class="head1" valign="BOTTOM"> <span class="H1">Sequin Help Documentation</span></td>
+<!--    <td width="100" valign="BOTTOM">Your Logo</td> -->
+  </tr>
+</table>
+
+<!--  the quicklinks bar   --> 
+<table CLASS="TEXT" border="0" width="600" cellspacing="0" cellpadding="3" bgcolor="#000000">
+  <tr CLASS="TEXT"  align="CENTER"> 
+    <td width="100"><a href="index.html" class="BAR">Sequin</a></td>
+    <td width="100"><a href="http://www.ncbi.nlm.nih.gov/Entrez/" class="BAR">Entrez</a></td>
+    <td width="100"><a href="http://www.ncbi.nlm.nih.gov/BLAST/" class="BAR">BLAST</a></td>
+    <td width="100"><a href="http://www.ncbi.nlm.nih.gov/omim/" class="BAR">OMIM</a></td>
+    <td width="100"><a href="http://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html" class="BAR">Taxonomy</a></td>
+    <td width="100"><a href="http://www.ncbi.nlm.nih.gov/Structure/" class="BAR">Structure</a></td>
+  </tr>
+</table>
+
+<!--  the contents   --> 
+<P>&nbsp
+
+<H2>Table of Contents</H2>
+
+<HR>
+
+>Introduction
+
+#Sequin is a program designed to aid in the submission of sequences to
+the GenBank, EMBL, and DDBJ sequence databases.  It was written at the
+National Center for Biotechnology Information, part of the National
+Library of Medicine at the National Institutes of Health.  This section
+of the help document provides a basic overview of how to submit
+sequences using the Sequin forms.  Subsequent sections provide detailed
+instructions for entering information on each form.
+
+*The Help Documentation
+
+#The Sequin help documentation is available in both on-line and World
+Wide Web (http://www.ncbi.nlm.nih.gov/Sequin/sequin.hlp.html) formats.
+The text of the on-line version scrolls as you progress through the
+Sequin forms.  Specific words or phrases can be identified with the
+"find" command at the top of the window.  The on-line document can also
+be saved as a text file, or printed directly to a printer.  Click on the
+window that contains the help documentation.  Under the Sequin File
+menu, choose Export Help... to save the documentation as a text file. 
+To print the documentation without saving it first, click on the help
+window, and choose Print from the Sequin File menu.
+
+*Organization of Forms
+
+#Information is entered into Sequin on a number of different forms. Each
+form is made up of pages, which are indicated by folder tabs at the top
+of the form.  You can move to the desired page by clicking on the
+appropriate folder tab.  You can also move between pages of a form by
+clicking on the "Next page" or "Prev page" buttons at the bottom of the
+screen.  You can move to the previous form or the next form by clicking
+on the "Prev form" or "Next form" buttons on the first or last pages of
+a form, respectively.
+
+#There are numerous ways to enter information onto a page of a form,
+#including text fields, radio buttons, check boxes, scrolling boxes,
+#pop-up menus and spreadsheets.
+
+#You may also use tables to import annotation of source information. 
+#The formatting of these tables will be discussed below.
+
+*Overview of Sequin
+
+#If you are using Sequin for the first time, you will be prompted to
+fill out four forms:  the Welcome to Sequin form, the Submitting
+Authors Form, the Sequence Format form, and the Organism and Sequences
+Form. After you have filled out these forms, a window will appear that
+contains the Sequin record viewer. This viewer allows you to access
+many other forms in which you can edit fields filled out in the three
+initial forms, as well as add additional information.  Detailed
+instructions on how to fill out the forms and use the record viewer are
+presented below.
+
+>Welcome to Sequin Form
+
+#First, indicate with one of the three radio buttons whether you are
+submitting the sequence to the GenBank, EMBL, or DDBJ database.  If you
+are working on a sequence submission for the first time, click on
+"Start New Submission".  If you are modifying an existing submission
+record, click on "Read Existing Record". If you would like to quit from
+Sequin, click on "Quit Program".
+
+#You can also "Read Existing Record" to read in a FASTA-formatted
+#sequence file
+for analysis purposes.  The sequence will be displayed in Sequin and
+can be analyzed with tools such as CDD Search, but it should not be
+submitted because it does not have the appropriate annotations.
+
+#If you are running Sequin in its network-aware mode, you will see
+another button labeled "Download from Entrez".  This option allows you
+to update an existing database record using Sequin. The record will be
+downloaded from GenBank into Sequin using NCBI's Entrez retrieval
+system.  The contents of the record will appear in Sequin, and you can
+edit them by updating the sequence or the annotations, as necessary.  If
+you do not see the button labeled "Download from Entrez" on the Welcome
+to Sequin form, you are not running Sequin in its network-aware mode. 
+To make Sequin network-aware, see the
+<A HREF="#NetConfigure">
+instructions
+</A> 
+later in the help documentation.
+
+#You can update only those records that you have submitted, not those
+submitted by others.  To update an existing record, first select which
+of the databases you will be sending the update to.  This should be the
+database to which the original record was submitted.  If you do not
+know which database to use, send the record to GenBank and the NCBI
+staff will forward it to the appropriate database.  Next, click on the
+button "Download from Entrez". Enter the nucleotide Accession number or
+GI of the sequence on the first form. Then enter "yes" if you are
+planning to submit the record as an update to one of the databases.
+Fill out the Submitting Authors form.
+
+<A HREF="#EditSubmitterInfo">
+Instructions
+</A> 
+
+for this form are found in the Sequin help documentation under "Edit
+Submitter Info" under the Sequin File menu.  The record will then open
+in the record viewer.  Explanations of how to add annotations or update
+sequences are presented in the documentation entitled 
+
+<A HREF="#EditingtheRecord">
+"Editing the record"
+</A> 
+and 
+<A HREF="#SequenceEditor">
+"Sequence Editor"
+</A>
+
+ respectively.  You will not see the Submitting Authors Form, the
+Sequence Format Form, or the Organism and Sequences Form.  Note that
+updates, as well as new records, must be emailed to the appropriate
+database.  Sequin does not support direct submission of records over the
+Internet.
+
+#Additional configuration options are available under the Misc menu. 
+You can toggle between the stand-alone and network-aware modes of
+Sequin.  The default mode of Sequin, which is sufficient for most
+sequence submissions, is stand-alone.  In its network-aware mode, Sequin
+can exchange data with NCBI and, for example, retrieve sequences
+from Entrez and perform Taxonomy searches.  The network-aware mode of
+Sequin is described in detail in the 
+<A HREF="#NetConfigure">
+Net Configure
+</A> 
+section below.  You can also start the NCBI DeskTop, which is for
+advanced Sequin users only. 
+
+>Submitting Authors Form
+
+#Information from this form will be used as a citation for the sequence
+entry itself.  It can contain the same information found in citations
+associated with the formal publication of the sequence.
+
+#On the bottom of each form are two buttons.  Click "Prev form" (first
+page in a form) or "Prev page" (subsequent pages in a form) to go to the
+previous form or page.  Click "Next Form" (last page on a form) or "Next
+Page" (earlier pages on a form) to move to the next form or page.
+
+#Form pages can also be saved individually by using the "Export" function
+under the File menu.  If you are processing multiple submissions, you
+can use the "Import" function under the File menu to paste previously
+entered information directly on the page.
+
+#The Contact, Authors, and Affiliation pages can be saved as a block so
+that you can use this information for your next submission.  For your
+first Sequin submission, fill in the requested information on the
+Submitting Authors form and proceed with the preparation of the
+submission.  Choose Export Submitter Info under the File menu to export
+this to a file.  You can then import this information in subsequent
+submissions using the Import Submitter Info in the File menu.  You will
+need to fill in the manuscript title for each submission however.
+
+*Submission Page
+
+**When May We Release Your Sequence Record?
+
+#Please select one of the two radio buttons.  If you select
+#"Immediately After Processing", the
+entry will be released to the public after the database staff has added
+it to the database. If you select "Release Date", fields will appear in
+which you can indicate the date on which the sequences should be
+released to the public.  The submission will then be held back until
+formal publication of the sequence or GenBank Accession number, or
+until the release date, whichever comes first.
+
+**Tentative Title for Manuscript
+
+#Please enter a title that appropriately describes the sequence entry.
+ Later in the submission process, you will have the
+opportunity to change this information and add details for published
+or in press references.   
+
+*Contact Page
+
+#Please enter the name, telephone and fax numbers, and email address of
+the person who is submitting the sequence.  This is the person who will
+be contacted regarding the sequence submission.  The phone, fax, and
+email address will not be visible in the database record, but are
+essential for contact by the database staff.
+
+*Authors Page
+
+#Please enter the names of the people who should receive scientific
+credit for the generation of sequences in this entry.  The person on
+the Contact page is automatically listed as the first author.  This
+information can be changed if necessary. The author names should be
+entered in the order first name, middle initial, surname.  You can add
+as many authors to this page as you wish.  After you type in the name
+of the third author, the box becomes a spreadsheet, and you can scroll
+down to the next line by using the space bar.  The consortium box
+should only be used for consortium names, not institute or department
+names.
+
+*Affiliation Page
+
+#Please enter information about the principal institution where the
+sequencing was performed.  This is not necessarily the same as the
+workplace of the person described on the Contact page.  This information
+will show up in the reference section of the record, with the title
+Direct Submission.  
+
+>Sequence Format Form
+
+#Use this form to indicate the type, format and category of sequence
+#you are submitting. 
+
+#Sequin can process single nucleotide sequences, gapped sequences and
+sets of related sequences.  If the sequences are related in terms of
+coming from the same publication, or the same organism, they may be
+candidates for a Batch submission.  Biologically related sequences may
+be classified as environmental samples, population, phylogenetic,
+mutation, or segmented sets as appropriate.  Segmented sets consist of
+a collection of non-overlapping sequences covering a specific genetic
+region.  In all cases, although the sequences are handled as a single
+submission, each sequence in a set will receive its own database
+Accession number and can be annotated independently.
+
+#Sequin can display the alignments of sequences that are submitted as
+part of an aligned phylogenetic, population, mutation set, or
+environmental samples.  Such sequences can be submitted in FASTA,
+Contiguous (FASTA+GAP, NEXUS, MACAW), or Interleaved (PHYLIP, NEXUS)
+formats.  If the sequences are in FASTA format, Sequin can generate an
+alignment. If the sequences have already been aligned in FASTA+GAP,
+PHYLIP, MACAW, or NEXUS, Sequin will not change the alignment. If one
+of the sequences in your alignment is already present in the
+GenBank/EMBL/DDBJ database, you must mark that sequence so that it does
+not receive a new Accession number. Instead of supplying that sequence
+with a new Sequence Identifier, give it the identifier accU12345, where
+U12345 is the Accession number of the sequence.
+
+#Single sequences, gapped sequences, segmented sequences, and batch
+submissions must be submitted in FASTA format.  
+
+*Submission Type
+
+#Use the radio buttons to indicate which of the following types of
+submissions you are creating:
+
+#-Single sequence: a single mRNA or genomic DNA sequence.  If you are
+submitting multiple sequences from the same publication, consider a
+Batch Submission.  If you decide to submit multiple Sequin files, each
+with one or more sequences, please send each file in a separate email
+message.
+
+#-Segmented sequence: a collection of non-overlapping, non-contiguous
+sequences that cover a specified genetic region.  A standard example is
+a set of genomic DNA sequences that encode exons from a gene along with
+fragments of their flanking introns.  If the segmented set is part of
+an alignment, however, select the appropriate Population, Phylogenetic,
+or Mutation study button.
+
+#-Gapped sequence: a single, non-contiguous mRNA or genomic DNA sequence.
+A gapped sequence contains specified gaps of know or unknown length
+where the exact nucleotide sequence has not been determined.  The FASTA
+format for gapped sequences is slightly different and is explained
+below.
+
+#-Population study: a set of sequences that were derived by sequencing
+the same gene from different isolates of the same organism.
+
+#-Phylogenetic study: a set of sequences that were derived by sequencing
+the same gene from different organisms.
+
+#-Mutation study: a set of sequences that were derived by sequencing
+multiple mutations of a single gene.
+
+#-Environmental samples: a set of sequences that were derived by
+sequencing the same gene from a population of unclassified or unknown
+organisms.
+
+#-Batch submission: a set of related sequences that are not part of a
+population, mutation, or phylogenetic study. The sequences should be
+related in some way, such as coming from the same publication or
+organism.  You should plan that all sequences will be released to the
+public on the same date. 
+
+*Sequence Data Format
+
+#If you are submitting a single, gapped, or segmented sequence, or a
+batch submission, your sequence must be in FASTA format, described
+below.  If you are submitting a set of sequences as part of a
+population, phylogenetic, or mutation study, you have a choice of
+sequence formats.  You may submit the set as individual sequences in
+FASTA format.  Alternatively, you can submit the sequences as part of
+an alignment.  Sequin currently accepts the alignment formats
+FASTA+GAP, PHYLIP, MACAW, NEXUS Interleaved, and NEXUS Contiguous. 
+
+*Submission Category
+
+#Use the radio buttons to indicate whether your sequence corresponds to
+an original submission or a third-party annotation submission.  If you
+have directly sequenced the nucleotide sequence in your laboratory,
+your submission would be considered an original submission.
+
+#If you have downloaded the sequence from GenBank and added to it your
+own annotations, your entry may be eligible for submission to the
+Third-Party Annotation Database
+
+<A HREF="http://www.ncbi.nlm.nih.gov/Genbank/tpa.html">
+(TPA)
+</A>
+.
+
+#In order to be released into the TPA database, the sequence must appear
+in a peer-reviewed publication in a biological journal.  If you select
+this option, a pop-up box will appear upon the completion of the
+Sequence Format form.  You must provide some description of the
+biological experiments used as evidence for the annotation of your TPA
+submission in this box. 
+
+#You will be asked later in the submission process to provide the GenBank
+Accession number(s) of the primary sequence(s) from which your TPA
+submission was derived.
+
+>Organism and Sequences Form
+
+#This form is made up of four pages.  If your sequences are imported as
+properly formatted FASTA files, there will be minimum input necessary
+in these pages.
+
+>FASTA Format for Nucleotide Sequences
+
+#In FASTA format the line before the nucleotide sequence, called the
+FASTA definition line, must begin with a carat (">"), followed by a
+unique SeqID (sequence identifier).  The SeqID must be unique for each
+nucleotide sequence and should not contain any spaces.  Use of brackets
+("[]") in the SeqID is also prohibited.  The identifier will be
+replaced with an Accession number by the database staff when your
+submission is processed. 
+
+#Information about the source organism from which the sequence was
+obtained follows the SeqID and must be in the format [modifier=text]. 
+Do not put spaces around the "=".  At minimum, the scientific name of
+the organism should be included.  Optional modifiers can be added to
+provide additional information.  A complete list of available source 
+<A HREF="http://www.ncbi.nlm.nih.gov/Sequin/modifiers.html">
+modifiers
+</A>
+ and their format is available.
+
+#The final optional component of the FASTA definition line is the
+sequence title, which will be used as the DEFINITION field in the final
+flatfile.  The title should contain a brief description of the
+sequence.  There is a preferred format for nucleotide and protein
+titles and Sequin can generate them automatically using the Generate
+Definition Line function under the Annotate menu in the record viewer.
+
+#Note in all cases, the FASTA definition line must not contain any hard
+returns.  All information must be on a single line of text.  If you
+have trouble importing your FASTA sequences, please double check that
+no returns were added to the FASTA definition line by your editing
+software.
+
+#Examples of properly formatted FASTA definition lines for nucleotide
+sequences are:
+
+<KBD><PRE>>Seq1 [organism=Mus musculus] [strain=C57BL/6] Mus musculus neuropilin 1 (Nrp1) mRNA, complete cds.
+</KBD></PRE>
+<KBD><PRE>>ABCD [organism=Plasmodium falciparum] [isolate=ABCD] Plasmodium falciparum isolate ABCD merozoite surface protein 2 (msp2) gene, partial cds.
+</KBD></PRE>
+<KBD><PRE>>DNA.new [organism=Homo sapiens] [chromosome=17] [map=17q21] [moltype=mRNA] Homo sapiens breast and ovarian cancer susceptibility protein (BRCA1) mRNA, complete cds.
+</KBD></PRE>
+#The line after the FASTA definition line begins the nucleotide
+sequence.  Unlike the FASTA definition line, the nucleotide sequence
+itself can contain returns.  It is recommended that each line of
+sequence be no longer than 80 characters.  Please only use IUPAC
+symbols within the nucleotide sequence.  For sequences that are not
+contained within an alignment, do not use "?" or "-" characters.  These
+will be stripped from the sequence.  Use the IUPAC approved symbol "N"
+for ambiguous characters instead. 
+
+#A single file containing multiple FASTA sequences can be imported into
+Sequin.  Make sure that the FASTA definition line for each sequence is
+formatted as above.
+
+#If the FASTA definition line is not properly formatted a pop-up box
+will appear upon importing the nucleotide FASTA.  The top box in this
+pop-up will list any errors in the FASTA definition lines, including
+missing SeqIDs, duplicate SeqIDs for different sequences, or improperly
+formatted modifiers.  You can add or edit this information in the
+spreadsheet provided.  The toggle at the bottom of the pop-up allows
+you to select whether all sequences or only those with errors are
+listed in the spreadsheet above. After making changes, click on Refresh
+Error List to ensure that all errors have been corrected.  You must
+correct any errors involving the SeqID in order to proceed with your
+submission.  
+
+*FASTA Format for Segmented Sequence
+
+#Each segment of a segmented sequence must have its own SeqID, but the
+organism name and other modifiers are only indicated in the FASTA
+definition line of the first segment.  Square brackets are used to
+delimit the members of the segmented set.  For example,
+
+![
+!>A-0V-1-Apart1 [organism=Gallus gallus] [clone=C]
+!TCACTCTTTGGCAAC
+!>A-0V-1-Apart2
+!GACCCGTCGTCATAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT 
+!]
+
+*FASTA Format for Gapped Sequence
+
+#The FASTA definition line for a gapped sequence follows the same format
+as above.  To indicate a gap within the sequence, enter a hard return
+within the sequence at the point of the gap, then insert an extra line
+starting with a carat (">") and a question mark ("?").  If the gap size
+is unknown, enter "unk100" after the question mark.  If the gap size is
+known, enter the length of the gap after the question mark.  For
+example,
+
+!>Dobi [organism=Canis familiaris] [breed=Doberman pinscher]
+!AAATGCATGGGTAAAAGTAGTAGAAGAGAAGGCTTTTAGCCCAGAAGTAATACCCATGTTTTCAGCATTA
+!GGAAAAAGGGCTGTTG
+!>?unk100
+!TGGATGACAGAAACCTTGTTGGTCCAAAATGCAAACCCAGATKGTAAGACCATTTTAAAAGCATTGGGTC
+!TTAGAAATAGGGCAACACAGAACAAAAAT
+!>?234
+!AAAAATAAAAGCATTAGTAGAAATTTGTACAGAACTGGAAAAGGAAGGAAAAATTTCAAAAATTGGGCCT
+!GAAAACCCATACAATACTCCGGG
+
+will generate a sequence containing two gaps.  The first gap is of
+unknown length, the second is 234 nucleotides long.
+
+*FASTA+GAP Format for Aligned Nucleotide Sequences
+
+#A number of programs output sets of aligned sequences in FASTA format.
+Frequently, to align these sequences, gaps must be inserted.  Specify
+relevant gap and ambiguous characters in the appropriate box on the
+
+<A HREF="#NucleotidePage">
+Nucleotide Page
+</A>
+
+form.  Each sequence, including gaps, must be the same length.  The
+gaps will only show up in the alignment, not in the individual sequence
+in the database.
+
+#Sequences in FASTA+GAP format resemble FASTA sequences.  The previous
+section on
+
+<A HREF="#FASTAFormatforNucleotideSequences">
+FASTA Format for Nucleotide Sequences
+</A>
+
+has instructions for formatting FASTA sequences.  If one of the
+sequences in your alignment is already present in the GenBank/EMBL/DDBJ
+database, you must mark that sequence so that it does not receive a new
+Accession number.  To do this, use a SeqID in the format accU12345,
+where U12345 is the Accession number of the pre-existing sequence.  All
+sequences in FASTA+GAP format should be in the same file.
+
+#The following is an example of FASTA+GAP format:
+
+!>A-0V-1-A [organism=Gallus gallus] [clone=C]
+!TCACTCTTTGGCAACGACCCGTCGTCATAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!>A-0V-2-A [organism=Drosophila melanogaster] [strain=D]
+!TCACTCTTTGGCAAC---GCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!>A-0V-3-A [organism=Caenorhabditis elegans] [strain=E]
+!TCACTCTTTGGCAAC---GCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!>A-0V-4-A [organism=Rattus norvegicus] [strain=F]
+!TCACTCTTTGGCAACGACCCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!>A-0V-7-A [organism=Aspergillus nidulans] [strain=G]
+!TCACTCTTTGGCAACGACCAGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+
+*PHYLIP Format for Aligned Nucleotide Sequences
+
+#A number of programs output sets of aligned sequences in PHYLIP format.
+
+#The following is an example of PHYLIP format.
+
+!     5    100
+!A-0V-1-A   TCACTCTTTG GCAACGACCC GTCGTCATAA TAAAGATAGA GGGGCAACTA
+!A-0V-2-A   TCACTCTTTG GCAAC---GC GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!A-0V-3-A   TCACTCTTTG GCAAC---GC GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!A-0V-4-A   TCACTCTTTG GCAACGACCC GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!A-0V-7-A   TCACTCTTTG GCAACGACCA GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!
+!
+!           AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!           AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!           AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!           AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!           AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+
+#In this example, the first line indicates that there are 5 sequences,
+each with 100 nt of sequence.  The following five lines contain the
+Sequence IDs, followed by the sequences. Specifically, the sequence
+identifier for the first sequence is A-0V-1-A.  Note that subsequent
+blocks of sequence do not contain the Sequence ID. If one of the
+sequences in your alignment is already present in the GenBank/EMBL/DDBJ
+database, you must mark that sequence so that it does not receive a new
+Accession number.  To do this, use a SeqID in the format accU12345,
+where U12345 is the Accession number of the pre-existing sequence. 
+
+#Specify relevant gap and ambiguous characters in the appropriate box on the
+<A HREF="#NucleotidePage">
+Nucleotide Page
+</A>
+form.
+
+#You can modify the PHYLIP format so that Sequin can
+determine the correct organism and any other modifiers for each
+sequence.  An example of such modifications are below in the section on
+<A HREF="#SourceModifiersforPHYLIPandNEXUS">
+Source Modifiers for PHYLIP and NEXUS
+</A>
+. 
+#Alternatively, you can leave your sequence alignment in
+standard PHYLIP format and enter the organism, strain, chromosome, etc.
+information on the following
+
+<A HREF="#SourceModifiersForm">
+Source Modifers form
+</A>
+. 
+
+*NEXUS Format for Aligned Nucleotide Sequences
+
+#A number of programs output sets of aligned sequences in one of two
+NEXUS formats, NEXUS Interleaved and NEXUS Contiguous.
+
+#NEXUS files can contain ? for "missing" at the 5' and 3' ends of
+sequences, as long as this parameter is properly defined within the
+header of the NEXUS file.
+
+#The following is an example of NEXUS Interleaved format.
+
+!#NEXUS
+!
+!begin data;
+!   dimensions ntax=5 nchar=100;
+!   format datatype=dna missing=? gap=- interleave;
+!   matrix
+!
+!A-0V-1-A   TCACTCTTTG GCAACGACCC GTCGTCATAA TAAAGATAGA GGGGCAACTA
+!A-0V-2-A   TCACTCTTTG GCAAC---GC GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!A-0V-3-A   TCACTCTTTG GCAAC---GC GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!A-0V-4-A   TCACTCTTTG GCAACGACCC GTCGTCACAA T????ATAGA GGGGCAACTA
+!A-0V-7-A   TCACTCTTTG GCAACGACCA GTCGTCACAA TAAAGATAGA GGGGCAACTA
+!
+!
+!A-0V-1-A   AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!A-0V-2-A   AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!A-0V-3-A   AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!A-0V-4-A   AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+!A-0V-7-A   AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT TAGAAGAAAT
+
+#In this example, the first few lines provide information about the data
+in the sequence alignment. The following five lines contain the
+Sequence IDs, followed by the sequences. Specifically, the sequence
+identifier for the first sequence is A-0V-1-A. Note that subsequent
+blocks of sequence also contain the Sequence ID. If one of the
+sequences in your alignment is already present in the GenBank/EMBL/DDBJ
+database, you must mark that sequence so that it does not receive a new
+Accession number.  To do this, use a SeqID in the format accU12345,
+where U12345 is the Accession number of the pre-existing sequence. 
+Also, Sequin will replace the "?" characters in the sequences with "N"s
+since they are defined as "missing" data in the header.  You should
+specify relevant gap and ambiguous characters in the appropriate box on
+the
+
+<A HREF="#NucleotidePage">
+
+Nucleotide Page
+
+</A>
+
+form.
+#The following is an example of NEXUS Contiguous format.
+
+!#NEXUS
+!BEGIN DATA;
+!DIMENSIONS NTAX=5 NCHAR=100;
+!FORMAT MISSING=? GAP=- DATATYPE=DNA ;
+!MATRIX
+!
+!A-0V-1-A
+!TCACTCTTTGGCAACGACCCGTCGTCATAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!A-0V-2-A
+!TCACTCTTTGGCAAC---GCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!A-0V-3-A
+!TCACTCTTTGGCAAC---GCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!A-0V-4-A
+!TCACTCTTTGGCAACGACCCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!
+!A-0V-7-A
+!TCACTCTTTGGCAACGACCAGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+
+#In this example, the first few lines provide information about the data
+in the sequence alignment.  The following five lines contain the
+Sequence IDs, followed by the sequences. Specifically, the sequence
+identifier for the first sequence is A-0V-1-A.  Note that subsequent
+blocks of sequence also contain the Sequence ID.  If one of the
+sequences in your alignment is already present in the GenBank/EMBL/D
+DBJ database, you must mark that sequence so that it does not receive a
+new Accession number.  To do this, use a SeqID in the format accU12345,
+where U12345 is the Accession number of the pre-existing sequence.
+
+#You can modify either NEXUS format so that Sequin can
+determine the correct organism and any other modifiers for each
+sequence.  An example of such modifications are below in the section on
+<A HREF="#SourceModifiersforPHYLIPandNEXUS">
+Source Modifiers for PHYLIP and NEXUS
+</A>
+.
+Alternatively, you can leave your sequence alignment in
+standard NEXUS format and enter the organism, strain, chromosome, etc.
+information on the following
+
+<A HREF="#SourceModifiersForm">
+Source Modifers form
+</A>
+.
+
+**Source Modifiers for PHYLIP and NEXUS
+
+#You can modify the PHYLIP or NEXUS formats so that Sequin can determine
+the correct organism and any other modifiers for each sequence by
+adding lines at the end of the file.  The first line applies to the
+first sequence, the second line to the second sequence, and so on.  You
+must have one line for each sequence.  These inserted lines contain
+modifiers formatted like in the FASTA definition line, but do not begin
+with a SeqID.  Instead, the SeqID is present at the beginning of the
+sequence lines as shown above.
+
+#Each of the initial lines starts with the character ">".  The
+scientific organism name follows in brackets.  Optional modifiers also
+follow in brackets.  For further information on the data that can go in
+the lines preceding the sequences, see the instructions entitled "FASTA
+Format for Nucleotide Sequences",
+
+<A HREF="#FASTAFormatforNucleotideSequences">
+above.
+</A>
+
+#The following lines indicating the organisms and strain of each sequence
+would follow immediately after the sequence in the PHYLIP and NEXUS
+examples, above.
+
+!>[organism=Gallus gallus] [clone=C]
+!>[organism=Drosophila melanogaster] [strain=D]
+!>[organism=Caenorhabditis elegans] [strain=E]
+!>[organism=Rattus norvegicus] [strain=F]
+!>[organism=Aspergillus nidulans] [strain=G]
+
+#The number of lines of source information must exactly match the number
+of sequences provided.
+
+#Alternatively, you can leave your sequence alignment in
+standard NEXUS or PHYLIP format and enter the organism, strain, chromosome, etc.
+information on the following
+
+<A HREF="#OrganismPage">
+Organism Page
+</A>
+.
+
+*Importing Aligned Sets of Segmented Sequences
+
+#Sequin can also read segmented sets that are part of an alignment if
+the sequences are in FASTA or FASTA+GAP format.  Each segment should
+have its own Sequence ID, but organism name and source modifiers should
+only be indicated for the first segment from each sequence. Square
+brackets are used to delimit the members of a set.  For example,
+
+![
+!>A-0V-1-Apart1 [organism=Gallus gallus] [strain=C]
+!TCACTCTTTGGCAAC
+!>A-0V-1-Apart2
+!GACCCGTCGTCATAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!]
+![
+!>A-0V-2-Apart1 [organism=Drosophila melanogaster] [strain=D]
+!TCACTCTTTGGCAAC
+!>A-0V-2-Apart2
+!GAAGCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTA
+!TTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
+!]
+
+>Nucleotide Page
+
+#The options on this page will vary depending on the 
+<A HREF="#SubmissionType">
+Submission Type
+</A>
+ and
+<A HREF="#SequenceDataFormat">
+Sequence Data Format
+</A>
+selected earlier.  Segmented sets and gapped sequences mut be imported
+as properly formatted FASTA files.  Details about importing alignment
+files are 
+<A HREF="#NucleotidePageforAlignedDataFormats">
+below
+</A>
+.
+
+*Nucleotide Page for FASTA Data Format
+
+**Create Alignment
+
+#If you have selected a Population study, Phylogenetic study, Mutation
+study, or Environmental samples set as a
+<A HREF="#SubmissionType">
+Submission Type
+</A>
+a check box will appear at the top of the Nucleotide Page.  If you
+check 'Create Alignment', Sequin will attempt to generate an alignment
+of the seqeunces within your submission.
+
+**Import Nucleotide FASTA
+
+#Use this button to import your properly formatted 
+<A HREF="#FASTAFormatforNucleotideSequences">
+FASTA file
+</A>
+.  You will see a window containing information about the imported
+sequence(s).  Please check the number of sequences, Sequence IDs
+(SeqIDs) and length of each sequence to make sure they are correct.  If
+you have included source information within the FASTA definition line,
+this will also be listed.
+
+**Add/Modify Sequences
+
+#This option allows you to add or modify sequences without using a
+previously formatted FASTA file, but is not available if you have
+selected a Segmented sequence or Gapped sequence as a 
+<A HREF="#SubmissionType">
+Submission Type
+</A>
+.  On the Specify Sequences box you can either import a nucleotide FASTA
+or add a new sequence.  If you choose Add New Sequence, a new box will
+pop-up where you can either import an existing sequence file or
+directly paste or type the nucleotide sequence.  
+
+#If you add a sequence where the FASTA definition line is not properly
+formatted a pop-up box will appear.  The top box in this pop-up will
+list any errors in the FASTA definition lines, including missing
+SeqIDs, duplicate SeqIDs for different sequences, or improperly
+formatted modifiers.  You can add or edit this information in the
+spreadsheet provided.  The toggle at the bottom of the pop-up allows
+you to select whether all sequences or only those with errors are
+listed in the spreadsheet above.  After making changes, click on
+Refresh Error List to ensure that all errors have been corrected.  You
+must correct any errors involving the SeqID in order to proceed with
+your submission.  Click on Accept to save your sequences and return to
+the Specify Sequences box.  
+
+#In the Specify Sequences box, you can choose to add another sequence or
+select a sequence from the list and choose to edit or delete it.  You
+can also delete all sequences at this point.  You will need to click on
+Done to save your sequences and return to the Nucleotide Page.
+
+**Clear Sequences
+
+#This option will remove all imported nucleotide sequences.
+
+**Specify Molecule
+
+#A database sequence can represent one of several different molecule
+types. The default molecule is genomic DNA.  If the sequence was not
+derived from genomic DNA, you can edit that information here. If you
+are submitting multiple sequences you can apply one molecule type to
+all sequences or apply the molecule type to each sequence individually.
+  Enter in the Molecule pop-up menu the type of molecule that was
+sequenced.
+
+#-Genomic DNA: Sequence derived directly from the DNA of an organism.
+Note: The DNA sequence of an rRNA gene has this molecule type, as does
+that from a naturally-occurring plasmid.
+
+#-Genomic RNA: Sequence derived directly from the genomic RNA of certain
+organisms, such as viruses.
+
+#-Precursor RNA: An RNA transcript before it is processed into mRNA,
+rRNA, tRNA, or other cellular RNA species.
+
+#-mRNA[cDNA]: A cDNA sequence derived from mRNA.
+
+#-Ribosomal RNA: A sequence derived from the RNA in ribosomes.  This
+should only be selected if the RNA itself was isolated and sequenced. 
+If the gene for the ribosomal RNA was sequence, select Genomic DNA. 
+
+#-Transfer RNA: A sequence derived from the RNA in a transfer RNA, for
+example, the sequence of a cDNA derived from tRNA.
+
+#-Small nuclear RNA: A sequence derived from small nuclear RNA, for
+example, the sequence of a cDNA derived from snRNA.
+
+#-Small cytoplasmic RNA: A sequence derived from small cytoplasmic RNA,
+for example, the sequence of a cDNA derived from small cytoplasmic RNA.
+
+#-Other-Genetic: A synthetically derived sequence including cloning
+vectors and tagged fusion constructs.
+
+#-cRNA: A sequence derived from complementary RNA transcribed from DNA,
+mainly used for viral submissions.
+
+#-Small nucleolar RNA: A sequence derived from small nucleolar RNA, for
+example, the sequence of a cDNA derived from snoRNA.
+
+**Specify Topology
+
+#Most sequences have a Linear topology and this is the default. You
+should change this setting to Circular only if the sequence is complete
+and it has a circular topology. For example, a complete plasmid or a
+complete mitochondrial genome would have a Circular topology, but a
+single gene from a plasmid or mitochondrion would have a Linear
+topology.  If you are submitting multiple sequences you can apply one
+topology to all sequences or set the topology for each sequence
+individually.
+
+*Nucleotide Page for Aligned Data Formats
+
+**Sequence Characters
+
+#If you are submitting a set of aligned sequences, you can specify sequence
+characters used in your alignment here.  Sequin requires that you
+define any non-IUPAC nucleotide characters in your alignment file.  The
+five types of variable characters are listed under Sequence Characters.
+
+#Every sequence within an alignment file must contain the same number of
+characters (nucleotides + gaps).  Gap characters are used to represent the
+spaces between contiguous nucleotides in an alignment.  Gaps that appear at
+the beginning or end of a sequence are treated differently than gaps that
+appear between nucleotides and each must be defined.  GenBank prefers to
+use a hyphen (-) to represent gaps. If you use a different character to
+represent a gap, you will need to add this character to the list in the
+Beginning Gap, Middle Gap, or End Gap boxes.
+
+#Ambiguous characters represent nucleotides that are known to exist, but
+whose identity has not been experimentally validated.  GenBank prefers to
+use 'n' to represent any ambiguous nucleotides.  If you are using a
+different character to represent an ambiguous base, you will need to add
+this character to the list in the Ambiguous/Unknown box.  Sequin will
+convert these characters to 'n's when your file is imported.
+
+#Match characters denote nucleotides that are identical in every member of
+an alignment.  GenBank prefers the use of a colon (:) to represent match
+characters.  If you are using a different character to represent a match
+character, you will need to add this character to the list in the Match box.
+
+**Import Nucleotide Alignment
+
+#Once you have imported the alignment using the Import Nucleotide
+Alignment button, you can edit the molecule information using the
+<A HREF="#SpecifyMolecule">
+Specify Molecule
+</A>
+ and 
+<A HREF="#SpecifyTopology"> 
+Specify Topology
+</A>
+buttons explained above.  Note that you can not access the 
+<A HREF="#Add/ModifySequences">
+Add/Modify Sequences
+</A>
+ dialog for submissions of aligned sequences.
+
+>Organism Page
+
+#Information about the organism from which the sequence was derived
+should be entered or edited on this page.  If there are any potential
+problems with the organism information previously provided in either
+the 
+<A HREF="#FASTAFormatforNucleotideSequences">
+FASTA definition line
+</A>
+ or entered in the
+<A HREF="#Add/ModifySequences">
+Add/Modify Sequences
+</A>
+ dialog, a window listing these problems will appear at the top of the
+form.  Please review these problems and edit using the 
+
+<A HREF="#AddSourceModifiers">
+</A>
+Add Source Modifiers button as necessary.  At minimum, you must supply
+the scientific name of the organism from which the sequence was
+obtained in order to proceed with your submission.  
+
+#The second window is a summary of the organism information provided so
+far. Double clicking on a line of text within this window will launch a
+modifier-specific editing window.  In each of these windows, you can
+edit the available information for the specific modifier.  In most
+cases, you have the choice to edit the modifier for each sequence
+separately, or to enter text and select Apply above value to all
+sequences.  These changes will be reflected in the windows of the
+Organism page immediately upon closing the modifier-specific editor.
+
+*Add Organisms, Locations, and Genetic Codes
+
+#If you have not added organism information using either the 
+<A HREF="#FASTAFormatforNucleotideSequences">
+FASTA definition line
+</A>
+ or the
+<A HREF="#Add/ModifySequences">
+Add/Modify Sequences
+</A>
+dialog, you can use the Add Organisms, Locations, and Genetic Codes to
+do so at this point.  This button will launch the Multiple Organism
+Editor pop-up where you may add or edit existing information concerning
+the
+<A HREF="#Organism">
+Organism
+</A>
+ name, 
+<A HREF="#Location">
+Location
+</A>
+ and
+<A HREF="#GeneticCode">
+Genetic Code
+</A>
+.  The SeqID of each sequence is listed at the left of the spreadsheet
+format.  You can change the information in the spreadsheet individually
+or globally for all sequences.
+
+**Organism
+
+#The scrollable list at the top of the pop-up contains the scientific
+names of many organisms. To reach a name on the list, type the first
+few letters of the scientific name into the box above the list or the
+appropriate box in the spreadsheet.  The list will scroll to the names
+beginning with those letters, and you can select the organism within
+the list itself.  You can then use the arrow button to copy this name
+into the appropriate box in the spreadsheet.  
+
+#To apply the same scientific name to all sequences in the submission,
+click on the Organism button in the spreadsheet column header.  A
+separate pop-up box will appear with the same organism list.  You can
+select a name from this list and choose Accept to apply this name to
+all sequences.  
+
+#If you have any questions about the scientific name of an organism, see
+the NCBI 
+<A HREF="http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html">
+Taxonomy Browser
+</A> 
+http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html
+
+#If the name of the organism is not on the list, type it in directly. If
+you do not know the scientific name, please be as specific as you can
+and include a unique identifier, such as a clone, isolate, strain or
+voucher number, or cultivar name, e.g.; Nostoc ATCC29106, uncultured
+spirochete Im403, Lauraceae sp. Vásquez 25230 (MO), Rosa hybrid
+cultivar 'Kazanlik'.  Also, if applicable, indicate if the name is
+unpublished as of the time of submission.  Additional information such
+as strain, isolate, or serotype can be entered later in the submission
+process.
+
+**Location 
+
+#The default Location for all seqeunces is "Genomic".  If the sequence
+is not genomic, select the alternative location (ie, organelle) from
+the pull-down list.  You can change the location of all sequences
+globally by clicking on the Location button in the spreadsheet header. 
+The following is a brief description of the choices in this list:
+
+#-Genomic:  chromosome.  This category includes
+mitochondrial and chloroplast proteins that are encoded by the nuclear
+genome.
+
+#-Chloroplast:  a chlorophyllous plastid.
+
+#-Chromoplast:  a non-chlorophyllous, pigmented plastid, found in
+fruits and flowers.
+
+#-Kinetoplast: a specialized type of mitochondrion found exclusively
+in Kinetoplastida (e.g., Leishmania).  NOTE: kinetoplast should
+be applied ONLY to members of the Kinetoplastida (trypanosomes and
+bodonids). 
+
+#-Mitochondrion: a semi-autonomous, self-reproducing organelle that
+occurs in the cytoplasm of most eukaryotic cells. 
+
+#-Plastid: any of a class of double membrane-bound, light-harvesting
+organelles (or derived from same).  NOTE: plastid should be used
+ONLY when a more precise term, e.g., chloroplast, is not
+applicable. 
+
+#-Macronuclear: a specialized type of nucleus found exclusively in the
+ciliated protists (e.g., Tetrahymena).  NOTE: macronucleus
+should be applied ONLY to members of the Ciliophora. 
+
+#-Extrachromosomal:  other extrachromosomal elements not listed here,
+such as a B chromosome or an F factor.
+
+#-Plasmid: extrachromosomal genetic element found in bacterial species.
+Note this does not include the cloning vector used to propagate
+the sequence of interest. 
+
+#-Cyanelle:  a specialized type of plastid found exclusively in
+glaucocystophytes (e.g., Cyanophora).  NOTE: cyanelle should be
+applied ONLY to members of the Glaucocystophyceae. 
+
+#-Proviral:  a virus that is integrated into a host cell chromosome.
+
+#-Virion:  a completed virus particle.
+
+#-Nucleomorph:  a reduced nuclear remnant found in Chlorarachniophyceae
+(e.g., Chlorarachnion) and Cryptophyta (e.g, Cryptomonas).  NOTE:
+nucleomorph should be applied ONLY to members of the
+Chlorarachniophyceae or Cryptophyta.  
+
+#-Apicoplast:   a reduced plastid characteristic of apicomplexans
+(e.g., Plasmodium).  NOTE: apicoplast should be applied ONLY to
+members of the Apicomplexa.
+
+#-Leucoplast:  a plastid lacking pigments of any type.
+
+#-Proplastid:  an immature plastid.
+
+#-Endogenous_virus:  a virus that has integrated permanently into the
+host genome, and which is inherited vertically through the
+germ-line of the host.
+
+#-Hydrogenosome:  an organelle that produces hydrogen and ATP and is
+found mainly in ciliates, fungi and trichomonads.  Hydrogenosomes may
+be reduced mitochondria 
+
+**Genetic Code 
+
+#If you selected a scientific organism name from the scrollable list
+described above, this field will be filled out automatically.  However,
+if the organism is not on the list, this field will default to the
+"Standard" genetic code.  If this is incorrect, you can select the
+correct genetic code from the pull-down list.  To globally change the
+genetic code for all sequences which are not automatically filled out,
+click on the Genetic Code button in the spreadsheet header.  
+
+#For more information regarding the genetic codes available, see the NCBI
+<A HREF="http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wprintgc?mode=c">
+Taxonomy page
+</A>.
+http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wprintgc?mode=c
+
+*Import Source Modifiers
+
+#Using this button allows you to import a tab-delimited table of source
+modifiers.  The first column in the table must contain the Sequince
+Identifiers (SeqIDs) used earlier in the submission and each subsequent
+column must contain a different source modifier.  The first row in the
+table must contain the labels for each column.  The label for the
+Sequence Identifiers column should be in the format "Seq_ID".  A list
+of available
+<A HREF="http://www.ncbi.nlm.nih.gov/Sequin/modifiers.html"> 
+modifiers
+</A>
+in the format to be used in the column headers can be found at
+http://www.ncbi.nlm.nih.gov/Sequin/modifiers.html .
+
+*Add Source Modifiers
+
+#Using this button will launch the Specify Source Modifiers pop-up box
+where you can add or edit any source modifier.  You can also import a
+source modifier table or export the existing source modifiers in table
+format from this page. 
+
+#The Select Modifier dialog allows you to select a modifier from the
+pull-down list and edit the value of this modifier for each sequence or
+globally add a value to all sequences. 
+
+#The two windows in this pop-up provide information about the current
+source modifiers for the sequences in your submission.  The top window
+provides a summary of these modifiers and the lower window lists the
+values of each modifier for each sequence.  If any sequences have
+missing organism names or have source information that is identical to
+another sequence, the SeqIDs will be shown in red in this window. 
+Double-clicking on a modifier value in this window will launch a pop-up
+where you can edit this value.  Double-clicking on the modifier name
+used in the header will launch a modifier-specific pop-up where you can
+globally edit the modifier value for all sequences or change the value
+for individual sequences.
+
+*Clear All Source Modifiers
+
+#This button will clear all modifiers previously entered in either the
+FASTA definition lines or the submission dialogs.  This includes the
+organism name which is required for submission.
+
+>Protein Page
+
+#This page allows you to provide the protein sequence translated from
+the nucleotide sequence that you just entered.  If the nucleotide
+sequence is alternatively spliced or contains multiple open reading
+frames, enter all of the protein sequences on this page.  Each protein
+sequence will appear in the database record as a coding sequence (CDS)
+feature.  Sequin will automatically determine which nucleotide
+sequences code for the protein and indicate the nucleotide sequence
+interval on the database record. Sequin also provides tools that allow
+you to view a graphical representation of all the open reading frames
+in your nucleotide sequence and to convert these reading frames into
+CDS features.  These tools are described later in the help
+documentation under the 
+
+<A HREF="#ORFFinder">
+ORF Finder.
+</A>
+
+*Conceptual Translation Confirmed by Peptide Sequencing
+
+#Most protein entries are computer-generated conceptual translations of
+a nucleic acid sequence.  If you have confirmed this translation by
+direct sequencing either of the entire protein or of peptides derived
+from the protein, please check this box.
+
+*Incomplete at NH3 end/Incomplete at COOH end
+
+#If the sequence is lacking amino acids at the amino- or
+carboxy-terminal end of the protein, please check the appropriate box. 
+
+*Create Initial mRNA with CDS Intervals
+
+#If you check this box, Sequin will make an mRNA feature with the same
+initial intervals (i.e., range of sequence) as the CDS feature.  After
+the record has been assembled, you should edit the mRNA feature location
+to add the 5' UTR and 3' UTR intervals.  This may be done either in the
+mRNA editor or in the sequence editor.
+
+*Import Protein FASTA
+
+#You can import a single or multiple protein sequences contained within
+a previously generated protein FASTA file.  
+
+**FASTA Format for Protein Sequences
+
+#The basic FASTA format is the same as that used for 
+<A HREF="#FASTAFormatforNucleotideSequences">
+nucleotide sequences
+</A>
+, with a FASTA definition line followed by the sequence itself.  
+
+#In order to match the protein sequence to the correct nucleotide
+sequence, you must use the same Sequence Identifier (SeqID) that you
+used to identify the nucleotide sequence.  Thus in cases of
+alternatively spliced genes, a single protein FASTA file can contain
+two unique sequences that have the same SeqID.  Both coding regions
+will be added to the same nucleotide sequence.
+
+#The available modifiers for use in a protein FASTA definition line are
+different than those for a nucleotide FASTA definition line and are
+limited to information about the protein or gene itself and are
+contained within the examples below.  The format remains [modifer=text].
+
+#Note in all cases, the FASTA definition line must not contain any hard
+returns.  All information must be on a single line of text. 
+
+#Examples of properly formatted protein FASTA definition lines are:
+
+<KBD><PRE>>Seq1 [protein=neuropilin 1] [gene=Nrp1]</KBD></PRE>
+
+<KBD><PRE>>ABCD [protein=merozoite surface protein 2] [gene=msp2] [protein_desc=MSP2]</KBD></PRE>
+
+<KBD><PRE>>DNA.new [protein=breast and ovarian cancer susceptibility protein] [gene=BRCA1] [note=breast cancer 1, early onset]</KBD></PRE>
+
+#The protein name should be included in the entry; all other fields are
+optional.
+
+#The line after the FASTA definition line begins the amino acid
+sequence.  It is recommended that each line of sequence be no longer
+than 80 characters.  Please only use IUPAC symbols within the amino
+acid sequence. Non-IUPAC amino acid symbols will be stripped from the
+sequence.  
+
+#After you import your sequence, a window will appear with information
+about the sequence.  The first line will describe the number of protein
+sequences imported and the total length in amino acids of
+all sequences. Each sequence is numbered, and its length,
+unique identifier (SeqID), Gene symbol, Protein name, and title
+(Definition line) as supplied in the FASTA definition line are listed. 
+
+>Annotation Page
+
+#Note: This page will not be available if you have selected a segmented
+or gapped sequence as the
+<A HREF="#SubmissionType">
+Submission Type
+</A>
+.
+
+#On this page, you can add a
+<A HREF="#gene">
+gene
+</A>
+,
+<A HREF="#rRNA">
+ribosomal RNA
+</A>
+ or
+<A HREF="#CDS">
+CDS
+</A>
+ feature across the entire span of each sequence you are submitting.
+You can not specify locations within each sequence using this page.
+More options are available under the
+
+<A HREF="#AnnotateMenu">
+Annotate Menu
+</A>
+in the record viewer.
+
+#If the feature should be partial at one or both ends, check the
+appropriate box and then fill in the text boxes for the relevant
+feature.
+
+#You may add a title to all sequences if this was not included in the
+FASTA definition line.  This will be used as the DEFINITION field in
+the final flatfile.  The title should contain a brief description of
+the sequence.  There is a preferred format for nucleotide and protein
+titles and Sequin can generate them automatically using the Generate
+Definition Line function under the Annotate menu in the record viewer.
+
+>Assembly Tracking
+
+#You will only see this form if you had previously indicated that the
+entry is a Third-Party Annotation submission.  You must provide the
+GenBank Accession number(s) of the primary sequence used to assemble
+your TPA sequence.  We can not accept primary sequences corresponding
+to Reference Sequences or those from proprietary databases.  More
+information about this can be found on the
+
+<A HREF="http://www.ncbi.nlm.nih.gov/Genbank/tpa.html">
+TPA
+</A>
+home page.
+
+#If a proper GenBank Accession is entered in the first column of the
+Assembly Tracking form, the GenBank staff can map the coordinates for
+you.  You do not need to fill out the 'from' and 'to' columns.  Note
+that multiple accessions may be entered to provide full coverage of the
+assembled sequence.
+
+#You may also generate an Assembly Tracking form in the record viewer
+under the Annotate menu.  Select Descriptors and TPA Assembly from the
+pull-down menu in order to generate the Assembly Tracking form.
+
+>Editing the Record
+
+*Overview
+
+#After you finish the Organism and Sequences Form, Sequin will process
+your entry based on the information you have entered.  The window you
+see now is called the record viewer.  This is also the window you will
+see if you are submitting an update to an existing record.  The
+instructions after this point are the same whether you are submitting a
+new record or an update.
+
+#In the default window of the record viewer, you will see your entry
+approximately as it would appear in the database.  Most of the
+information that you entered earlier in the submission process is
+present in the viewer; other information, such as the contact, is still
+present in the record but will not be visible in the database entry.  If
+you have provided a conceptual translation of the nucleotide sequence,
+the translation will be listed as a CDS Feature.  Sequin automatically
+determines which nucleotides encode for the protein, and lists them,
+even if the nucleotide sequence contains introns and exons.
+
+#You can save the entry to a file by selecting Save or Save As under the
+File menu.  This is not the same as saving the entry for submission to
+the database.  It is a good idea to save the file at this point so that
+if you make any unwanted changes during the editing process you can
+revert to the original copy.  If you wish to edit the entry later, click
+on "Read Existing Record" on the Welcome to Sequin form and choose
+the file.
+
+#It is likely that the entry could be processed now for submission to
+the database.  However, you may wish to add information to
+the entry. This information may be in the form of Descriptors or
+Features.  Descriptors are annotations that apply to an
+entire sequence, or an entire set of sequences, and Features are
+annotations that apply to a specific sequence interval.  For example,
+you may want to change the Reference Descriptor to add a published
+manuscript, or to annotate the sequence by adding features such as a
+signal peptide or polyA signal.  
+
+#Information in the record viewer can be edited in different ways.  One
+way to modify information is to double click within the block of
+information you wish to edit.  Many blocks, such as "Definition",
+"Source", "Reference", or "Features" can be edited.  
+
+#To add information, create a new descriptor
+or feature by selecting the appropriate form from the Misc or Features
+menus. These options are described later in this help document.
+
+#Finally, you may need to edit the sequence itself.  
+<A HREF="#SequenceEditor">
+Instructions
+</A> 
+for working with the sequence are presented in the documentation for the
+Sequence Editor.
+
+*Submitting the Finished Record to the Database
+
+#Once you are satisfied that you have added all the appropriate
+information, you must process your entry for submission to the database.
+ Select "Validate" under the Search menu.  This function detects
+discrepancies between the format of your submission and that required by
+the database selected for entry.
+
+#If Sequin detects problems with the format of your record, you will see a
+screen listing the validation errors as well as suggestions for how to fix the
+discrepancies.  Single clicking on an error message scrolls the record viewer
+to the feature that is causing the error.  Double clicking on the error message
+launches a new form on which you can enter information to correct the problem. 
+If you are annotating a set of multiple sequences, shift-click to scroll to the
+target sequence and feature.  You can also dismiss the suggestion and proceed
+on your own. When you think you have corrected all the problems, click on
+"Revalidate".
+
+#Message:  Select Verbose, Normal, Terse, or Table. Verbose gives a more
+detailed explanation of the problem.
+
+#Filter:  Select the error messages you wish to see.  You can select
+ALL, SEQ_INST (errors regarding the sequence itself, its type, or
+length), SEQ_DESCR (descriptor errors), SEQ_FEAT (feature errors), or
+errors specific to your record.
+
+#Severity:  Select the types of error messages you wish to see.  You
+will see the type of message selected, as well as any messages warning
+of more serious problems.
+
+#There are four types of error messages, Info, Warning, Error, and
+Reject. Info is the least severe, and Reject is the most severe.  You
+may submit the record even if it does contain errors.  However, we
+encourage you to fix as many problems as possible.  Note that some
+messages may be merely suggestions, not discrepancies.  A possible
+Warning message is that a splice site does not match the consensus. 
+This may be a legitimate result, but you may wish to recheck the
+sequence.  A possible Error message is that the conceptual translation
+of the sequence that you supplied does not encode an open reading
+frame.  In this case, you should check that you translated the sequence
+in the correct reading frame.  A possible Reject message is that you
+neglected to include the name of the organism from which the sequence
+was derived.  The name of the organism is absolutely required for a
+database entry.
+
+#If Sequin does not detect any problems with the format of your record,
+you will see a message that "Validation test succeeded".  
+
+#To prepare the submission, click the "Done" button on the record
+viewer, or select "Prepare Submission" under the File menu. You will be
+prompted to save the file.  Email this file to the database at the
+address shown.  You MUST email the file; Sequin does not submit the
+file automatically over the network.  The email addresses for the
+databases are:
+
+!-GenBank:  gb-sub@ncbi.nlm.nih.gov 
+!-EMBL:  datasubs@ebi.ac.uk 
+!-DDBJ: ddbjsub@ddbj.nig.ac.jp
+
+#After your entry is complete, close the record viewer.  You will be
+returned to the Welcome to Sequin form and can begin another entry.
+
+>The Record Viewer
+
+*Target Sequence
+
+#This pop-up menu shows a list of SeqIDs of all nucleotide and protein
+sequences associated with the Sequin entry.  Use the menu to select the
+sequences displayed in the record viewer, as well as the sequences you
+want to "target", that is, the sequences to which you want to apply a
+descriptor (see 
+<A HREF="#Descriptors">
+Descriptors
+</A>
+ in the Sequin help documentation).  You may select either an individual
+sequence by name or a set of sequences, such as All Sequences, or
+SEG_dna if you have a segmented nucleotide set.  You may change the
+selection at any time.
+
+*Display Format
+
+#You may change the display format of the record viewer to any of the
+formats described below. Editing a field in one display format will
+change that field in all formats.  Subsequent pop-up menus will appear
+depending on which format is selected.  
+
+**GenBank
+
+#This display format allows you to see the submission as it would appear
+as a GenBank or DDBJ entry.  It is the default format.  
+
+#The Mode pop-up default setting is Sequin.  Release mode shows certain
+qualifiers and db_xrefs in RefSeq entries which are non-collaborative. 
+Entrez mode is used fro web display and can show new elements that have
+not yet finished their four month quarentine period. Dump mode requires
+that the accession slot be populated.  In most cases, there is no need
+to change from the default Sequin mode.
+
+#The Style pop-up allows different views of segmented records.  The
+default is Normal.  Segment style is the traditional representation of
+segmented sequences, while Contig style displays a CONTIG line with a
+join of accessions instead of raw sequence.  Master style shows
+features mapped to the segmented sequence coordinates instead of the
+coordinates of the individual parts.
+
+**Graphic
+
+#This display format shows the entry in a graphical view.  The top bar
+represents the nucleotide sequence.  Lower arrows or bars represent
+different features on the sequence.  Double click on an arrow or bar to
+launch the appropriate editing window. Any sequence highlighted in the
+Sequence Editor will be boxed on the graphical view of the sequence. 
+To see a graphical representation of a segmented set (see
+
+<A HREF="#Submissiontype">
+Submission type
+</A>,
+above), the Target Sequence must be set to
+SEG_dna.
+
+#The Style pop-up menu allows you to see the display in different styles
+and colors.
+
+#The Scale pop-up menu allows you to see the display in different sizes.
+The smaller the number, the larger the display.
+
+**Sequence
+
+#This display format shows the nucleotide sequence in the record along
+with any annotated features (such as CDS or mRNA).  You can only view a
+single sequence at a time with this option.  You can use the Features
+pop-up menu to change the display of the features.  With the numbering
+pop-up menu, select where you want the sequence numbers to be
+indicated, at the side of the sindow, at the top of each sequence line,
+or not at all.
+
+**Alignment
+
+#This display format shows sets of aligned sequences, such as those
+imported as part of a population, phylogenetic, mutation, or
+environmental samples set. When toggled to All Sequences in the Target
+Sequence pop-up, the alignment of all entries will be displayed.  To
+more closely analyze similarities, you can select a single entry in the
+Target Sequence pop-up.  The complete sequence of the entry selected
+will be displayed.  Any nucleotides in the other sequences that differ
+from that selected will be displayed, while identical nucleotides will
+be displayed as a period.  You can also display features annotated on
+the selected target sequence or all sequences using the Feature display
+toggle.  To launch the alignment editor, select 
+<A HREF="#AlignmentAssistant">
+Alignment Assistant
+</A>
+from the record viewer Edit menu.
+
+**EMBL
+
+#This display format allows you to see the submission as it would appear
+as an EMBL entry.
+
+**Table
+
+#This display format shows the annotation in a five-column, tab-delimited 
+<A HREF="table.html">table</A>
+ format. This format can be imported to add annotation to a record that
+has none.
+
+**FASTA
+
+#This display shows the sequence and Definition line only, without any
+annotations, in a format called the FASTA format.  This is a format used
+by many molecular biology analysis programs.  You cannot edit in this
+display mode.
+
+**Quality
+
+#This display format shows quality score data ifit has been included in
+the submission.
+
+**ASN.1
+
+#This display shows the entry in Abstract Syntax Notation 1, a data
+description language used by the NCBI.  You cannot edit in this display
+mode.
+
+**XML
+
+#This display format shows the entry in XML language, sometimes used by
+various databases.  You cannot edit in this display mode.
+
+**INSDSeq
+
+#This display format shows the entry in the XML format used by the INSD.
+ You cannot edit in this display mode.
+
+**Desktop
+
+#The NCBI DeskTop displays the internal
+structure of the record being viewed in Sequin.  The 
+<A HREF="#NCBIDeskTop">
+DeskTop
+</A> 
+is explained under the Misc menu.
+
+*Done
+
+#This button allows you to validate the entry when you are finished with
+the submission.  See 
+<A HREF="#SubmittingtheFinishedRecordtotheDatabase">
+Submitting the Finished Record to the Database
+</A> 
+ in the Sequin help documentation.
+
+*Controls for Downloaded Entries 
+
+#If you have downloaded a sequence from Entrez, you will see an
+additional button labeled PubMed.  This button will launch a web
+browser containing the target sequence as it appears in Entrez.  From
+here, you can access any Entrez-supported Links, including related
+sequences and associated references in PubMed. 
+
+>Descriptors
+
+*Overview
+
+#Descriptors are annotations that apply to an entire sequence, or an
+entire set of sequences, in a given entry.  They do not have a specific
+location on a sequence, as they apply to the entire sequence.  They can
+be contrasted to 
+<A HREF="#Features">
+Features,
+</A>
+which apply to a specific interval of the sequence.  
+
+#You may edit descriptors in one of two ways.
+
+#(1) In the record viewer, double click within the text of the
+descriptor to bring up a form on which information can be added.
+
+#(2) Choose the option Descriptors from the Annotate menu.  
+
+*Annotate Menu
+
+#This menu allows you either to create new descriptors or to modify
+existing ones.  Select the descriptor that you wish to modify.
+
+#When you first select a descriptor, you will see a window called
+"Descriptor Target Control".  Using the target control pop-up menu,
+select the sequences you wish this descriptor to cover.  The name(s)
+listed correspond to the SeqID(s) given to the nucleotide or amino acid
+sequences when when they were imported into Sequin.  The default
+selection for this menu is set in the Target Sequence pop-up menu on
+the record viewer.  You may choose to have the descriptor cover just
+one sequence, or a set of sequences in your entry.  If you are creating
+a new descriptor, select "Create New".  If you wish to modify a
+previous descriptor, select "Edit Old".
+
+#The following is a list of some of the descriptors that can be added.
+Two additional descriptors, those for 
+<A HREF="#Publications">
+Publications
+</A> 
+and 
+<A HREF="#BiologicalSourceDescriptororFeature">
+Biological Source,
+</A>
+are described in other sections.
+
+**TPA Assembly
+
+#If you indicated that your sequence is a TPA submission, a 
+<A HREF="#AssemblyTracking">
+TPA Assembly
+</A>
+ was created from the information regarding primary accession numbers. 
+This Assembly information can be edited here.  Note that it is not
+necessary to enter nucleotide location in the "from" and "to" columns.
+
+**Update Date
+
+#This is for database staff use only.  Please do not modify the date.
+
+**Create Date
+
+#This is for database staff use only.  Please do not modify the date.
+
+**Region
+
+#This descriptor provides general information about the genetic context
+of the sequence.  For example, if your nucleotide sequence is cloned
+from the region surrounding the Huntington's Disease gene, you could
+enter that information here.  Providing information for this descriptor
+is optional.
+
+**Name
+
+#Alternative place for a descriptive name for the sequence.  This
+information will not appear in the flatfile view, but will be
+maintained in the ASN1.
+
+**Comment
+
+#This descriptor is used to list any additional information that you
+wish to provide about the sequence. Use of this descriptor is optional.
+ Most information can be better annotated using the appropriate
+features and qualifiers rather than a generic comment descriptor.
+
+**Title
+
+#This descriptor contains the information that will go on the Definition
+line of the database entry.  If you supplied a title for your
+nucleotide sequence when you imported it into Sequin, that information
+is here.  If you wish to change the Definition line, or if you did not
+supply a title when you submitted the sequence, edit this Descriptor.
+For more information on creating proper Definition lines, please see
+the Sequin help documentation for the 
+
+<A HREF="#NucleotideDefinitionLine(Title)">
+Nucleotide Definition Line (Title)
+</A>.
+
+**Molecule Description
+
+#This descriptor indicates the characteristics of the molecule from
+which the sequence was derived. The information that you have already
+entered can be edited here.  In most cases, the molecule and class are
+the only choices which should be edited from the default values.
+
+***Molecule
+
+#A GenBank sequence can represent one of several different molecule
+types. Enter in the Molecule pop-up menu the type of molecule that was
+sequenced.  A brief description of the choices in this pop-up menu were
+listed previously.
+
+***Completedness
+
+Choose the appropriate option from the pop-up menu.
+
+#-Complete:  Use this designation when a complete molecule, such as a
+complete mitochondrial genome, is being submitted.
+
+#-Partial:  Use this designation when an incomplete unit, such as the
+partial coding sequence of a gene, is being submitted.
+
+#-No left:  Use this designation when an incomplete unit, such as the
+partial coding sequence of a gene, or a partial protein sequence, is
+being submitted.  The sequence has no left if it is incomplete on the
+5', or amino-terminal, end.
+
+#-No right:  Use this designation when an incomplete unit, such as the
+partial coding sequence of a gene, or a partial protein sequence, is
+being submitted.  The sequence has no right if it is incomplete on the
+3', or carboxy-terminal, end.
+
+#-No ends:  Use this designation when an incomplete unit, such as the
+partial coding sequence of a gene, or a partial protein sequence, is
+being submitted, The sequence has no ends if it is incomplete at both
+the 5' and 3', or amino- and carboxy- terminal, ends.
+
+#-Other:  Use this designation when none of the above descriptions apply.
+
+***Technique
+
+#From the pop-up menu, select the technique that was used to generate the
+sequence.
+
+#-Standard: standard sequencing technique.
+
+#-EST:  
+<A HREF="http://www.ncbi.nlm.nih.gov/dbEST/index.html">
+Expressed Sequence Tag
+</A>
+: single-pass, low-quality mRNA sequences
+derived from cDNAs.  These sequences will appear in the EST division.
+
+#-STS:
+<A HREF="http://www.ncbi.nlm.nih.gov/dbSTS/index.html">
+  Sequence Tagged Site
+</A>
+: short sequences that are operationally
+unique in a genome and that define a specific position on the physical
+map.  These sequences will appear in the STS division.
+
+#-Survey: 
+<A HREF="http://www.ncbi.nlm.nih.gov/dbGSS/index.html">
+single-pass genomic sequence
+</A>
+.  These sequences will appear in
+the Genome Survey Sequence (GSS) division.
+
+#-Genetic Map: Genetic map information, for example, in the Genomes division.
+
+#-Physical Map: Physical map information, for example in the Genomes division.
+
+#-Derived: A sequence assembled into a contig from shorter sequences.
+
+#-Concept-trans: A protein translation generated with the appropriate
+genetic code.
+
+#-Seq-pept: Protein sequence was generated by direct sequencing of a
+peptide.
+
+#-Both: Protein sequence was generated by conceptual translation and
+confirmed by peptide sequencing.
+
+#-Seq-pept-Overlap: Protein sequence was generated by sequencing
+multiple peptides, and the order of peptides was determined by overlap
+in their sequences.
+
+#-Seq-pept-Homol: Protein sequence was generated by sequencing
+multiple peptides, and the order of peptides was determined by homology
+with another protein.
+
+#-Concept-Trans-A: Conceptual translation of the nucleotide sequence
+provided by the author of the entry.
+
+#-HTGS 0: 
+<A HREF="http://www.ncbi.nlm.nih.gov/HTGS/">
+High Throughput Genome Sequence
+</A>
+, Phase 0.  These sequences
+are produced by high-throughput sequencing projects and will be in the
+HTG division.
+
+#-HTGS 1: 
+<A HREF="http://www.ncbi.nlm.nih.gov/HTGS/">
+High Throughput Genome Sequence
+</A>
+, Phase 1.  These sequences
+are produced by high-throughput sequencing projects and will be in the
+HTG division.
+
+#-HTGS 2: 
+<A HREF="http://www.ncbi.nlm.nih.gov/HTGS/">
+High Throughput Genome Sequence
+</A>
+, Phase 2.  These sequences
+are produced by high-throughput sequencing projects and will be in the
+HTG division.
+
+#-HTGS 3: 
+<A HREF="http://www.ncbi.nlm.nih.gov/HTGS/">
+High Throughput Genome Sequence
+</A>
+, Phase 3.  These sequences
+are produced by high-throughput sequencing projects and will be in the
+HTG division.
+
+#-FLI_cDNA: Full Length Insert cDNA.  Sequence corresponds to entire cDNA but
+not necessarily entire transcript. These sequences are produced by large
+sequencing projects.
+
+#-HTC: High Throughput cDNA. These sequences are produced by large sequencing
+projects.
+
+#-WGS: 
+<A HREF="http://www.ncbi.nlm.nih.gov/Genbank/wgs.html">
+Whole Genome Shotgun
+</A>
+.  These sequences are produced by large sequencing projets and follow a
+separate submission process.
+
+#-Barcode: Nucleotide sequence is part of Barcodes of Life project.  This
+selection should only be used by members of the Consortium for the
+Barcodes of Life.
+
+#-Other: Do not use this designation.
+
+***Class
+
+#From the pop-up menu, select the type of molecule that was sequenced.
+
+#-DNA:  DNA
+
+#-RNA:  RNA
+
+#-Protein:  Protein
+
+#-Nucleotide: Do not select this item
+
+#-Other:  Do not select this item
+
+***Topology
+
+#From the pop-up menu, select the topology of the sequenced molecule.
+
+#-Linear:  Linear molecule (most sequences).
+
+#-Circular:  Circular molecule (such as a complete plasmid or mitochondrion).
+
+#-Tandem:  Do not select this item.
+
+#-Other:  Do not select this item.
+
+***Strand
+
+#From the pop-up menu, select whether the sequence was derived from an
+organism with a single- or double-stranded genome.  This is used primarily for
+viral submissions.
+
+#-Single:  The organism contains only a single-stranded genome, for
+example, ssRNA viruses. 
+
+#-Double:  The organism contains only a double-stranded genome, for
+example, dsDNA viruses.
+
+#-Mixed:  Do not select this item. 
+
+#-Mixed Rev:  Do not select this item.
+
+#-Other:  Do not select this item.
+
+**Biological Source
+
+#The Biological Source descriptor is described in more detail 
+<A HREF="#BiologicalSourceDescriptororFeature">
+below.
+</A>
+
+>Features
+
+*Overview
+
+#Features are annotations which apply to one or more intervals on a
+sequence. They can be contrasted to 
+<A HREF="#Descriptors">
+Descriptors,
+</A> 
+that apply to an entire sequence or an entire set of sequences. 
+Features will be added to the Target Sequence selected in the record
+viewer pop-up menu. 
+
+#You may add or modify features in one of three ways.
+
+#(1) In the record viewer, double click on the text of an existing
+feature to bring up a form on which information can be added or edited.
+
+#(2) Choose the feature from the Annotate menu to add a new feature.  
+
+#(3) Choose the feature from the Sequence Editor Features menu to add a
+new feature.
+
+#The features listed in the Annotate menu and the Sequence Editor
+Features menu are identical, and the instructions for adding them are
+the same, with one exception.  If you annotate them in the Annotate
+menu, you must provide the nucleotide sequence location of the feature.
+ However, if you add features from the Sequence Editor, you can
+highlight the sequence that the feature covers, and the location of the
+sequence will be automatically entered in the feature location box.
+
+*Annotate Menu
+
+#This menu allows you to add or modify features on the sequence selected
+in the Target Sequence pop-up menu of the record viewer.  Features are
+grouped into six categories.  Select the feature that you would like to
+mark on your sequence.  A new form will appear.
+
+#Feature forms share a common design.  The first page is specific to the
+particular feature, e.g., Coding Region or Gene.  The second page lists
+Properties of the Feature.  The third page describes the Location of the
+feature.  Details about the common second and third pages are provided
+below.
+
+**Properties Page
+
+***General Subpage
+
+#Enter general comments about the feature here.
+
+#Select any of the flags if necessary.  If this sequence contains only a
+partial representation of the feature you are describing, check the
+"Partial" box.  Check the "Exception" box if the feature annotates a
+post-transcriptional modification of the nucleotide sequence, such as
+ribosomal slippage or RNA editing.  This is generally used only on CDS
+features.  The evidence dialogs will only be editable if information
+has been entered in the Evidence subpage. 
+
+#If a gene feature overlaps the feature you are editing, the gene symbol
+will appear in the pull-down menu.  If you want to add the name of a
+new gene, select new, and enter its name and optional description.  By
+default, mapping between the feature and the gene is done by overlap,
+that is, the gene associated with the feature is the gene whose
+location overlaps with the location of the feature.   Under some
+circumstances, for example, if the sequences of two genes overlap, you
+may wish the feature to apply to a different gene.  In this case,
+select cross-reference, and select the name of the new gene in the
+pop-up menu. If you do not want the feature to map to any existing
+gene, select suppress.  You may also edit information on the Gene
+feature form by clicking on Edit Gene Feature.
+
+***Comment Subpage
+
+#Add any comments about the feature here, especially if you checked the
+"Exception" box on the General Subpage.
+
+***Citations Subpage
+
+#This page is used to list any citations that specifically apply to the
+feature you are annotating.  The citation must have already been entered
+into the record (see 
+<A HREF="#Publications">
+Publications
+</A>)
+ in the Sequin help documentation.  Click on Edit Citations, and
+place a check mark in box next to the publication you want to cite.  
+However, we discourage the use of citations on features.
+
+***Cross-Refs Subpage
+
+#This is a read-only page used to cross-reference this entry to entries
+in external databases (databases other than GenBank, EMBL/EBI, and
+DDBJ), such as dbEST or FLYBASE.  For more information on this topic,
+see the International Nucleotide Sequence Database Collaboration
+
+<A HREF="http://www.ncbi.nlm.nih.gov/collab/db_xref.html">
+page
+</A>.
+http://www.ncbi.nlm.nih.gov/collab/db_xref.html
+
+***Evidence Subpage
+
+#This page is primarily used by large sequencing centers to explain
+annotation prediction methods and its use is optional.  More details
+about these qualifiers can be found in the
+<A HREF="http://www.ncbi.nlm.nih.gov/GenBank/evidence.html">
+genome submission guidelines
+</A>.
+The two choices of evidence are Experiment or Inference.
+
+#Wet-bench, experimental evidence can be entered as free text in the
+Experiment section.  Please be as brief as possible.
+
+#The Inference section allows for information to be added in cases where
+the feature is annotated based solely on sequence similarity or
+prediction software. In order to fill in text, you must select one of
+the options from the Category pull-down menu.  Different pull-down and
+text boxes will appear depending on the selection you choose from the
+Category menu.  If you select one of the 'similar to' categories, you
+must include the name of the database and the corresponding accession
+number of the sequence used as the basis for the annotation.  If you
+choose one of the prediction categories, you must include the name and
+version of the prediction program used as the basis for the annotation. 
+
+#For example, if your annotation of a coding region was based on
+similarity to the sequence and annotation in GenBank Accession number
+AY411252, you would select "similar to DNA sequence" from the pull-down
+menu and then select "INSD" in the Database pull-down.  You would then
+type "AY411252.1" in the Accession text box.  If the annotation is
+based on the Genscan prediction algorithm, you would select "ab initio
+prediction" from the pull-down menu, select "Genscan" in the Program
+pull-down and enter 2.0 in the Program Version text box.  If the
+database or program used is not listed in the appropriate pull-down
+list, select Other from the list.  A new text box will appear where you
+can enter the name of the database or program used.  You still must
+include the appropriate accession number or version in the subsequent
+text box. 
+
+***Identifiers Subpage
+
+#This is a read-only page used by the database staff for tracking
+features within the record.
+
+**Location Page
+
+#This page allows you to select the location of the feature you are
+citing. Each feature must have a sequence interval associated with it. 
+In most cases, Sequin will limit the option to the nucleic acid or
+protein sequence as appropriate. 
+
+#Check the 5' Partial or 3' Partial box if the feature in your nucleic
+acid sequence is missing residues at the 5' or 3' ends, respectively.
+Check the NH2 Partial or COOH Partial if the feature in your amino acid
+sequence is missing residues at the amino- or carboxy-terminal ends,
+respectively.  If you checked "Partial" on the Properties page, you
+must check either the 5' and/or 3' partial boxes.
+
+#Enter the sequence range of the feature.  The numbers should correspond
+to the nucleotide sequence interval if the SeqID is set to a nucleotide
+sequence, and to an amino acid sequence interval if the SeqID is set to
+a protein sequence.  If the feature spans multiple, non-continuous
+intervals on the sequence, indicate the beginning and end points of each
+interval. If each interval is separate, and should not be joined with
+the others to describe the feature, check the Intersperse intervals with
+gaps box (for example, when annotating multiple primer binding sites). 
+If the feature is composed of several intervals that should all be
+joined together, do not check the box (for example, when annotating mRNA
+on a genomic DNA sequence).
+
+#For nucleic acid Features only:  From the pop-up menu, select the
+strand on which the feature is found.
+
+#-Plus:  Plus strand, or coding strand.
+
+#-Minus:  Minus strand, or non-coding strand.
+
+#-Both:  Both strands.
+
+#-Reverse:  Do not select this item.
+
+#-Other:  Do not select this item.
+
+#Use the pop-up menu to select the SeqID of the sequence you are
+describing by the location.
+
+#If you are working on a set of sequences which contain an alignment,
+you will see a toggle at the bottom of the Location Page where you can
+select to add or view the location of the feature using the Sequence
+Coordinates of the target sequence or the Alignment Coordinates.  In
+either case, the feature will only be added to the target sequence.  If
+you want to add features to all members of the set using the alignment
+coordinates, you must use the 
+
+<A HREF="http://www.ncbi.nlm.nih.gov/Sequin/sequin.hlp.html#Workingwithsetsofalignedsequences">
+Alignment Assistant
+</A>
+.
+#A brief description of the available features follows.  A detailed
+explanation of how to use the coding region (CDS) feature is included.
+The DDBJ/EMBL/GenBank feature table definition 
+<A HREF="http://www.ncbi.nlm.nih.gov/collab/FT/index.html">
+page
+</A>
+http://www.ncbi.nlm.nih.gov/collab/FT/index.html
+ provides detailed information about other features.
+
+*attenuator
+
+#1) region of DNA at which regulation of termination of transcription
+occurs, which controls the expression of some bacterial operons; 2)
+sequence segment located between the promoter and the first structural
+gene that causes partial termination of transcription.
+
+*C_region
+
+#Constant region of immunoglobulin light and heavy chains, and T-cell
+receptor alpha, beta, and gamma chains.  Includes one or more exons,
+depending on the particular chain.
+
+*CAAT_signal
+
+#CAAT box; part of a conserved sequence located about 75 bp upstream of
+the start point of eukaryotic transcription units that may be involved
+in RNA polymerase binding; consensus=GG(C or T)CAATCT.
+
+*CDS
+
+#coding sequence; sequence of nucleotides that corresponds with the
+sequence of amino acids in a protein (location includes stop codon).
+Feature includes amino acid conceptual translation.
+
+**Coding Region Page
+
+#Most users add a coding region to their sequence when they fill out the
+Organism and Sequences form.  However, you may need to edit the coding
+region, or add additional ones.  Choose CDS under the Coding Regions
+and Transcripts submenu of the Features menu, or to edit an existing
+CDS, double click on the record viewer. If you appended the partial
+sequence of a coding region to the Organism and Sequences form, you will
+probably need to edit the Coding Region feature to avoid validation
+error messages about the location of the coding region.
+
+***General (Product) Subpage
+
+#Choose the genetic code that should be used to translate the
+nucleotide sequence.  For more information, and for the translation
+tables themselves, see the NCBI Taxonomy 
+<A HREF="http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c">
+page
+</A>.
+If the genetic code is already populated from the taxonomy database, do
+not change this selection.
+
+#Choose the reading frame in which to translate the sequence.  Do not
+fill in the Protein Product or SeqID selections.
+
+#Supply additional information about the protein by clicking on Edit
+Protein Information to launch the Protein feature forms. The protein
+name must have already been filled out on the Protein subpage.
+
+#Checking retranslate on accept will translate the nucleotide sequence
+according to the interval(s) indicated on the Locations page when you
+click on Accept to exit the editor.  This new translation will replace
+any earlier translations you have supplied.  This should not be a
+problem if the interval was indicated appropriately. 
+
+#If the coding sequence that you supply is a partial sequence and you
+have checked a Partial box on the Location subpage, it is a good idea to
+check the Synchronize Partials box.  In this case, Sequin will ensure
+that all other appropriate features (such as protein) are also marked as
+partial.
+
+#When editing existing CDS features, choose the sequence you want to
+view by selecting its name uder the Product pop-up menu.  You may also
+import a new protein sequence by selecting Import Protein FASTA under
+the file menu. The sequence should be formatted as described above on
+the Organism and Sequences form. 
+
+#After you have imported a protein sequence, click on Predict Interval.
+This function will predict the interval on the nucleotide sequence to
+which the coding region applies. If you do not select this function,
+the interval will likely be wrong, and you will get an error message
+when you attempt to validate the record. If your sequence is a 5' or 3'
+partial, you must first indicate this manually on the Location Page. 
+
+#You may also have Sequin generate the protein sequence from the
+nucleotide sequence by clicking on Translate Product. However, you must
+first indicate the location and partialness of the coding region on the
+Location page in order to obtain the correct translation.
+
+***Protein Subpage
+
+#Use this page to enter or edit a name or descriptionof the protein
+product.  For a new sequence, enter information directly into the
+boxes.  You can edit descriptions of an existing sequence by clicking
+on Edit Protein Feature which will bring up the Protein feature form. 
+The Launch Product Viewer displays the flatfile view of ht eprotein
+record generated from the information in the CDS feature.
+
+***Exceptions Subpage
+
+#Exceptions describe places where there is a posttranslational
+modification. Enter the amino acid position at which the modification
+occurs, and select the amino acid that is actually represented in the
+protein from the pop-up list. Sequin will change the amino acid number
+to a nucleotide interval.  Please provide some explanation for the
+exception in a comment.
+
+*conflict
+
+#Independent determinations of the "same" sequence differ at this site
+or region.
+
+*D-loop
+
+#Displacement loop; a region within mitochondrial DNA in which a short
+stretch of RNA is paired with one strand of DNA, displacing the
+original partner DNA strand in this region; also used to describe the
+displacement of a region of one strand of duplex DNA by a single
+stranded invader in the reaction catalyzed by RecA protein.
+
+*D_segment
+
+#Diversity segment of immunoglobulin heavy chain, and T-cell receptor
+beta chain.
+
+*enhancer
+
+#A cis-acting sequence that increases the utilization of (some)
+eukaryotic promoters and can function in either orientation and in any
+location (upstream or downstream) relative to the promoter.
+
+*exon
+
+#Region of genome that codes for portion of spliced mRNA; may contain
+5' UTR, all CDSs, and 3' UTR.
+
+*gap
+
+#Gap in the sequence, only applied to gaps of unknown length.  The
+location span of the gap feature is 100 base pairs, indicated by 100 "n"s
+in the sequence.  The qualifier /estimated_length=unknown is mandatory.
+
+*GC_signal
+
+#GC box; a conserved GC-rich region located upstream of the start point
+of eukaryotic transcription units that may occur in multiple copies or
+in either orientation; consensus=GGGCGG.
+
+*gene
+
+#Region of biological interest identified as a gene and for which a name 
+has been assigned.
+
+*iDNA
+
+#Intervening DNA; DNA which is eliminated through any of several kinds
+of recombination.
+
+*intron
+
+#A segment of DNA that is transcribed, but removed from within the
+transcript, by splicing together the sequences (exons) on either side of
+it.
+
+*J_segment
+
+#Joining segment of immunoglobulin light and heavy chains, and T-cell
+receptor alpha, beta, and gamma chains.
+
+*LTR
+
+#Long terminal repeat, a sequence directly repeated at both ends of a
+defined sequence, of the sort typically found in retroviruses.
+
+*mat_peptide
+
+#Mature peptide or protein coding sequence; coding sequence for the
+mature or final peptide or protein product following post-translational
+modification. The location does not include the stop codon (unlike the
+corresponding CDS).
+
+*misc_binding
+
+#Site in nucleic acid that covalently or non-covalently binds another
+moiety that cannot be described by any other Binding key (primer_bind or
+protein_bind).
+
+*misc_difference
+
+#Feature sequence is different from that presented in the entry and
+cannot be described by any other Difference key (conflict, unsure,
+old_sequence, mutation, variation, allele, or modified_base).
+
+*misc_feature
+
+#Region of biological interest which cannot be described by any other
+feature key. 
+
+*misc_recomb
+
+#Site of any generalized, site-specific, or replicative recombination
+event where there is a breakage and reunion of duplex DNA that cannot be
+described by other recombination keys (iDNA and virion) or qualifiers of
+source key (/insertion_seq, /transposon, /proviral).
+
+*misc_RNA
+
+#Any transcript or RNA product that cannot be defined by other RNA keys
+(prim_transcript, precursor_RNA, mRNA, 5'clip, 3'clip, 5'UTR, 3'UTR,
+exon, intron, polyA_site, rRNA, tRNA, scRNA, snoRNA, and snRNA).
+
+*misc_signal
+
+#Any region containing a signal controlling or altering gene function or
+expression that cannot be described by other Signal keys (promoter,
+CAAT_signal, TATA_signal, -35_signal, -10_signal, GC_signal, RBS,
+polyA_signal, enhancer, attenuator, terminator, and rep_origin).
+
+*misc_structure
+
+#Any secondary or tertiary structure or conformation that cannot be
+described by other Structure keys (stem_loop and D-loop).
+
+*modified_base
+
+#The indicated nucleotide is a modified nucleotide and should be
+substituted for by the indicated molecule (given in the mod_base
+qualifier value).
+
+*mRNA
+
+#messenger RNA; includes 5' untranslated region (5' UTR), coding sequences
+(CDS, exon) and 3' untranslated region (3' UTR).
+
+*N_region
+
+#Extra nucleotides inserted between rearranged immunoglobulin segments.
+
+*old_sequence
+
+#The presented sequence revises a previous version of the sequence at
+this location.
+
+*operon
+
+#Region containing polycistronic transcript under the control of the same
+regulatory sequences.
+
+*oriT
+
+Origin of transfer; region of DNA where transfer is initiated during the
+process of conjugation or mobilization.
+
+*polyA_signal
+
+#Recognition region necessary for endonuclease cleavage of an RNA
+transcript that is followed by polyadenylation; consensus=AATAAA.
+
+*polyA_site
+
+#Site on an RNA transcript to which will be added adenine residues by
+post-transcriptional polyadenylation.
+
+*precursor_RNA
+
+#Any RNA species that is not yet the mature RNA product; may include 5'
+clipped region (5' clip), 5' untranslated region (5' UTR), coding
+sequences (CDS, exon), intervening sequences (intron), 3' untranslated
+region (3' UTR), and 3' clipped region (3' clip).
+
+*prim_transcript
+
+#Primary (initial, unprocessed) transcript; includes 5' clipped region
+(5' clip), 5' untranslated region (5' UTR), coding sequences (CDS, exon),
+intervening sequences (intron), 3' untranslated region (3' UTR), and 3'
+clipped region (3' clip).
+
+*primer_bind
+
+#Non-covalent primer binding site for initiation of replication,
+transcription, or reverse transcription. Includes site(s) for synthetic
+e.g., PCR primer elements.
+
+*promoter
+
+#Region on a DNA molecule involved in RNA polymerase binding to initiate
+transcription.
+
+*protein_bind
+
+#Non-covalent protein binding site on nucleic acid.
+
+*RBS
+
+#Ribosome binding site.
+
+*repeat_region
+
+#Region of genome containing repeating units.
+
+*repeat_unit
+
+#Single repeat element.
+
+*rep_origin
+
+#Origin of replication; starting site for duplication of nucleic acid to
+give two identical copies.
+
+*rRNA
+
+#Mature ribosomal RNA ; the RNA component of the ribonucleoprotein
+particle (ribosome) that assembles amino acids into proteins.
+
+*S_region
+
+#Switch region of immunoglobulin heavy chains. Involved in the
+rearrangement of heavy chain DNA leading to the expression of a
+different immunoglobulin class from the same B-cell.
+
+*satellite
+
+#Many tandem repeats (identical or related) of a short basic repeating
+unit; many have a base composition or other property different from the
+genome average that allows them to be separated from the bulk (main
+band) genomic DNA.
+
+*scRNA
+
+#Small cytoplasmic RNA; any one of several small cytoplasmic RNA
+molecules present in the cytoplasm and (sometimes) nucleus of a
+eukaryote.
+
+*sig_peptide
+
+#Signal peptide coding sequence; coding sequence for an N-terminal
+domain of a secreted protein; this domain is involved in attaching
+nascent polypeptide to the membrane; leader sequence.
+
+*snRNA
+
+#Small nuclear RNA involved in pre-mRNA splicing and processing. 
+
+*snoRNA
+
+#Small nucleolar RNA molecules generally involved in rRNA modification
+and processing.
+
+*source
+
+#Identifies the biological source of the specified span of the sequence.
+This key is mandatory. Every entry will have, as a minimum, a single
+source key spanning the entire sequence. More than one source key per
+sequence is permittable.
+
+*stem_loop
+
+#Hairpin; a double-helical region formed by base-pairing between
+adjacent (inverted) complementary sequences in a single strand of RNA or
+DNA.
+
+*STS
+
+#Sequence Tagged Site. Short, single-copy DNA sequence that
+characterizes a mapping landmark on the genome and can be detected by
+PCR. A region of the genome can be mapped by determining the order of a
+series of STSs.
+
+*TATA_signal
+
+#TATA box; Goldberg-Hogness box; a conserved AT-rich septamer found
+about 25 bp before the start point of each eukaryotic RNA polymerase II
+transcript unit that may be involved in positioning the enzyme for
+correct initiation; consensus=TATA(A or T)A(A or T).
+
+*terminator
+
+#Sequence of DNA located either at the end of the transcript or adjacent
+to a promoter region that causes RNA polymerase to terminate
+transcription; may also be site of binding of repressor protein.
+
+*transit_peptide
+
+#Transit peptide coding sequence; coding sequence for an N-terminal
+domain of a nuclear-encoded organellar protein; this domain is involved
+in post- translational import of the protein into the organelle.
+
+*tRNA
+
+#Mature transfer RNA, a small RNA molecule (75-85 bases long) that
+mediates the translation of a nucleic acid sequence into an amino acid
+sequence.
+
+*unsure
+
+#Author is unsure of exact sequence in this region.
+
+*V_region
+
+#Variable region of immunoglobulin light and heavy chains, and T-cell
+receptor alpha, beta, and gamma chains.  Codes for the variable amino
+terminal portion.  Can be made up from V_segments, D_segments,
+N_regions, and J_segments.
+
+*V_segment
+
+#Variable segment of immunoglobulin light and heavy chains, and T-cell
+receptor alpha, beta, and gamma chains.  Codes for most of the variable
+region (V_region) and the last few amino acids of the leader peptide.
+
+*variation
+
+#A related strain contains stable mutations from the same gene (e.g.,
+RFLPs, polymorphisms, etc.) that differ from the presented sequence at
+this location (and possibly others).
+
+*3'clip
+
+#3'-most region of a precursor transcript that is clipped off during
+processing.
+
+*3'UTR
+
+#Region near or at the 3' end of a mature transcript (usually following
+the stop codon) that is not translated into a protein; trailer.
+
+*5'clip
+
+#5'-most region of a precursor transcript that is clipped off during
+processing.
+
+*5'UTR
+
+#Region near or at the 5' end of a mature transcript (usually preceding
+the initiation codon) that is not translated into a protein; leader.
+
+* -10_signal
+
+#Pribnow box; a conserved region about 10 bp upstream of the start point
+of bacterial transcription units that may be involved in binding RNA
+polymerase; consensus=TAtAaT.
+
+* -35_signal
+
+#A conserved hexamer about 35 bp upstream of the start point of
+bacterial transcription units; consensus = TTGACa or TGTTGACA.
+
+>Biological Source Descriptor or Feature
+
+#This annotation is very important, as an entry cannot be processed by
+the databases unless it includes some basic information about the
+organism from which the sequence was derived.  This basic information was
+entered previously in the submission, in the Organism and Sequences
+Form.  The more detailed Organism Information form allows you to alter
+or add to the data you entered earlier.
+
+*Overview:  Descriptor or Feature?
+
+#Sequin allows two types of biological source information to be entered,
+Biological Source Descriptors and Biological Source Features. Biological
+Source Descriptors, like other descriptors, provide organism information
+about an entire sequence, or an entire set of sequences, in an entry.
+Biological Source Features, like other features, provide organism
+information about a specific interval on a given sequence.
+
+#In most cases, you will want to use a Biological Source Descriptor, because
+all the sequences in the entry will derive from the same source. 
+However, if you have sequenced a transgenic molecule, for example, one
+that is part plant and part bacterial, you would use Biological Source
+Features to annotate which sequence was derived from plant and which from
+bacteria.
+
+#To add a Biological Source Descriptor, select Biological Source under
+the Descriptor section of the Annotate menu.  To add a Biological
+Source Feature, select Biological Source under the Bibliographic and
+Comments section of the Annotate menu.
+
+#Annotating a Biological Source Descriptor or Feature is similar to
+annotating any descriptor or feature.  For help in creating descriptors
+and features, see the appropriate section of the help documentation. 
+The following are instructions for filling out Biological
+Source-specific forms.
+
+*Organism Page
+
+**Names Subpage
+
+#The scrollable list contains the scientific names of many organisms. 
+To reach a name on the list, either type the first few letters of the
+scientific name, or use the thumb bar.  Click on a name from the list to
+fill out the scientific name field.  If there is a common name for the
+organism, that field will be filled out automatically.  You may also
+directly type in the scientific name.  If you have any questions about
+the scientific or common name of an organism, see the NCBI
+<A HREF="http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html">
+taxonomy browser
+</A> 
+http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html
+
+**Location Subpage
+
+***Location of Sequence
+
+#From the selection list, please enter the location of the genome that
+contains your sequence.  Most entries will have a "Genomic" location.
+A brief description of the choices in this pop-up menu were listed
+previously.
+
+***Origin of Sequence
+
+#This menu is for the use of database personnel.  Please leave this
+field empty.  The Biological focus box should be checked in rare cases
+where multiple source features are annotated.
+
+**Genetic Codes Subpage
+
+#Please use these fields to select the nuclear and mitochondrial genetic
+code that should be used to translate the nucleic acid sequence.  The
+genetic code for a eukaryotic organism is "Standard".  If you selected
+an organism name from the scrollable list described above, this field
+was filled out automatically.  Do not change these fields if they have
+been filled out automatically.
+
+#For more information regarding the translation tables available, see
+the NCBI Taxonomy
+
+<A HREF="http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c">
+page
+</A>.
+
+**Lineage Subpage
+
+#This information is normally entered by the database staff.  They will
+use the 
+<A HREF="http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html">
+Taxonomy database
+http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html
+</A>
+ maintained by the NCBI/GenBank.
+
+#If you disagree with the lineage supplied please notify the database
+staff.
+
+#If you are running Sequin in its 
+<A HREF="#NetConfigure">
+network-aware
+</A> 
+mode, you will see a button labeled "Lookup Taxonomy".  Click on this
+button to perform an automatic look-up of the taxonomic lineage of the
+organism.  Sequin will perform the look-up by accessing the Taxonomy
+database and will fill out the Taxonomic Lineage and
+Division fields.
+
+#If you have any comments about the taxonomic lineage determined by
+Sequin, please submit these comments with your entry.  Under the Sequin
+File menu, select Edit Submitter Info.  Enter your comments in the box
+entitled "Special Instructions to Database Staff", on the Submission
+page.   
+
+*Modifiers Page
+
+#This page allows you to enter additional information about the source
+and/or organism.  Entering information is optional.
+
+**Source Subpage
+
+#Choose a modifier from the pull-down menu on the left side of the page
+and type the appropriate name on the right side of the page.  If you do
+not find appropriate modifiers in the scroll down list, you can enter
+additional source information as text in the field at the bottom of the
+page.  You may select as many modifiers as you want.
+
+#The following is a description of the available modifiers:
+
+#-Cell-line:  Cell line from which sequence derives.
+
+#-Cell-type:  Type of cell from which sequence derives.
+
+#-Chromosome:  Chromosome to which the gene maps.
+
+#-Clone:  Name of clone from which sequence was obtained.
+
+#-Clone-lib:  Name of library from which sequence was obtained.
+
+#-Collected-by:  Name of person who collected sample.  Do not use
+accented or non-ASCII characters.
+
+#-Collection-date:  Date sample was collected.  Must use format
+23-Mar-2005, Mar-2005, or 2005.
+
+#-Country: The country of origin of DNA samples used for epidemiological
+or population studies.
+
+#-Dev-stage:  Developmental stage of organism.
+
+#-Endogenous-virus-name:  Name of inactive virus that is integrated into
+the chromosome of its host cell and can therefore exhibit vertical
+transmission.
+
+#-Environmental-sample: Identifies sequence derived by direct molecular
+isolation from an unidentified organism.  Do not include extra text when
+using this modifier. 
+
+#-Frequency:  Frequency of occurrence of a feature.
+
+#-Fwd-PCR-primer-name:  Name or designation of forward primer used for
+amplification.
+
+#-Fwd-PCR-primer-seq:  Sequence of forward primer used for amplification.
+
+#-Genotype:  Genotype of the organism.
+
+#-Germline:  If the sequence shown is DNA and a member of the
+immunoglobulin family, this qualifier is used to denote that the sequence
+is from unrearranged DNA.  Do not include extra text when using this
+modifier. 
+
+#-Haplotype:  Haplotype of the organism.
+
+#-Identified-by:  Name of person who identified sample.  Do not use
+accented or non-ASCII characters.
+
+#-Isolation-source:  Describes the local geographical source of the organism
+from which the sequence was derived
+
+#-Lab-host:  Laboratory host used to propagate the organism from which
+the sequence was derived.
+
+#-Lat-Lon:  Latitude and longitude of location where sample was
+collected.  Preferred format is decimal degrees N/S E/W.
+
+#-Map:  Map location of the gene.
+
+#-Plasmid-name:  Name of plasmid from which the sequence was obtained.
+
+#-Plastid-name:  Name of plastid from which the sequence was obtained.
+
+#-Pop-variant:  Name of the population variant from which the sequence was
+obtained.
+
+#-Rearranged:  If the sequence shown is DNA and a member of the
+immunoglobulin family, this qualifier is used to denote that the sequence
+is from rearranged DNA.  Do not include extra text when using this
+modifier.
+
+#Rev-PCR-primer-name:  Name or description of reverse primer used for
+amplification.
+
+#Rev-PCR-primer-seq:  Sequence of reverse primer used for amplification.
+
+#-Segment: Name of viral genome fragmented into two or more nucleic acid
+molecules.
+
+#-Sex:  Sex of the organism from which the sequence derives.
+
+#-Subclone:  Name of subclone from which sequence was obtained.
+
+#-Tissue-lib:  Tissue library from which the sequence was obtained.
+
+#-Tissue-type:  Type of tissue from which sequence derives.
+
+#-Transgenic:  Identified organism that was the recipient of transgenic
+DNA.  Do not include extra text when using this modifier.
+
+**Organism Subpage
+
+#Choose a modifier from the pull-down menu on the left side of the page
+and type the appropriate name on the right side of the page.  If you do
+not find appropriate modifiers in the scroll down list, you can enter
+additional organism information as text in the field at the bottom of
+the page. You may select as many modifiers as you want.
+
+#The following is a description of the available modifiers:
+
+#-Acronym:  Standard synonym (usually of a virus) based on the initials
+of the formal name.  An example is HIV-1.
+
+#-Anamorph: The scientific name applied to the asexual phase of a fungus.
+
+#-Authority: The author or authors of the organism name from which sequence
+was obtained.
+
+#-Biotype:  See biovar.
+
+#-Biovar:  Variety of a species (usually a fungus, bacteria, or virus)
+characterized by some specific biological property (often geographical,
+ecological, or physiological).  Same as biotype.
+
+#-Breed: The named breed from which sequence was obtained (usually applied
+to domesticated mammals).
+
+#-Chemovar:  Variety of a species (usually a fungus, bacteria, or virus)
+characterized by its biochemical properties.
+
+#-Common:  Common name of the organism from which sequence was obtained.
+
+#-Cultivar:  Cultivated variety of plant from which sequence was obtained.
+
+#-Ecotype: The named ecotype (population adapted to a local habitat) from
+which sequence was obtained (customarily applied to populations of
+Arabidopsis thaliana).
+
+#-Forma: The forma (lowest taxonomic unit governed by the nomenclatural
+codes) of organism from which sequence was obtained. This term is usually
+applied to plants and fungi.
+
+#-Forma-specialis: The physiologically distinct form from which sequence
+was obtained (usually restricted to certain parasitic fungi).
+
+#-Group:  Do not select this item.
+
+#-Isolate:  Identification or description of the specific individual
+from which this sequence was obtained.  An example is Patient X14.
+
+#-Old name:  Do not select this item.
+
+#-Pathovar:  Variety of a species (usually a fungus, bacteria or virus)
+characterized by the biological target of the pathogen.  Examples
+include Pseudomonas syringae pathovar tomato and Pseudomonas syringae
+pathovar tabaci.
+
+#-Serogroup:  See serotype.
+
+#-Serotype:  Variety of a species (usually a fungus, bacteria, or virus)
+characterized by its antigenic properties.  Same as serogroup and
+serovar.
+
+#-Serovar:  See serotype.
+
+#-Specific-host:  When the sequence submission is from an organism that
+exists in a symbiotic, parasititc, or other special relationship with
+some second organism, use this modifier to identify the name of the
+host species.
+
+#-Specimen-voucher: An identifier of the individual or collection of the
+source organism and the place where it is currently stored, usually an
+institution.
+
+#-Strain:  Strain of organism from which sequence was obtained.
+
+#-Subgroup:  Do not select this item.
+
+#-Sub-species:  Subspecies of organism from which sequence was obtained.
+
+#-Substrain:  Sub-strain of organism from which sequence was obtained.
+
+#-Subtype:  Subtype of organism from which sequence was obtained.
+
+#-Synonym: The synonym (alternate scientific name) of the organism name
+from which sequence was obtained.
+
+#-Teleomorph: The scientific name applied to the sexual phase of a fungus.
+
+#-Type:  Type of organism from which sequence was obtained.
+
+#-Variety:  Variety of organism from which sequence was obtained.
+
+**GenBank Subpage
+
+#Please do not use this form.  This field is reserved for information from
+NCBI's taxonomy database.
+
+*Miscellaneous Page
+
+**Synonyms Subpage
+
+#If there are alternative names for the organism from which the sequence
+was derived, enter them here.  Please be aware that this is the
+appropriate field only for alternative names for the organism, not for
+alternative gene or protein names.
+
+**Cross-Refs Subpage
+
+#This page is for use by database staff only. 
+
+>Publications
+
+*Overview:  Descriptor or Feature?
+
+#Sequin allows two types of publications to be entered, Publication
+Descriptors and Publication Features.  Publication Descriptors are
+bibliographic references that, like other descriptors, cover an entire
+sequence, or an entire set of sequences, in an entry.  Publication
+Features are bibliographic references that, like other features, cover
+a specific interval on a given sequence.
+
+#Publications are entered into the Reference field of the database
+entry. References are citations of unpublished, in press, or published
+works that are relevant to the submitted sequence. Publications
+should provide information regarding the principle cloning and
+determination of the sequence within the record. 
+
+#In general, there is one publication describing a sequence, and a
+Publication Descriptor should be used. To enter a Publication
+Descriptor, select Publications under the Annotate menu and click on
+Publication Descriptor.
+
+#However, if one publication describes the cloning of the 5' end of a
+gene, and another publication describes the cloning of the 3' end of
+the gene, Publication features may be used.  To make a publication
+feature, choose Publication Feature in the Publications section of the
+Annotate menu.  Enter the information about the publication, and then
+enter the nucleotide interval to which the publication refers on the
+Location page.
+
+*Citation on Entry Form
+
+**Status
+
+#Using the radio buttons, select one of the three options:
+
+#-Unpublished: Select this option if a manuscript has been written but
+not yet submitted or has been submitted for publication but has not yet
+been accepted.
+
+#-In Press: The article has been accepted for publication but is not yet
+in print.
+
+#-Published: The article has been published.
+
+**Class
+
+#Using the radio buttons, select the type of publication in which the
+sequence will appear.
+
+#-Journal
+
+#-Book Chapter
+
+#-Book
+
+#-Thesis/Monograph
+
+#-Proceedings Chapter:  Abstract from a meeting
+
+#-Proceedings:  A meeting
+
+#-Patent
+
+#-Online Publication: Used for journals which publish strictly online and
+do not issue print copies.
+
+#-Submission
+
+**Scope
+
+#Using the radio buttons, select one of the options.
+
+#-Refers to the entire sequence: Most publications should be classified
+as such.
+
+#-Refers to part of the sequence: For use only when a publication
+discusses only part of the presented sequence.  You must enter the
+locations in the location tab in later forms.  This selection is only
+valid when adding a Publication feature, not descriptor.
+
+#-Cites a feature on the sequence: This selection should only be made in
+limited cases.  Its use must coincide with the use of the /citation
+qualifier on the given feature.
+
+#After you have filled out the Citation on Entry form, click on
+"Proceed" to see the next form.
+
+*Citation Information Form (General)
+
+**Authors Page
+
+***Names Subpage
+
+#Please enter the names of the authors.  Note that the first name of the
+author is listed first.  You can add as many authors to this page as
+necessary. After you type in the name of the third author, the box
+becomes a spreadsheet, and you can scroll down to the next line by
+using the thumb bar.  The suffix toggle allows the addition of common
+suffixes to the author name.  The consortium field should be used when
+a consortium is responsible for the sequencing or publication of the
+data.  The consortium should not be the department or institute
+affiliation of the authors.  Individual authors may be listed along
+with a consortium name.
+
+***Affiliation Subpage
+
+#Please enter information about the institution where the sequencing was
+performed.
+
+#Other pages in the Citation Information Form will be different,
+depending on the Class of publication selected in the Citation on Entry
+Form. Instructions for filling out the Citation Information Form for
+Journals is included here.
+
+*Citation Information Form (If Selected Class Was Journal)
+
+**Title Page
+
+#Enter title for manuscript in the box.
+
+**Journal Page
+
+#Fill in the appropriate Journal, Volume, Issue, Pages, Day, and Year
+fields by typing information into the boxes.  Select the month with the
+pop-up menu. If necessary, choose an option from the Erratum pop-up
+menu and explain the erratum. 
+
+#If you are running Sequin in its 
+<A HREF="#NetConfigure">
+network-aware
+</A> 
+mode, the program will look up the Title, Author, and Journal
+information in the MEDLINE database if you supply it with some minimal
+information.  For example, if you know the MUID (MEDLINE Unique
+Identifier) of the publication, enter it in the appropriate box and
+select "Lookup By MUID."  Sequin will automatically retrieve the rest
+of the information.  One way to find the MUID of the publication is to
+look up the publication with the NCBI's 
+
+<A HREF="http://www.ncbi.nlm.nih.gov/Entrez">
+Entrez
+</A> 
+service. Alternatively, if you do not know the MUID, enter the Journal,
+Volume, Pages, and Year.  Then select "Lookup Article".  Sequin will
+retrieve the missing Title and Author information.
+
+#The PubStatus toggle is used by database staff.  If you have used the
+"Lookup by MUID" or "Lookup by PMID" functions, this field may be
+populated.  Please do not edit the information.
+
+**Remark Page
+
+#This page is reserved for use by the database staff. 
+
+>File Menu
+
+*About Sequin
+
+#Details about the current version of Sequin.
+
+*Help
+
+#Launches the help documentation.
+
+*Open
+
+#Open an existing entry.  This option will open a record that has been
+previously saved in Sequin.  Furthermore, for analysis purposes, it can also
+open
+a FASTA-formatted sequence file.  The sequence will be displayed in Sequin and
+can be analyzed with tools such as CDD Search, but it should not be submitted,
+because it does not have the appropriate annotations.
+
+*Close
+
+#Close this entry.
+
+*Export 
+
+#Exports the currently displayed format to a file.  Do not use export
+ASN1 for submission of sequences to the database.
+
+*Duplicate View
+
+#Duplicates the entry.  You can then view the entry simultaneously in
+different Display Formats.
+
+*Save
+
+#Saves the entry.  Note:  This merely saves the entry so you can go back
+and edit it.  It does not prepare the entry for submission to the
+database, that is, it does not validate the entry.
+
+*Save As
+
+#See Save.
+
+*Save as Binary Seq-entry
+
+#Saves the file in a compressed format and should be used only when the
+file is to be imported into other analysis programs.  Do not use this
+option to save files for submission directly to GenBank.
+
+*Restore
+
+#Replaces the displayed record with a previously saved version.  This
+feature is useful if you have made unwanted changes since you last saved
+the record.
+
+*Prepare Submission
+
+#Prepares the entry for submission to the database.  See 
+<A HREF="#SubmittingtheFinishedRecordtotheDatabase">
+Submitting the Finished Record to the Database
+</A> 
+ in the Sequin help documentation.
+
+*Print
+
+#Prints the window that is currently selected.  The selected window can
+be one of the Sequin forms or pages, or the help documentation.
+
+*Quit
+
+#Exit from Sequin.
+
+>Edit Menu
+
+*Copy
+
+#Copy the selected item.
+
+*Clear
+
+#Clear the selected item.
+
+*Edit Sequence
+
+#To edit a single sequence, select the sequence identifier in the Target
+Sequence pop-up menu, and click on Edit sequence.  The sequence editor
+will be launched for that sequence.  The
+<A HREF="#SequenceEditor">
+sequence editor
+</A> 
+is discussed in more detail below.
+
+*Alignment Assistant
+
+#This option will launch the Alignment Assistant which is discussed in
+more detail
+
+<A HREF="#Workingwithsetsofalignedsequences">
+below
+</A> 
+.
+
+*Edit Submitter Info
+
+#Opens up the Submission Instructions form, which allows you to enter
+additional information about the person submitting the record.  Much of
+this information was entered on the first form in Sequin, the Submitting
+Authors form.
+
+#You can also save the information from the Submitting Authors form
+here, so that you can use it in subsequent Sequin submissions.  Click
+on "Edit Submitter Info" and, under the file menu in the resulting
+Submission Instructions form, click on Export Submitter Info to save
+the information to a file.  For subsequent Sequin submissions, if you
+have already saved the submittor information, click on Import Submitter
+Info under the File menu on the Submission page of the Submitting
+Authors form.
+
+**Submission Page
+
+#Indicate the type of submission.  If it is a new submission, select
+New.  If you are updating an existing submission in order to resubmit it
+to the databases, select Update.  Check either the "Yes" or "No" radio
+button to indicate if the record should be released before publication. 
+If you select "Yes", the entry will be released to the public after the
+database staff has added it to the database. If you select "No", fields
+will appear in which you can indicate the date on which the sequences
+should be released to the public.  The submission will then be held back
+until formal publication of the sequence or
+GenBank Accession number, or until the Release Date, whichever comes
+first. If you have any special instructions, enter them in the box at
+the bottom of the page.
+
+**Contact Page
+
+#Update the name, affiliation, or contact numbers of the person
+submitting the record.  Please supply a fax number to facilitate
+communication with database staff.
+
+**Citation Page
+
+#Update the names and affiliation of the people who should receive
+scientific credit for the generation of sequences in this entry.  The
+address should list the principal institution in which the sequencing
+and/or analysis was carried out.  If you are submitting the record as
+an update to the databases, explain the reason for the update on the
+Description subpage.
+
+*Update Sequence
+
+#This selection allows you to replace a sequence with another sequence,
+merge two sequences that overlap at their ends, 'patch' a corrected
+fragment of a sequence to the current sequence, or copy features from
+one sequence to another. 
+
+#Use Single Sequence to import a sequence in FASTA or ASN.1 format (for
+example, a sequence record that has already been saved in Sequin). If
+you are running Sequin in
+
+<A HREF="#NetConfigure">
+Network Aware mode,
+</A> 
+you can use Download Accession to import a record from Entrez. The
+Multiple Sequences option allows you to update multiple sequences using
+either FASTA or ASN.1 formats.  In either format, each sequence
+identifier must be identical in the new and old sequences. 
+
+#After you import the updated sequence, a new window will open that
+displays two graphical views and the text of the alignment of the new
+and old sequence. The first graphic displays the relative length of the
+two sequences and the length of the overlapping region between
+sequences.  The second graphic represents any inserts, deletions, or
+point changes within the aligned region between the new and old
+sequences.  Clicking on a region in this graphic will scroll to the
+corresponding nucleotide sequence in the alignment text below.
+
+#The Sequence Update box to the left shows the action that will be
+performed upon updating the sequence, i.e., no change, replace, extend
+5', extend 3', or patch.  The patch function allows you to replace an
+internal fragment of the sequence without affecting flanking regions.  
+You can also override the alignment between the new and old sequence
+using the Ignore alignment checkbox to force a sequence change of
+replace, Extend 5' or Extend 3'.  This option allows you to append new
+sequence to with no overlap.
+
+#If the current sequence has annotation, you can use the Existing
+Features box to determine whether the annotation should remain or be
+removed upon updating the sequence.  The Do not remove option is the
+default.  However, you may chose to remove annotated features only in
+the aligned area, outside the aligned area, or to remove all currently
+annotated features.
+
+#When updating via Download Accession or an ASN.1 file, the Import
+Features box allows you to specify whether features from the new file
+should be imported to the existing record.   The dialog offers
+different options for cases where the features on the new file are
+identical to those on the existing record. 
+
+#If you are using the Multiple Sequences option, you may choose to
+review the sequences and update them one by one using the Update this
+Sequence box at the bottom of the window.  You may skip a sequence
+update or choose to update all sequences at once without reviewing them
+in the Update Sequence dialog.
+
+#In any case, please carefully review the sequence and annotation in the
+record viewer after using the Update Sequence function.
+
+*Extend Sequence
+
+#This selection functions similar to the 
+
+<A HREF="#UpdateSequence">
+Update Sequence
+</A>
+
+function.  However, you can only extend the existing sequence in either
+the 5' or 3' direction in cases with no overlap between the existing
+and new sequences. 
+
+*Feature Propagate
+
+#This selection allows you to propagate any annotated feature from one
+sequence in an aligned set to other sequences within the set. For
+example, if one nucleotide sequence in the alignment contains a CDS
+feature, you can annotate a similar CDS on the other nucleotide
+sequences in the set. 
+
+#The default source of features to be propagated is the first member
+of the set.  If you would like to use a different entry as the source of
+the features, scope to that entry in the Target Sequence menu before 
+selecting Feature Propagate from the Edit menu.
+
+#The Feature Propagate window allows you to select which sequences
+should receive the new annotation and which features will be
+propagated. You can also select whether the features will be extended
+or split at gaps in the alignment.  The split at gaps selection will
+produce two features, one on either side of the gap within the
+alignment.  If you are propagating a CDS feature, you may specify that
+the translation end or extend through internal stop codons.  You may
+also extend the translation after the stop codon on the source entry by
+chosing to translate the CDS after partial 3' boundary.  If the CDS
+that you are propagating to other records is partial on either end, you
+should select the 'Cleanup CDS partials after propagation' check box. 
+This will retain the partial nature of the CDS features on all records.
+ The fuse adjacent propagated intervals function will create one
+feature from two of the same type that contain abutting nucleotide
+intervals due to the nature of the alignment used for propagation.
+
+*Add Sequence
+
+#This selection allows you to add a new sequence to an existing
+population, mutation, phylogenetic, or environmental sample set.
+You may import the new entry in FASTA format or ASN.1 format (for
+example, a sequence record that has been saved in Sequin). 
+
+*Parse File to Source
+
+#This selection allows you to add unique information for one source
+qualifier for each of the records in a batch or set.  The input file
+must be in the format of a tab-delimited, two column table.  The first
+column should list the SeqID exactly as it was listed in the original
+FASTA file.  The second column should list the text value for the
+desired source qualifier for each record. Once the file has been
+imported, a pop-up box will appear with the source qualifiers listed in
+the pull down menus.  The qualifiers are separated into three menus:
+one for taxonomic information, one for the Organism modifiers and one
+for the Source modifiers.   For example, in order to add the clone
+designations 57 and 49 to the sequences labeled seq1 and seq2, the table
+
+seq1   57
+seq2   49
+
+should be used and clone should be selected from the Source modifiers
+pull-down menu.
+
+>Search Menu
+
+*Find ASN.1
+
+#Under this command, you can find and replace strings of letters in
+those fields of your submission that contain manually entered data. 
+The fields that can be altered are Locus, Definition, Accession,
+Keywords, Source, Reference, and Features. To use this option, select
+Find and fill the Find and Replace lines with the appropriate text. 
+Note that you cannot edit the sequence in this way.
+
+*Find FlatFile
+
+#Under this command, you can find strings of letters in all fields of
+your submission.  You can use the Find First and Find Next buttons to
+identify the specified text sequentially through the flatfile. 
+
+*Find by Gene
+
+#This option allows you to move quickly in the record viewer to a gene
+feature containing the specified gene symbol.
+
+*Find by Protein
+
+#This option allows you to move quickly in the record viewer to a CDS
+feature containing the specified product name.
+
+*Find by Position
+
+#This option allows you to move quickly in the record viewer to any
+feature annotated at the specified nucleotide location.
+
+*Validate
+
+#This option detects discrepancies between the format of your submission
+and that required by the database selected for entry.  If discrepancies
+are present, it suggests ways in which to correct them. See the topic on
+
+<A HREF="#SubmittingtheFinishedRecordtotheDatabase">
+Submitting the Finished Record to the Database
+</A> 
+ in the Sequin help documentation.
+
+*CDD Search 
+
+#Performs a CDD BLAST search of the selected sequence against the
+NCBI's 
+<A HREF="http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml">
+Conserved Domain Database
+</A>
+.  To do a CDD BLAST search, Sequin must be in its network aware mode.  
+
+#CDD currently contains domains derived from two popular collections,
+Smart and Pfam, plus contributions from colleagues at NCBI.  The source
+databases also provide descriptions and links to citations.  Since
+conserved domains correspond to compact structural units, CDs contain
+links to 3D-structure via Cn3D whenever possible.
+
+#The results of the CDD search will be displayed in the record
+viewer.  These results are for your use only and should be removed
+from the record before submission.
+
+*Vector Screen
+
+#This option allows you to run a BLAST search of your nucleotide
+#sequence(s) against NCBI's 
+<A HREF="http://www.ncbi.nlm.nih.gov/VecScreen/UniVec.html">
+UniVec
+</A>
+database.  We highly recommend that you run this analysis and remove
+any vector contamination before submission.  The UniVec database
+contains only one copy of every unique sequence segment from a large
+number of vectors.   It also contains sequences for adapters, linkers
+and primers commonly used.  
+
+#To run Vector screen on a submission containing multiple sequences,
+scope to ALL SEQUENCES in the Target Sequence pull-down before running
+the analysis.  If there are many sequences, a status bar will appear
+indicating the progress of the search.  If no contamination is found, a
+pop-up box will appear to notify you.  If contamination is found, a
+miscellaneous feature will be annotated on the flatfile with the
+location of the contamination.  Details will include the relative
+strength of the BLAST hit.  You must trim the nucleotide sequence to
+remove this feature before submission.
+
+*ORF Finder
+
+#The ORF Finder shows a graphical representation of all the open reading
+frames (ORFs) in the nucleotide sequence.  This tool allows you to
+select ORFs and have them appear as coding sequence (CDS) features on
+the sequence record. 
+
+#The ORFs, indicated by colored boxes, are defined as the longest
+sequence containing a start codon and a stop codon.  If the
+entire nucleotide sequence is an open reading frame but does not
+contain an initial start or a terminal stop codon, it will be indicated
+as an ORF as well.  All six reading frames are shown; the top three
+boxes represent the plus strands, and the bottom three boxes the minus
+strands.  The nucleotide sequence intervals of the ORFs are displayed in
+descending length order on the right side of the window.  Intervals on
+the complementary (minus) strand are indicated by a 'c'.  ORFs can be
+selected by clicking either directly on them or on the sequence
+interval.  The ORF length button selects the length of ORFs that are
+displayed.  For example, the default of 10 shows all ORFs that are
+greater than 10 nucleotides in length.  Clicking on the box labelled ORF
+changes the display; potential start codons are indicated in white, and
+stop codons in red.  ORFs can be selected in this display also.  The
+definition of start and stop codons is dependent on the genetic code
+that was selected. Be sure to choose the appropriate genetic code for
+translating the sequence before opening the ORF finder. 
+
+*Select Target
+
+#This option changes the sequence that is selected in the Target
+Sequence pop-up.  Type the SeqID of the sequence in the box, and the
+record viewer will be updated to display that sequence.
+
+>Misc Menu
+
+*Style Manager
+
+#The Style manager allows you to choose between different formats in
+which to view the Graphical Display Format.  The graphical display is
+selected by choosing the Graphic display format on the record viewer. 
+Using the Style Manager, you can also copy the style or modify it to
+suit your needs.
+
+*Net Configure
+
+#As a default, Sequin is available as a stand-alone program.  However,
+the program can also be configured to exchange information with the NCBI
+(GenBank) over the Internet.  The network-aware mode of Sequin is
+identical to the stand-alone mode, but it contains some additional
+useful options.  
+
+#Sequin will only function in its network-aware mode if the computer on
+which it resides has a direct Internet connection.  Electronic mail
+access to the Internet is insufficient.  In general, if you can install
+and use a WWW browser on your system, you should be able to install and
+use network-aware Sequin.  Check with your system administrator or
+Internet provider if you are uncertain as to whether you have direct
+Internet connectivity.  
+
+#There are two ways to change Sequin into its network-aware mode.  If
+you are still on the initial Welcome to Sequin form, select Net
+Configure under the Misc menu.  If you have already worked on a Sequin
+submission and are looking at the record in the record viewer, select
+the Net Configure option from the Misc menu.
+
+#Most users will be able to use the default (Normal) settings on the
+Network Configuration page; select Accept to complete the configuration
+process.
+
+#If a "Normal" Connection does not work, you may need to select the
+Firewall Connection.  Contact your system administrator to determine
+what to enter into the Proxy and Port fields.  If you do not have
+access to the domain name server (DNS), uncheck this box.
+
+#The Timeout pop-up selects the length of time that your local copy of
+Sequin will wait for a reply from the NCBI server.  You may need to set
+this number higher (i.e., 60 seconds or 5 minutes) if you are outside
+of the United States or have a bad internet connection.
+
+#If you have problems setting up the network configuration, contact
+
+<a href="mailto:info@ncbi.nlm.nih.gov"> 
+info@ncbi.nlm.nih.gov.
+</a>
+
+#If you would like to change Sequin back to its stand-alone mode, select
+Net Configure again from the Misc menu.  Click on Connection: None.
+
+#The network-aware mode of Sequin allows you to perform a number of
+additional, important functions.  These functions all appear as
+additional menu items.  A brief description of these functions follows.
+Further descriptions are available as indicated elsewhere in the help
+documentation.
+
+**Updating Existing GenBank Records 
+
+#Using Sequin in its network-aware mode, you can download an existing
+GenBank record from Entrez using the GenBank accession number or GI
+identification number (NID). You can then use Sequin to make any
+necessary changes to the record, and resubmit it to GenBank as a
+sequence update.
+
+<A HREF="#WelcometoSequinForm">
+Instructions
+</A> 
+for submitting sequence updates are presented under the Welcome to
+Sequin Form. You can download any record from Entrez and look at it in
+Sequin. However, you can only formally update those records which you
+have submitted since submitters retain editorial control of their
+records.
+
+**Performing a PubMed Look-Up  
+
+#In its network-aware mode, Sequin can import the relevant sections of a
+PubMed record directly into a sequence submission record.  Rather than
+typing in the entire citation, you can enter minimal information, such
+as the PubMed Unique Identifier (PMID), or Journal name, volume, year,
+and pages.  The 
+
+<A HREF="#JournalPage">
+PubMed lookup
+</A> 
+is explained in the section of the documentation entitled Publications.
+
+**Performing a Taxonomy Look-up  
+#In its network-aware mode, Sequin can look
+up the taxonomic lineage of an organism from the NCBI's Taxonomy
+database.  This look-up is normally performed by the NCBI database staff
+after the record has been submitted to GenBank.  If you look up the
+taxonomy before submitting the sequence, you can make a note in the
+record of any disagreements.  The 
+<A HREF="#LineageSubpage">
+taxonomy lookup 
+</A> 
+is explained in the section of the documentation covering
+Biological Source: Organism page: Lineage subpage.
+
+**Accessing the NCBI DeskTop  
+#The NCBI DeskTop displays the internal
+structure of the record being viewed in Sequin.  The 
+<A HREF="#NCBIDeskTop">
+DeskTop
+</A> 
+is explained under the Misc menu.
+
+*NCBI DeskTop
+
+#This option is only available if you are running Sequin in its 
+<A HREF="#NetConfigure">
+network-aware
+</A> 
+mode.  
+
+#The NCBI DeskTop provides a view of the internal structure of the
+Sequin record, the ASN.1.  Its display resembles a Venn diagram and
+represents all the structures represented in the ASN.1 data model.
+
+#In addition, a number of undocumented software tools from the NCBI can
+be accessed from the DeskTop.  These tools are components of the NCBI
+portable software Toolkit.  You can also customize these functions using
+the Toolkit with your own software tools.  The Toolkit and its
+documentation are available from the NCBI by anonymous 
+<A HREF="ftp://ftp.ncbi.nih.gov/toolbox/README"> 
+FTP. 
+</A>
+
+#The DeskTop should only be used by very seasoned users.  At this time,
+we are not providing any documentation for these specialized functions.
+
+>Annotate Menu
+
+#This menu allows you to enter features and descriptors on the sequence.
+
+#The first six options, Genes and Named Regions, Coding Regions and
+Transcripts, Structural RNAs, Bibliographic and Comments, Sites and
+Bonds, and Remaining Features refer to types of Features that can be
+added to the sequence. Features are described in more detail in the
+above section entitled
+<A HREF="#Features">
+Features.
+</A>
+
+#If you are submitting a set of similar sequences, you can add the same
+feature across the entire span of each by using the Batch Feature Apply
+option.  The feature must span the entire nucleotide sequence of each
+member; you can not annotate specific nucleotide locations using this
+option (for this, see
+
+<A HREF="#FeaturePropagate">Feature Propagate</A>).
+
+For each feature, you will be prompted to designate whether the feature
+is 5' or 3' partial and whether is is on the plus or minus strand.  You
+may also add a comment or other qualifier to the feature.  The Add
+Qualifier option allows you to add a qualifier to an existing feature. 
+You must specify the feature and qualifier in the Add Qualifier pop-up
+box.  Source qualifiers can be added to all entries using the Add
+Source Qualifier option.  Qualifiers specific to the CDS and gene can
+be added using Add CDS-Gene-Prot-mRNA and RNA qualifiers using Add RNA
+Qual.  In each case, a pop-up box appears with qualifier options
+appropriate for that feature.
+
+#The Batch Feature Edit function allows you to edit existing qualifiers.
+ For each menu choice, a pop-up box allows you to select the feature
+containing the qualifier and the specific qualifier to be edited.  You
+can use the Find/Replace text boxes to edit the information contained
+within the qualifier.
+
+#The Publications option allows you to add a Publication Feature or
+Publication Descriptor to the record.  Publications are described in
+more detail in the above section entitled
+
+<A HREF="#Publications">
+Publications.
+</A>  
+
+#The Descriptors option allows you to add Descriptors to the
+record.  Descriptors are described in more detail in the section
+entitled
+<A HREF="#Descriptors">
+Descriptors,
+</A>
+above.
+
+#The Generate Definition Line option will generate a title for your
+sequence based on the information provided in the record.  This option
+will work for single sequences as well as sets of sequences, and can
+handle complex annotations with multiple features.  The title will
+follow GenBank conventions, but may be modified by the database staff
+if it is not appropriate.  The title you enter here will replace any
+title you entered elsewhere in the submission, for example, any title
+that was attached to the nucleotide sequence.  For a description of
+definition lines, see
+
+<A HREF="#NucleotideDefinitionLine(Title)">
+Nucleotide Definition Line (Title)
+</A>
+, above.
+
+>Options Menu
+
+*Font
+
+#Use this item to change the display font.  From the pop-up menus,
+choose the style and size of type.  For additional changes, mark the
+Bold, Italic, or Underline check boxes. The default font is 10-point
+Courier.
+
+>Sequence Editor
+
+#This editor allows you to modify the nucleotide or amino acid sequences
+and corresponding annotation in your entry.  Although the Sequence Editor
+does allow you to undo changes you make to the sequence, we strongly
+suggest that you save a copy of the entry before launching the Sequence
+Editor so that you can revert to it if necessary.
+
+*Starting the Sequence Editor
+
+#The sequence that appears in the editor is dependent on the sequence(s)
+selected in the Target Sequence pull-down list.  There are two ways to
+launch the sequence editor for nucleotide sequences.  First, you can 
+double click within sequence in any display format of the record viewer.
+A window containing the DNA sequence will appear.  Second, in the record
+viewer, select the sequence that you would like to edit in the Target
+Sequence pop-up menu.  Click on Edit Sequence under the Edit menu. You
+can launch the editor for protein sequences by selecting the protein
+sequence in the Target Sequence pop-up menu and double clicking within
+the protein sequence. A window containing the protein sequence will
+appear.
+
+*Moving around the Sequence Editor
+
+#The cursor can be moved with the mouse or the arrow keys.  The display
+window will change to show the position of the cursor.  The sequence
+location of the first residue on each line is indicated on the left side
+of the window.  The cursor location, or the range of sequences selected
+by the mouse, is shown in the upper left corner of the window.  If you
+want to move the cursor to a specific location, type the number in the
+box on the top left of the sequence editor window, and hit the Go to
+button.  If you want to look at a specific sequence, but not move the
+cursor to it, type the number in the upper right box of the window and
+hit the Look at button.
+
+*Editing Sequence and Existing Annotation
+
+#Select a piece of sequence by highlighting it with the mouse.  To
+select the entire sequence, click on a sequence location number on the
+left side of the window.  Any sequence that is highlighted in the
+Sequence Editor will show up as a box on the sequence when it is viewed
+in the Graphic Display Format.
+
+#One way to insert and delete residues is with the mouse.  Move the
+cursor to the appropriate location and type.  Text will be inserted to
+the left of the cursor.  Delete sequence with the backspace or delete
+key.  Text will be deleted to the left of the cursor.  To delete a block
+of sequence, highlight it with the mouse and use the delete or backspace
+key.
+
+#Another way to insert and delete residues is with options under the Edit
+menu of the Sequence Editor.  Use Cut to remove, or Copy to copy,
+highlighted residues.  Copied residues can then be pasted elsewhere
+within the sequence by using the Paste option.
+
+#Features annotated via the record viewer will be displayed in a
+graphical format within the sequence editor.  CDS features will be be
+displayed as a blue line across the appropriate nucleotide location.  All
+other features will be displayed as a black line. To the left of the
+line, the name of the feature is displayed.  In the case of CDS or mRNA
+features, the product name is shown.  For gene features, the gene locus
+is shown.
+
+#Double-clicking on the feature will launch the feature editor just as in
+the record viewer.  However, you can also change the nucleotide location
+of any feature within the graphical view.  To move the entire feature,
+select the feature and drag it to the appropriate location while holding
+down the mouse button.  To alter the 5' or 3' end of a feature,  click on
+the feature's end and drag to the new location while holding down the
+mouse button.
+
+#Before moving the nucleotide locations of a CDS feature, it may be
+useful to view the codons in the current translation.  You can do this by
+clicking on the feature line and releasing the mouse button.  A grid will
+be displayed that shows the triplet location for the current annotation. 
+Once you have changed the nucleotide location of a CDS feature in the
+graphical view, you can see the new translation by using the Translate
+CDS button at the bottom of the window.
+
+#To save changes you have made to the sequence, press the Accept button
+at the bottom of the Sequence Editor display window.  If you do not want
+to save the changes, press the Cancel button at the bottom of the
+Sequence Editor display window.  Selecting either Accept or Cancel will
+quit the Sequence Editor and return you to the record viewer.  Any
+changes you make will not become a permanent part of the Sequin record
+until you Save the record in the record viewer.  
+
+#New features can be added using the Features menu.
+
+*Sequence Editor Window Buttons
+
+**Go to
+
+#Moves the cursor to the indicated location.
+
+**Look at
+
+#Moves the window to the indicated location without moving the cursor.
+
+**Merge Feature Mode/Split Feature Mode
+
+#In merge mode, any new sequence that is entered into a region spanned
+by an existing feature becomes part of that feature.  For example, if
+you enter new sequence in the middle of a CDS, that sequence will be
+translated as part of the CDS.  In split mode, the new sequence
+interrupts the feature.  For example, if you enter new sequence in the
+middle of a CDS, the CDS will be interrupted by that sequence (see the
+location of the CDS in the record viewer).
+
+**Numbering
+
+#Allows the sequence location numbering to be hidden, displayed on the
+side, or displayed on the top of the sequence.
+
+**Grid
+
+#Allows the display to show a grid separating each feature and sequence
+for easier viewing.
+
+**Show/Hide Features
+
+#This box toggles between hiding and showing the features on a sequence.
+
+**Accept
+
+#Closes the Sequence Editor after saving all of the changes made to
+sequences and features.  
+
+**Cancel
+
+#Closes the Sequence Editor without saving any changes made to sequences or
+features.
+
+**Translate CDS
+
+#Allows translation of coding region features after the location has been
+changed within the graphical view.
+
+*Sequence Editor File Menu
+
+**Export
+
+#Allows the export of a range of sequence as a FASTA file or text file. 
+Using the text option will also export overlapping features if they are
+displayed.  If the features are first hidden, only the sequence will be
+exported.  All protein translations displayed at the time of export, will
+be exported as well. 
+
+**Accept
+
+#Closes the Sequence Editor after saving all of the changes made to
+sequence and features.
+
+**Cancel
+
+#Closes the Sequence Editor without saving any changes made to sequences
+of features.
+
+*Sequence Editor Edit Menu
+
+**Undo
+
+#Undoes all actions performed in the Sequence Editor since the last save.
+
+**Redo
+
+#Restores changes removed with Undo option
+
+**Cut
+
+#Removes the highlighted sequence.  This sequence can be pasted elsewhere.
+
+**Paste
+
+#Pastes a cut or copied sequence to the right of the cursor.
+
+**Copy
+
+#Copies the highlighted sequence.  This sequence can be pasted elsewhere.
+
+**Find
+
+#Allows you to find DNA or amino acid sequence patterns in your sequence.
+ The search is case insensitive.  To find an exact match to a DNA
+sequence pattern, type the pattern in the box. The number of items found
+will be displayed and you can toggle through each instance with the Find
+Next button.   To find the reverse complement of the pattern, click on
+the reverse complement box at the bottom of the pop-up box.
+
+#To find an exact match to an amino acid seqeunce pattern, type that
+sequence in the box, and click on "translate sequence".  Sequin will look
+for all occurrences of that pattern in all six open reading frames.  The
+DNA sequence encoding that protein sequence in any of the six reading
+frames will be hightlighted.
+
+**Translate CDS
+
+#Allows translation of coding region features after the location has been
+changed within the graphical view.
+
+**Complement
+
+#Shows the complement of the submitted strand underneath the original.
+
+**Reading Frames 
+
+#Shows the indicated phase translation of the selected coding sequence.
+You can select any or all of the six reading frames, all reading frames
+or all positive or negative frames.
+
+**Protein Mismatches
+
+#Indicates amino acid which does not match conceptual translation
+following a nucleotide sequence change.  The original amino acid sequence
+will be displayed until the Translate CDS function is used.  Differences
+will be indicated by a red box around the amino acid abbreviation.
+
+**On-the-fly Protein Translations
+
+#Creates a second amino acid sequence in the display which retranslates
+as the nucleotide sequence is changed to allow side-by-side comparison to
+the original amino acid sequence. 
+
+*Sequence Editor Features Menu
+
+#The menu contains a long list of all features that can be annotated on a
+sequence.  These features are the same as those that are accessible
+through the main Sequin Annotate menu.
+
+#You can annotate features either in the Annotate menu or in the Sequence
+Editor. If you annotate them in the Annotate menu, you must type in the
+nucleotide sequence location of the feature.  However, if you add
+features from the Sequence Editor, you can highlight the sequence that
+the feature covers, and the location of the sequence will be
+automatically entered in the feature location box.  Additional
+explanations of how to annotate features are provided in the section on
+<A HREF="#Features">
+Features.
+</A>
+
+>Working with Sets of Aligned Sequences
+
+#Sequin allows you to work with aligned sets of closely related
+nucleotide sequences that are part of a population, phylogenetic, or
+mutation study.  If the sequences are imported in a pre-aligned format,
+such as PHYLIP, Sequin uses this alignment.  If the sequences are
+imported individually in FASTA format, Sequin can generate its own
+alignment.
+
+#You can view the aligned sequences in the Sequence Alignment Editor. In
+the record viewer, select All Sequences in the Target Sequences menu,
+and select the Alignment Display Format.  
+
+#The Alignment Assistant is launched by selecting Alignment Assistant
+from the Edit menu in the record viewer. It can be used to apply
+features to the whole set of sequences using the alignment coordinates.
+Rather than calculating the nucleotide coordinates for every feature on
+every nucleotide sequence, you may select the feature's location using
+its alignment coordinates and apply it to every member of the set
+simultaneously.  Sequin will calculate the nucleotide locations as they
+apply to each member of the set.
+
+*Alignment Assistant Window Buttons
+
+**Go to
+
+#The Go to alignment position and Go to sequence position buttons both
+scroll the aligment assistant so that the requested position is
+visible. If the requested position is already visible, nothing will
+happen.  Unlike the Sequence editor window, the 'go to' button does not
+control the cursor position.
+
+**Numbering
+
+#Allows the sequence location numbering to be hidden, displayed on the
+side, or displayed on the top of the sequence.
+
+**Grid
+
+#Allows the display to show a grid separating each feature and sequence for easier viewing.
+
+**Features Toggle
+
+#It is possible to view annotated features in the aligment assistant. 
+The features are displayed as a bar underneath the coordinates for that
+feature. The identity of the feature is displayed in the left-hand
+column.  The default selection is to have the features Hidden.  You may
+display the features associated only with the Target Sequence or
+features annotated on All Sequences in the alignment.
+
+*Alignment Assistant File Menu
+
+**Export
+
+#Allows you to export the alignment to a file in three different
+formats.  The contiguous and interleaved options export the alignment
+accordingly in FASTA+GAP format.  The text representation option saves
+the alignment as it appears in the Alignment Assistant.  Note that with
+this option features are included if they are displayed at the time of
+export.
+
+**Close
+
+#Closes the Alignment Assistant window and saves any changes made.  
+
+*Alignment Assistant Edit Menu
+
+**Remove Sequences from Alignment
+
+#Allows you to remove selected sequence(s) from the alignment.  Select
+the sequence by clicking on it.  You can select multiple sequences by
+holding down the control key.  The sequence will then be highlighted in
+grey.  Note that this option will remove the sequence from the
+alignment, but it is still present in your submission.
+
+**Validate Alignment
+
+#Checks for problems with the alignment.  If errors are reported, please
+review and attempt to fix your alignment before submission.
+
+**Propagate Features
+
+#This function is the same as that available under the Edit Menu in the
+record viewer.  A full description is available
+
+<A HREF="#FeaturePropagate">
+above
+</A>
+.
+
+*Alignment Assistant View Menu 
+
+**Target
+
+#Allows you to select a sequence within the alignment as the target
+sequence.  This can also be done by double-clicking on the sequence
+within the alignment.  The SeqID of the target sequence will be
+displayed in red.  Features can be displayed on the target sequence
+only and it is the sequence used for comparison in the 
+
+<A HREF="#ShowSubstitutions">
+Show Substitutions
+</A>
+view.
+
+**Show Substitutions
+
+#Changes the alignment view so that identities are replaced with a "."
+and only substitutions are shown.  The substitutions and identities are
+relative to the selected target sequence.
+
+*Alignment Assistant Features Menu
+
+#Allows the annotation of features to a single sequence or all sequences
+within the alignment.  All features available in this menu are
+discussed through the main Sequin Annotate menu.
+
+#Select the feature location by clicking the start location on one of
+the sequences, keeping the mouse button depressed, drag the cursor to
+the end of the feature location.  The selected area will now be
+underlined and red and the alignment coordinates of this area will be
+displayed in the upper left of the Alignment Assistant window. 
+
+**Apply to Target Sequence
+
+#Allows you to choose a feature to be applied only to the target
+sequence.  The locations may be entered manually or can be determined
+based on highlighting the sequence as described above.
+
+**Apply to Alignnent
+
+#Allows you to add the selected feature to all sequences within your
+alignment based on the alignment coordinates you have selected.  Note
+that in the feature pop-up boxes in this menu, the Location will always
+be entered as the location relative to the alignment coordinates.
+
+<HR> 
+
+<CENTER>
+<P>&nbsp
+<P CLASS=medium1><B>Questions or Comments?</B>
+<BR>Write to the <A HREF="mailto:info@ncbi.nlm.nih.gov">NCBI Service
+Desk</A></P>
+<P CLASS=medium1>Revised December 2, 2005
+
+</CENTER>
+
+<!--  end of content  -->  
+
+</body>
+</html>
+
diff --git a/jpred/data/blast/sgmlbb.ent b/jpred/data/blast/sgmlbb.ent

new file mode 100755 (executable)

index 0000000..1db7e44
--- /dev/null
+++ b/jpred/data/blast/sgmlbb.ent
@@ -0,0 +1,55 @@
+52
+gt     >
+lt     <
+amp    &
+agr    alpha
+Agr    Alpha
+bgr    beta
+Bgr    Beta
+ggr    gamma
+Ggr    Gamma
+dgr    delta
+Dgr    Delta
+egr    epsilon
+Egr    Epsilon
+zgr    zeta
+Zgr    Zeta
+eegr   eta
+EEgr   Eta
+thgr   theta
+THgr   Theta
+igr    iota
+Igr    Iota
+kgr    kappa
+Kgr    Kappa
+lgr    lambda
+Lgr    Lambda
+mgr    mu
+Mgr    Mu
+ngr    nu
+Ngr    Nu
+xgr    xi
+Xgr    Xi
+ogr    omicron
+Ogr    Omicron
+pgr    pi
+Pgr    Pi
+rgr    rho
+Rgr    Rho
+sgr    sigma
+Sgr    Sigma
+sfgr   s
+tgr    tau
+Tgr    Tau
+ugr    upsilon
+Ugr    Upsilon
+phgr   phi
+PHgr   Phi
+khgr   chi
+KHgr   Chi
+psgr   psi
+PSgr   Psi
+ohgr   omega
+OHgr   Omega
+
+
diff --git a/jpred/data/blast/taxlist.txt b/jpred/data/blast/taxlist.txt

new file mode 100755 (executable)

index 0000000..e90fc91
--- /dev/null
+++ b/jpred/data/blast/taxlist.txt
@@ -0,0 +1,857 @@
+13
+Acanthamoeba healyi            1       4       INV     65661
+Acanthocybium solandri         1       2       VRT     13323
+Acanthopanax sessiliflorus             1       1       PLN     105886
+Acetabularia acetabulum                6       1       PLN     35845
+Acidithiobacillus ferrooxidans         11      0       BCT     920
+Acipenser baerii       Siberian sturgeon       1       2       VRT     27689
+Acrossocheilus paradoxus               1       2       VRT     76593
+Actinobacillus actinomycetemcomitans           11      0       BCT     714
+Actinobacillus pleuropneumoniae                11      0       BCT     715
+Acyrthosiphon pisum    pea aphid       1       5       INV     7029
+Aedes aegypti  yellow fever mosquito   1       5       INV     7159
+Aegilops speltoides            1       1       PLN     4573
+Aegilops tauschii              1       1       PLN     37682
+Aepyceros melampus     impala  1       2       MAM     9897
+Aequorea victoria              1       4       INV     6100
+Aeromonas hydrophila           11      0       BCT     644
+African swine fever virus              1       0       VRL     10497
+Agaricus bisporus              1       4       PLN     5341
+Agrobacterium tumefaciens              11      0       BCT     358
+Aids-associated retrovirus             1       0       VRL     11966
+Ajellomyces capsulatus         1       4       PLN     5037
+Alexandrium tamarense          1       4       PLN     2926
+Allium cepa    onion   1       1       PLN     4679
+Allium sativum garlic  1       1       PLN     4682
+Alstroemeria peruviana         1       1       PLN     245552
+Amblyomma americanum           1       5       INV     6943
+Amblyomma variegatum           1       5       INV     34610
+Amborella trichopoda           1       1       PLN     13333
+Ambystoma maculatum    spotted salamander      1       2       VRT     43114
+Ambystoma mexicanum    axolotl 1       2       VRT     8296
+Amphidinium carterae           1       4       PLN     2961
+Anaplasma marginale            11      0       BCT     770
+Anaplasma phagocytophilum              11      0       BCT     948
+Anas fulvigula         1       2       VRT     75846
+Anas platyrhynchos             1       2       VRT     8839
+Ancylostoma caninum    dog hookworm    1       5       INV     29170
+Ancylostoma ceylanicum         1       5       INV     53326
+Anguilla japonica      Japanese eel    1       2       VRT     7937
+Anolis sagrei  brown anole     1       2       VRT     38937
+Anopheles arabiensis           1       5       INV     7173
+Anopheles funestus             1       5       INV     62324
+Anopheles gambiae      African malaria mosquito        1       5       INV     7165
+Anopheles maculipennis         1       5       INV     41429
+Antheraea yamamai      Japanese oak silkmoth   1       5       INV     7121
+Antirrhinum majus      snapdragon      1       1       PLN     4151
+Aotus nancymaae        Ma's night monkey       1       2       PRI     37293
+Apis mellifera honey bee       1       5       INV     7460
+Apium graveolens               1       1       PLN     4045
+Aplysia californica    California sea hare     1       5       INV     6500
+Apodemus sylvaticus    European woodmouse      1       2       ROD     10129
+Arabidopsis lyrata             1       1       PLN     59689
+Arabidopsis suecica            1       1       PLN     45249
+Arabidopsis thaliana   thale cress     1       1       PLN     3702
+Arachis hypogaea       peanut  1       1       PLN     3818
+Araneus ventricosus            1       5       INV     182803
+Archaeoglobus fulgidus         11      0       BCT     2234
+Argopecten irradians           1       5       INV     31199
+Artemia franciscana            1       5       INV     6661
+Ascaris lumbricoides   common roundworm        1       5       INV     6252
+Ascaris suum   pig roundworm   1       5       INV     6253
+Ashbya gossypii                1       3       PLN     33169
+Asparagus officinalis  garden asparagus        1       1       PLN     4686
+Aspergillus flavus             1       4       PLN     5059
+Aspergillus fumigatus          1       4       PLN     5085
+Aspergillus nidulans           1       4       PLN     162425
+Aspergillus niger              1       4       PLN     5061
+Aspergillus oryzae             1       4       PLN     5062
+Aspergillus terreus            1       4       PLN     33178
+Aspergillus tubingensis                1       4       PLN     5068
+Ateles geoffroyi       black-handed spider monkey      1       2       PRI     9509
+Avena sativa   oat     1       1       PLN     4498
+Avian infectious bronchitis virus              1       0       VRL     11120
+Avicennia marina               1       1       PLN     82927
+Azotobacter vinelandii         11      0       BCT     354
+B19 virus              1       0       VRL     10798
+Bacillus anthracis             11      0       BCT     1392
+Bacillus atticus               1       5       INV     36825
+Bacillus cereus                11      0       BCT     1396
+Bacillus clausii               11      0       BCT     79880
+Bacillus grandii               1       5       INV     55088
+Bacillus licheniformis         11      0       BCT     1402
+Bacillus lynceorum             1       5       INV     73234
+Bacillus subtilis              11      0       BCT     1423
+Bacillus thuringiensis         11      0       BCT     1428
+Bacillus whitei                1       5       INV     57870
+Bacteroides fragilis           11      0       BCT     817
+Beauveria bassiana             1       4       PLN     176275
+Bemisia tabaci         1       5       INV     7038
+Beta vulgaris          1       1       PLN     161934
+Betula pendula European white birch    1       1       PLN     3505
+Bifidobacterium longum         11      0       BCT     216816
+Biomphalaria glabrata  bloodfluke planorb      1       5       INV     6526
+Biomphalaria pfeifferi         1       5       INV     112525
+Biphyllus lunatus              1       5       INV     197003
+Bluetongue virus               1       0       VRL     40051
+Blumeria graminis              1       4       PLN     34373
+Bombyx mandarina       wild silkworm   1       5       INV     7092
+Bombyx mori    domestic silkworm       1       5       INV     7091
+Boophilus microplus    southern cattle tick    1       5       INV     6941
+Bordetella bronchiseptica              11      0       BCT     518
+Bordetella pertussis           11      0       BCT     520
+Borrelia afzelii               11      0       BCT     29518
+Borrelia burgdorferi   Lyme disease spirochete 11      0       BCT     139
+Borrelia garinii               11      0       BCT     29519
+Bos indicus    zebu    1       2       MAM     9915
+Bos taurus     cow     1       2       MAM     9913
+Bothrops insularis     island jararaca 1       2       VRT     8723
+Botryllus schlosseri           1       13      INV     30301
+Botryotinia fuckeliana         1       4       PLN     40559
+Bovine respiratory syncytial virus             1       0       VRL     11246
+Bradyrhizobium japonicum               11      0       BCT     375
+Branchiostoma belcheri         1       5       INV     7741
+Branchiostoma floridae Florida lancelet        1       5       INV     7739
+Brassica campestris            1       1       PLN     3711
+Brassica juncea                1       1       PLN     3707
+Brassica napus rape    1       1       PLN     3708
+Brassica oleracea              1       1       PLN     3712
+Brassica rapa          1       1       PLN     3711
+Brucella melitensis            11      0       BCT     29459
+Brugia malayi          1       5       INV     6279
+Bruguiera gymnorrhiza          1       1       PLN     39984
+Bubalus bubalis        water buffalo   1       2       MAM     89462
+Buchnera aphidicola            11      0       BCT     9
+Burkholderia cepacia           11      0       BCT     292
+Burkholderia fungorum          11      0       BCT     134537
+Burkholderia pseudomallei              11      0       BCT     28450
+Caenorhabditis briggsae                1       5       INV     6238
+Caenorhabditis elegans         1       5       INV     6239
+Callithrix jacchus     white-tufted-ear marmoset       1       2       PRI     9483
+Callosobruchus maculatus       cowpea weevil   1       5       INV     64391
+Camelus dromedarius    Arabian camel   1       2       MAM     9838
+Campylobacter jejuni           11      0       BCT     197
+Candida albicans               12      4       PLN     5476
+Candida famata         1       3       PLN     4959
+Candida glabrata               1       3       PLN     5478
+Candida tropicalis             12      3       PLN     5482
+Candidula unifasciata          1       5       INV     100452
+Canis familiaris       dog     1       2       MAM     9615
+Capra hircus   goat    1       2       MAM     9925
+Caprine arthritis-encephalitis virus           1       0       VRL     11660
+Capsicum annuum                1       1       PLN     4072
+Capsicum chinense              1       1       PLN     80379
+Carabus granulatus             1       5       INV     118799
+Carassius auratus      goldfish        1       2       VRT     7957
+Carica papaya  papaya  1       1       PLN     3649
+Caulobacter crescentus         11      0       BCT     155892
+Caulobacter vibrioides         11      0       BCT     155892
+Cavia porcellus        domestic guinea pig     1       2       ROD     10141
+Ceratitis capitata     Mediterranean fruit fly 1       5       INV     7213
+Ceratodon purpureus            1       1       PLN     3225
+Ceratopteris richardii         1       1       PLN     49495
+Cercopithecus aethiops African green monkey    1       2       PRI     9534
+Cervus elaphus red deer        1       2       MAM     9860
+Chaetodipus intermedius        rock pocket mouse       1       2       ROD     38666
+Chaetomium globosum            1       4       PLN     38033
+Chlamydia trachomatis          11      0       BCT     813
+Chlamydomonas reinhardtii              1       1       PLN     3055
+Chlamydophila pneumoniae               11      0       BCT     83558
+Chlamydotis undulata           1       2       VRT     172680
+Chlorobium tepidum             11      0       BCT     1097
+Chloroflexus aurantiacus               11      0       BCT     1108
+Cicer arietinum        chickpea        1       1       PLN     3827
+Cicindela campestris           1       5       INV     150234
+Ciona intestinalis             1       13      INV     7719
+Ciona savignyi         1       13      INV     51511
+Citrullus lanatus      watermelon      1       1       PLN     3654
+Citrus reticulata              1       1       PLN     85571
+Citrus sinensis                1       1       PLN     2711
+Citrus tristeza virus          1       0       VRL     12162
+Citrus unshiu          1       1       PLN     55188
+Citrus x paradisi              1       1       PLN     37656
+Cladosporium fulvum            1       4       PLN     5499
+Cleome hassleriana             1       1       PLN     28532
+Clonorchis sinensis            1       9       INV     79923
+Clostridium acetobutylicum             11      0       BCT     1488
+Clostridium difficile          11      0       BCT     1496
+Clostridium perfringens                11      0       BCT     1502
+Clostridium thermocellum               11      0       BCT     1515
+Coccidioides immitis           1       4       PLN     5501
+Codonopsis lanceolata          1       1       PLN     103999
+Coffea arabica coffee  1       1       PLN     13443
+Colletotrichum gloeosporioides         1       4       PLN     5457
+Colletotrichum trifolii                1       4       PLN     5466
+Columba livia  domestic pigeon 1       2       VRT     8932
+Conidiobolus coronatus         1       4       PLN     34488
+Cooperia oncophora             1       5       INV     27828
+Coprinopsis cinerea            1       4       PLN     5346
+Coprinus cinereus              1       4       PLN     5346
+Cordyceps bassiana             1       4       PLN     176275
+Coregonus clupeaformis         1       2       VRT     59861
+Corynebacterium glutamicum             11      0       BCT     1718
+Corynebacterium pseudotuberculosis             11      0       BCT     1719
+Coturnix coturnix      common quail    1       2       VRT     9091
+Coturnix japonica      Japanese quail  1       2       VRT     93934
+Crassostrea gigas      Pacific oyster  1       5       INV     29159
+Crassostrea virginica  eastern oyster  1       5       INV     6565
+Cricetulus griseus     Chinese hamster 1       2       ROD     10029
+Crocus sativus         1       1       PLN     82528
+Cryphonectria parasitica               1       4       PLN     5116
+Cryptococcus bacillisporus             1       4       PLN     37769
+Cryptococcus neoformans                1       4       PLN     5207
+Cryptomeria japonica   Japanese cedar  1       1       PLN     3369
+Cryptosporidium parvum         1       4       INV     5807
+Ctenocephalides felis  cat flea        1       5       INV     7515
+Ctenopharyngodon idella        grass carp      1       2       VRT     7959
+Cucumber mosaic virus  cucumber mosaic cucumovirus     1       0       VRL     12305
+Cucumis melo   muskmelon       1       1       PLN     3656
+Cucumis sativus        cucumber        1       1       PLN     3659
+Culex pipiens  house mosquito  1       5       INV     7175
+Curculio glandium              1       5       INV     197013
+Cycas rumphii          1       1       PLN     58031
+Cynodon dactylon       Bermuda grass   1       1       PLN     28909
+Cyprinus carpio        common carp     1       2       VRT     7962
+Daktulosphaira vitifoliae      grape phylloxera        1       5       INV     58002
+Danio rerio    zebrafish       1       2       VRT     7955
+Dasypus novemcinctus   nine-banded armadillo   1       2       MAM     9361
+Daucus carota  carrot  1       1       PLN     4039
+Debaryomyces hansenii          1       3       PLN     4959
+Deinococcus radiodurans                11      0       BCT     1299
+Delacroixia coronata           1       4       PLN     34488
+Dendrocopos major              1       2       VRT     137523
+Dengue virus           1       0       VRL     12637
+Descurainia sophia             1       1       PLN     89411
+Desulfitobacterium hafniense           11      0       BCT     49338
+Desulfovibrio desulfuricans            11      0       BCT     876
+Diadema antillarum             1       9       INV     105358
+Dianthus caryophyllus  clove pink      1       1       PLN     3570
+Dicentrarchus labrax   European sea bass       1       2       VRT     13489
+Dictyostelium discoideum               1       1       INV     44689
+Dirofilaria immitis    dog heartworm nematode  1       5       INV     6287
+Dreissena polymorpha           1       5       INV     45954
+Drosophila americana           1       5       INV     40366
+Drosophila ananassae           1       5       INV     7217
+Drosophila buzzatii            1       5       INV     7264
+Drosophila mauritiana          1       5       INV     7226
+Drosophila melanogaster        fruit fly       1       5       INV     7227
+Drosophila miranda             1       5       INV     7229
+Drosophila persimilis          1       5       INV     7234
+Drosophila pseudoobscura               1       5       INV     7237
+Drosophila simulans            1       5       INV     7240
+Drosophila subobscura          1       5       INV     7241
+Drosophila virilis             1       5       INV     7244
+Drosophila yakuba              1       5       INV     7245
+Dugesia japonica               1       9       INV     6161
+Dunaliella salina              1       1       PLN     3046
+Echinococcus granulosus                1       9       INV     6210
+Echinococcus multilocularis            1       9       INV     6211
+Echinostoma paraensei          1       14      INV     48215
+Eimeria tenella                1       4       INV     5802
+Elephas maximus        Asiatic elephant        1       2       MAM     9783
+Emericella nidulans            1       4       PLN     162425
+Emiliania huxleyi              1       4       PLN     2903
+Entamoeba histolytica          1       1       INV     5759
+Entamoeba invadens             1       1       INV     33085
+Enterobacter cloacae           11      0       BCT     550
+Enterobacteria phage T7                11      0       PHG     10760
+Enterococcus faecalis          11      0       BCT     1351
+Enterococcus faecium           11      0       BCT     1352
+Epinephelus quernus    Hawaiian grouper        1       2       VRT     212795
+Equine arteritis virus         1       0       VRL     11047
+Equine infectious anemia virus         1       0       VRL     11665
+Equus caballus horse   1       2       MAM     9796
+Eremothecium gossypii          1       3       PLN     33169
+Erwinia amylovora              11      0       BCT     552
+Escherichia coli               11      0       BCT     562
+Eschscholzia californica       California poppy        1       1       PLN     3467
+Eucalyptus globulus            1       1       PLN     34317
+Eucalyptus grandis             1       1       PLN     71139
+Eucalyptus tereticornis                1       1       PLN     183855
+Euhadra peliomphala            1       5       INV     87841
+Eulemur fulvus brown lemur     1       2       PRI     13515
+Euphorbia esula        leafy spurge    1       1       PLN     3993
+Euphorbia lagascae             1       1       PLN     54672
+Feline immunodeficiency virus          1       0       VRL     11673
+Feline leukemia virus          1       0       VRL     11768
+Felis catus    cat     1       2       MAM     9685
+Ferroplasma acidarmanus                11      0       BCT     97393
+Filobasidiella bacillispora            1       4       PLN     37769
+Filobasidiella neoformans              1       4       PLN     5207
+Foot-and-mouth disease virus A         1       0       VRL     12111
+Foot-and-mouth disease virus O         1       0       VRL     12118
+Fragaria x ananassa            1       1       PLN     3747
+Fragilariopsis cylindrus               1       1       PLN     186039
+Francisella tularensis         11      0       BCT     263
+Fucus distichus                1       1       PLN     3012
+Fugu rubripes          1       2       VRT     31033
+Fundulus heteroclitus  killifish       1       2       VRT     8078
+Fusarium oxysporum             1       4       PLN     5507
+Fusarium sporotrichioides              1       4       PLN     5514
+Fusarium subglutinans          1       4       PLN     42677
+Fusobacterium nucleatum                11      0       BCT     851
+Gadus morhua   Atlantic cod    1       2       VRT     8049
+Gallus gallus  chicken 1       2       VRT     9031
+Gasterosteus aculeatus three spined stickleback        1       2       VRT     69293
+GB virus C/Hepatitis G virus   Hepatitis GB virus C / Hepatitis G virus        1       0       VRL     54290
+Geobacillus stearothermophilus         11      0       BCT     1422
+Geobacter metallireducens              11      0       BCT     28232
+Geochelone nigra               1       2       VRT     66189
+Giardia intestinalis           1       0       INV     5741
+Giardia lamblia                1       0       INV     5741
+Gibberella moniliformis                1       4       PLN     117187
+Gibberella zeae                1       4       PLN     5518
+Gillichthys mirabilis  long-jawed mudsucker    1       2       VRT     8222
+Ginglymostoma cirratum nurse shark     1       2       VRT     7801
+Ginkgo biloba  maidenhair tree 1       1       PLN     3311
+Globodera pallida              1       5       INV     36090
+Globodera rostochiensis                1       5       INV     31243
+Glomerella cingulata           1       4       PLN     5457
+Glomus intraradices            1       4       PLN     4876
+Glomus versiforme              1       4       PLN     43425
+Glossina morsitans             1       5       INV     7394
+Glycine clandestina            1       1       PLN     45687
+Glycine max    soybean 1       1       PLN     3847
+Glycine tomentella             1       1       PLN     44015
+Glyphorynchus spirurus wedge-billed woodcreeper        1       2       VRT     135974
+Gnetum gnemon          1       1       PLN     3382
+Gorilla gorilla        gorilla 1       2       PRI     9593
+Gossypium arboreum             1       1       PLN     29729
+Gossypium barbadense   sea-island cotton       1       1       PLN     3634
+Gossypium herbaceum            1       1       PLN     34274
+Gossypium hirsutum     upland cotton   1       1       PLN     3635
+Gossypium raimondii            1       1       PLN     29730
+Gracilaria gracilis            1       4       PLN     2777
+Gregarina niphandrodes         1       4       INV     110365
+Griffithsia japonica           1       1       PLN     83288
+Guillardia theta               1       1       PLN     55529
+Haematobia irritans    horn fly        1       5       INV     7368
+Haemonchus contortus           1       5       INV     6289
+Haemophilus influenzae         11      0       BCT     727
+Haloarcula marismortui         11      0       BCT     2238
+Halobacterium sp. NRC-1                11      0       BCT     64091
+Halobaculum gomorrense         11      0       BCT     43928
+Halocynthia roretzi            1       13      INV     7729
+Halorubrum lacusprofundi               11      0       BCT     2247
+Hebeloma cylindrosporum                1       4       PLN     76867
+Hedyotis centranthoides                1       1       PLN     219666
+Hedyotis terminalis            1       1       PLN     219667
+Helianthus annuus      common sunflower        1       1       PLN     4232
+Helianthus argophyllus         1       1       PLN     73275
+Helianthus paradoxus           1       1       PLN     73304
+Helicobacter pylori            11      0       BCT     210
+Heliconius melpomene           1       5       INV     34740
+Helicoverpa armigera   cotton bollworm 1       5       INV     29058
+Heliocidaris erythrogramma             1       9       INV     7634
+Hemicentrotus pulcherrimus             1       9       INV     7650
+Hepatitis A virus              1       0       VRL     12092
+Hepatitis B virus              1       0       VRL     10407
+Hepatitis C virus              1       0       VRL     11103
+Hepatitis D virus              1       0       VRL     12475
+Hepatitis E virus              1       0       VRL     12461
+Heterobasidion annosum         1       4       PLN     13563
+Heterodera glycines            1       5       INV     51029
+Heterodera schachtii           1       5       INV     97005
+Hevea brasiliensis     Para rubber tree        1       1       PLN     3981
+Hippoglossus hippoglossus      Atlantic halibut        1       2       VRT     8267
+Histophilus somni              11      0       BCT     731
+Holothuria nobilis             1       9       INV     221420
+Homalodisca coagulata  glassy-winged sharpshooter      1       5       INV     197043
+Homo sapiens   human   1       2       PRI     9606
+Hordeum vulgare                1       1       PLN     4513
+Human adenovirus B             1       0       VRL     108098
+Human adenovirus C             1       0       VRL     129951
+Human astrovirus               1       0       VRL     12702
+Human endogenous retrovirus            1       0       VRL     11827
+Human enterovirus A            1       0       VRL     138948
+Human enterovirus B            1       0       VRL     138949
+Human enterovirus C            1       0       VRL     138950
+Human herpesvirus 1            1       0       VRL     10298
+Human herpesvirus 3            1       0       VRL     10335
+Human herpesvirus 4    Epstein-Barr virus      1       0       VRL     10376
+Human herpesvirus 5            1       0       VRL     10359
+Human herpesvirus 8    Kaposi's sarcoma-associated herpesvirus - Human herpesvirus 8   1       0       VRL     37296
+Human immunodeficiency virus           1       0       VRL     12721
+Human immunodeficiency virus 1         1       0       VRL     11676
+Human immunodeficiency virus 2         1       0       VRL     11709
+Human papillomavirus           1       0       VRL     10566
+Human papillomavirus type 16           1       0       VRL     10581
+Human respiratory syncytial virus              1       0       VRL     11250
+Hydra magnipapillata           1       4       INV     6085
+Hylobates lar  common gibbon   1       2       PRI     9580
+Hypocrea jecorina              1       4       PLN     51453
+Hypocrea lixii         1       4       PLN     5544
+Hypsibius dujardini            1       5       INV     232323
+Ichthyophthirius multifiliis           6       4       INV     5932
+Ictalurus furcatus             1       2       VRT     66913
+Ictalurus punctatus    channel catfish 1       2       VRT     7998
+Infectious bursal disease virus        Gumboro virus   1       0       VRL     10995
+Infectious salmon anemia virus         1       0       VRL     55987
+Ipomoea batatas        sweet potato    1       1       PLN     4120
+Ipomoea nil    Japanese morning glory  1       1       PLN     35883
+Ipomoea trifida                1       1       PLN     35884
+Ips pini       North American pine engraver    1       5       INV     102803
+Iris hollandica                1       1       PLN     35876
+Isotricha sp. BBF-2003         1       4       INV     223153
+Ixodes scapularis      black-legged tick       1       5       INV     6945
+Japanese encephalitis virus            1       0       VRL     11072
+JC virus               1       0       VRL     10632
+Juglans regia  English walnut  1       1       PLN     51240
+Kandelia candel                1       1       PLN     61147
+Klebsiella oxytoca             11      0       BCT     571
+Klebsiella pneumoniae          11      0       BCT     573
+Kluyveromyces delphensis               1       3       PLN     51657
+Kluyveromyces lactis           1       3       PLN     28985
+Kluyveromyces marxianus                1       3       PLN     4911
+Kluyveromyces thermotolerans           1       3       PLN     4916
+Laccaria bicolor               1       4       PLN     29883
+Lactobacillus brevis           11      0       BCT     1580
+Lactobacillus delbrueckii              11      0       BCT     1584
+Lactobacillus plantarum                11      0       BCT     1590
+Lactococcus lactis             11      0       BCT     1358
+Lactuca sativa         1       1       PLN     4236
+Lactuca serriola               1       1       PLN     75943
+Lama glama     llama   1       2       MAM     9844
+Laminaria digitata             1       1       PLN     80365
+Lawsonia intracellularis               11      0       BCT     29546
+Legionella pneumophila         11      0       BCT     446
+Leifsonia xyli         11      0       BCT     1575
+Leishmania braziliensis                1       4       INV     5660
+Leishmania donovani            1       4       INV     5661
+Leishmania infantum            1       4       INV     5671
+Leishmania major               1       4       INV     5664
+Lemur catta    ring-tailed lemur       1       2       PRI     9447
+Leopardus pardalis     ocelot  1       2       MAM     32538
+Lepilemur septentrionalis      northern sportive lemur 1       2       PRI     78584
+Leptospira interrogans         11      0       BCT     173
+Leuconostoc mesenteroides              11      0       BCT     1245
+Leymus chinensis               1       1       PLN     52714
+Limnanthes alba        white meadowfoam        1       1       PLN     42439
+Lingulodinium polyedrum                1       4       PLN     160621
+Linum usitatissimum    flax    1       1       PLN     4006
+Listeria innocua               11      0       BCT     1642
+Listeria monocytogenes         11      0       BCT     1639
+Litomosoides sigmodontis               1       5       INV     42156
+Litopenaeus setiferus  white shrimp    1       5       INV     64468
+Litopenaeus vannamei   Pacific white shrimp    1       5       INV     6689
+Littorina littorea             1       5       INV     31216
+Lotus corniculatus             1       1       PLN     47247
+Loxodonta africana     African savanna elephant        1       2       MAM     9785
+Lumbricus rubellus     humus earthworm 1       5       INV     35632
+Lupinus albus  white lupine    1       1       PLN     3870
+Lupinus luteus yellow lupine   1       1       PLN     3873
+Luscinia svecica               1       2       VRT     52792
+Lutzomyia longipalpis          1       5       INV     7200
+Lycopersicon esculentum        tomato  1       1       PLN     4081
+Lycopersicon hirsutum          1       1       PLN     62890
+Lycopersicon pennellii         1       1       PLN     28526
+Macaca fascicularis    crab-eating macaque     1       2       PRI     9541
+Macaca fuscata Japanese macaque        1       2       PRI     9542
+Macaca mulatta rhesus monkey   1       2       PRI     9544
+Macaca nemestrina      pig-tailed macaque      1       2       PRI     9545
+Macropus eugenii       tammar wallaby  1       2       MAM     9315
+Magnaporthe grisea             1       4       PLN     148305
+Magnetococcus sp. MC-1         11      0       BCT     156889
+Magnetospirillum magnetotacticum               11      0       BCT     188
+Malus x domestica      apple tree      1       1       PLN     3750
+Manduca sexta  tobacco hornworm        1       5       INV     7130
+Manihot esculenta      cassava 1       1       PLN     3983
+Marchantia polymorpha  liverwort       1       1       PLN     3197
+Marmota monax  woodchuck       1       2       ROD     9995
+Marsupenaeus japonicus         1       5       INV     27405
+Martes americana       American marten 1       2       MAM     9660
+Mastigamoeba balamuthi         1       1       INV     108607
+Measles virus          1       0       VRL     11234
+Medicago sativa                1       1       PLN     3879
+Medicago truncatula    barrel medic    1       1       PLN     3880
+Meladema coriacea              1       5       INV     107907
+Melaleuca alternifolia tea tree        1       1       PLN     164405
+Meleagris gallopavo    turkey  1       2       VRT     9103
+Meloidogyne arenaria           1       5       INV     6304
+Meloidogyne chitwoodi          1       5       INV     59747
+Meloidogyne hapla              1       5       INV     6305
+Meloidogyne incognita  southern root-knot nematode     1       5       INV     6306
+Meloidogyne javanica   root-knot nematode      1       5       INV     6303
+Meloidogyne paranaensis                1       5       INV     189293
+Mentha x piperita      peppermint      1       1       PLN     34256
+Meriones unguiculatus  Mongolian gerbil        1       2       ROD     10047
+Mesembryanthemum crystallinum  common iceplant 1       1       PLN     3544
+Mesobuthus gibbosus            1       5       INV     123226
+Mesocricetus auratus   golden hamster  1       2       ROD     10036
+Metarhizium anisopliae         1       4       PLN     5530
+Methanosarcina acetivorans             11      0       BCT     2214
+Methanosarcina barkeri         11      0       BCT     2208
+Methanosarcina mazei           11      0       BCT     2209
+Methanothermobacter thermautotrophicus         11      0       BCT     145262
+Microbotryum violaceum         1       4       PLN     5272
+Microbulbifer degradans                11      0       BCT     86304
+Microcystis aeruginosa         11      0       BCT     1126
+Micromonospora carbonacea              11      0       BCT     47853
+Microtus oeconomus     tundra vole     1       2       ROD     64717
+Mnemiopsis leidyi              1       4       INV     27923
+Molgula tectiformis            1       13      INV     30286
+Moneuplotes crassus            10      4       INV     5936
+Monodelphis domestica  gray short-tailed opossum       1       2       MAM     13616
+Moraxella catarrhalis          11      0       BCT     480
+Morone saxatilis       striped sea-bass        1       2       VRT     34816
+Motacilla flava                1       2       VRT     180448
+Mumps virus            1       0       VRL     11161
+Murine leukemia virus          1       0       VRL     11786
+Mus musculus   house mouse     1       2       ROD     10090
+Mus spretus    western wild mouse      1       2       ROD     10096
+Musa acuminata         1       1       PLN     4641
+Musca domestica        house fly       1       5       INV     7370
+Mycobacterium avium            11      0       BCT     1764
+Mycobacterium bovis            11      0       BCT     1765
+Mycobacterium leprae           11      0       BCT     1769
+Mycobacterium smegmatis                11      0       BCT     1772
+Mycobacterium tuberculosis             11      0       BCT     1773
+Mycoplasma capricolum          4       0       BCT     2095
+Mycoplasma genitalium          4       0       BCT     2097
+Mycoplasma haemofelis          4       0       BCT     29501
+Mycoplasma hominis             4       0       BCT     2098
+Mycosphaerella graminicola             1       4       PLN     54734
+Mystacina tuberculata  New Zealand lesser short-tailed bat     1       2       MAM     94961
+Mytilus edulis         1       5       INV     6550
+Mytilus galloprovincialis      Mediterranean mussel    1       5       INV     29158
+Mytilus trossulus      common blue mussel      1       5       INV     6551
+Myxococcus xanthus             11      0       BCT     34
+Natrialba asiatica             11      0       BCT     64602
+Necator americanus             1       5       INV     51031
+Nectria haematococca           1       4       PLN     140110
+Neisseria gonorrhoeae          11      0       BCT     485
+Neisseria meningitidis         11      0       BCT     487
+Neospora caninum               1       4       INV     29176
+Neospora hughesi               1       4       INV     83675
+Neurospora crassa              1       4       PLN     5141
+Newcastle disease virus                1       0       VRL     11176
+Nicotiana attenuata            1       1       PLN     49451
+Nicotiana benthamiana          1       1       PLN     4100
+Nicotiana sylvestris   wood tobacco    1       1       PLN     4096
+Nicotiana tabacum      common tobacco  1       1       PLN     4097
+Nippostrongylus brasiliensis           1       5       INV     27835
+Norwalk virus          1       0       VRL     11983
+Nostoc punctiforme             11      0       BCT     63737
+Novosphingobium aromaticivorans                11      0       BCT     48935
+Nuphar advena          1       1       PLN     77108
+Ochrobactrum anthropi          11      0       BCT     529
+Ocinebrellus inornatus Asian drill     1       5       INV     213425
+Oenococcus oeni                11      0       BCT     1247
+Oikopleura dioica              1       5       INV     34765
+Olea europaea  common olive    1       1       PLN     4146
+Onchocerca volvulus            1       5       INV     6282
+Oncorhynchus keta      chum salmon     1       2       VRT     8018
+Oncorhynchus mykiss    rainbow trout   1       2       VRT     8022
+Oncorhynchus nerka     sockeye salmon  1       2       VRT     8023
+Oncorhynchus tshawytscha       Chinook salmon  1       2       VRT     74940
+Opsanus beta           1       2       VRT     95145
+Oreochromis niloticus  Nile tilapia    1       2       VRT     8128
+Ornithodoros porcinus          1       5       INV     34594
+Ornithorhynchus anatinus       platypus        1       2       MAM     9258
+Oryctolagus cuniculus  rabbit  1       2       MAM     9986
+Oryza minuta           1       1       PLN     63629
+Oryza sativa           1       1       PLN     4530
+Oryzias latipes        Japanese medaka 1       2       VRT     8090
+Ostertagia ostertagi           1       5       INV     6317
+Ostreococcus tauri             1       1       PLN     70448
+Otis tarda             1       2       VRT     73107
+Ovis aries     sheep   1       2       MAM     9940
+Oxytricha trifallax            6       4       INV     94289
+Pacifastacus leniusculus       signal crayfish 1       5       INV     6720
+Pan paniscus   pygmy chimpanzee        1       2       PRI     9597
+Pan troglodytes        chimpanzee      1       2       PRI     9598
+Panax ginseng          1       1       PLN     4054
+Pantoea agglomerans            11      0       BCT     549
+Papio anubis   olive baboon    1       2       PRI     9555
+Papio hamadryas        hamadryas baboon        1       2       PRI     9557
+Paracoccidioides brasiliensis          1       4       PLN     121759
+Paralichthys olivaceus bastard halibut 1       2       VRT     8255
+Paramecium tetraurelia         6       4       INV     5888
+Parastrongyloides trichosuri           1       5       INV     131310
+Parus major            1       2       VRT     9157
+Pasteurella multocida          11      0       BCT     747
+Pasteuria penetrans            11      0       BCT     86005
+Paxillus involutus             1       4       PLN     71150
+Pectobacterium atrosepticum            11      0       BCT     29471
+Pectobacterium carotovorum             11      0       BCT     554
+Pediculus humanus      human lice      1       5       INV     121225
+Penaeus monodon        black tiger shrimp      1       5       INV     6687
+Penicillium marneffei          1       4       PLN     37727
+Pennisetum ciliare     buffelgrass     1       1       PLN     35520
+Pennisetum glaucum             1       1       PLN     4543
+Peromyscus leucopus    white-footed mouse      1       2       ROD     10041
+Peromyscus maniculatus deer mouse      1       2       ROD     10042
+Pestivirus type 1              1       0       VRL     11099
+Pestivirus type 2              1       0       VRL     54314
+Petromyzon marinus     sea lamprey     1       2       VRT     7757
+Petunia x hybrida              1       1       PLN     4102
+Phaeodactylum tricornutum              1       1       PLN     2850
+Phanerochaete chrysosporium            1       4       PLN     5306
+Phaseolus coccineus            1       1       PLN     3886
+Phaseolus vulgaris             1       1       PLN     3885
+Phoca vitulina harbor seal     1       2       MAM     9720
+Photorhabdus luminescens               11      0       BCT     29488
+Physcomitrella patens          1       1       PLN     3218
+Phytophthora infestans potato late blight agent        1       1       PLN     4787
+Phytophthora nicotianae                1       1       PLN     4790
+Phytophthora sojae             1       1       PLN     67593
+Picea abies    Norway spruce   1       1       PLN     3329
+Pichia angusta         1       3       PLN     4905
+Pichia farinosa                1       3       PLN     4920
+Pinus pinaster         1       1       PLN     71647
+Pinus radiata  Monterey pine   1       1       PLN     3347
+Pinus taeda    loblolly pine   1       1       PLN     3352
+Pisolithus microcarpus         1       4       PLN     178872
+Pisolithus tinctorius          1       4       PLN     37468
+Pisum sativum  pea     1       1       PLN     3888
+Planococcus lilacinus  lilac mealybug  1       5       INV     40930
+Plasmodium berghei             1       4       INV     5821
+Plasmodium chabaudi            1       4       INV     5825
+Plasmodium falciparum  malaria parasite P. falciparum  1       4       INV     5833
+Plasmodium vivax       malaria parasite P. vivax       1       4       INV     5855
+Plasmodium yoelii              1       4       INV     5861
+Platichthys flesus     European flounder       1       2       VRT     8260
+Platystomus albinus            1       5       INV     197009
+Plethodon elongatus    Del Norte salamander    1       2       VRT     46761
+Pleuronectes platessa  plaice  1       2       VRT     8262
+Pleurotus ostreatus    oyster mushroom 1       4       PLN     5322
+Plumbago zeylanica             1       1       PLN     76149
+Pneumocystis carinii           1       4       PLN     4754
+Podarcis hispanica             1       2       VRT     74081
+Poecilia reticulata    guppy   1       2       VRT     8081
+Poliovirus             1       0       VRL     138953
+Polyandrocarpa misakiensis             1       13      INV     7723
+Poncirus trifoliata            1       1       PLN     37690
+Pongo pygmaeus orangutan       1       2       PRI     9600
+Populus alba x Populus glandulosa              1       1       PLN     153471
+Populus alba x Populus tremula         1       1       PLN     80863
+Populus balsamifera            1       1       PLN     73824
+Populus balsamifera subsp. trichocarpa x Populus deltoides             1       1       PLN     3695
+Populus tremula                1       1       PLN     113636
+Populus tremula x Populus tremuloides          1       1       PLN     47664
+Populus tremuloides    quaking aspen   1       1       PLN     3693
+Porcine reproductive and respiratory syndrome virus            1       0       VRL     28344
+Porphyra yezoensis             1       4       PLN     2788
+Porphyromonas gingivalis               11      0       BCT     837
+Potato virus Y         1       0       VRL     12216
+Pratylenchus penetrans         1       5       INV     45929
+Primate T-lymphotropic virus 1         1       0       VRL     194440
+Primate T-lymphotropic virus 2         1       0       VRL     194441
+Pristionchus pacificus         1       5       INV     54126
+Prunus armeniaca       apricot 1       1       PLN     36596
+Prunus dulcis  almond  1       1       PLN     3755
+Prunus persica peach   1       1       PLN     3760
+Pseudomonas aeruginosa         11      0       BCT     287
+Pseudomonas fluorescens                11      0       BCT     294
+Pseudomonas putida             11      0       BCT     303
+Pseudomonas stutzeri           11      0       BCT     316
+Pseudomonas syringae           11      0       BCT     317
+Pseudopleuronectes americanus  winter flounder 1       2       VRT     8265
+Pseudotsuga menziesii  Douglas fir     1       1       PLN     3357
+Psoroptes equi var. ovis       sheep scab mite 1       5       INV     83912
+Psoroptes ovis sheep scab mite 1       5       INV     83912
+Pygoscelis adeliae     Adelie penguin  1       2       VRT     9238
+Pyricularia grisea             1       4       PLN     148305
+Pyrobaculum aerophilum         11      0       BCT     13773
+Pyrococcus furiosus            11      0       BCT     2261
+Pyrocoelia rufa                1       5       INV     71223
+Pyrocystis lunula              1       4       PLN     2972
+Pyrus communis pear    1       1       PLN     23211
+Rabies virus           1       0       VRL     11292
+Ralstonia metallidurans                11      0       BCT     119219
+Ralstonia solanacearum         11      0       BCT     305
+Rana catesbeiana       bullfrog        1       2       VRT     8400
+Rangifer tarandus      reindeer        1       2       MAM     9870
+Raphanus sativus       radish  1       1       PLN     3726
+Rattus norvegicus      Norway rat      1       2       ROD     10116
+Rattus rattus  black rat       1       2       ROD     10117
+Respiratory syncytial virus            1       0       VRL     12814
+Rhagoletis pomonella   apple maggot    1       5       INV     28610
+Rhinolophus ferrumequinum      greater horseshoe bat   1       2       MAM     59479
+Rhizobium etli         11      0       BCT     29449
+Rhizobium leguminosarum                11      0       BCT     384
+Rhizobium meliloti             11      0       BCT     382
+Rhizobium radiobacter          11      0       BCT     358
+Rhizobium sp. NGR234           11      0       BCT     394
+Rhizoctonia solani             1       4       PLN     107832
+Rhodobacter sphaeroides                11      0       BCT     1063
+Rhodococcus erythropolis               11      0       BCT     1833
+Rhodospirillum rubrum          11      0       BCT     1085
+Rhopalosiphum padi     bird cherry-oat aphid   1       5       INV     40932
+Ricinus communis       castor bean     1       1       PLN     3988
+Rickettsia prowazekii          11      0       BCT     782
+Robinia pseudoacacia           1       1       PLN     35938
+Rosa chinensis         1       1       PLN     74649
+Rosa hybrid cultivar           1       1       PLN     128735
+Rotavirus A            1       0       VRL     28875
+Rous sarcoma virus             1       0       VRL     11886
+Rubella virus          1       0       VRL     11041
+Ruminococcus flavefaciens              11      0       BCT     1265
+Saccharomyces bayanus          1       3       PLN     4931
+Saccharomyces cariocanus               1       3       PLN     114526
+Saccharomyces castellii                1       3       PLN     27288
+Saccharomyces cerevisiae       baker's yeast   1       3       PLN     4932
+Saccharomyces exiguus          1       3       PLN     34358
+Saccharomyces kluyveri         1       3       PLN     4934
+Saccharomyces kudriavzevii             1       3       PLN     114524
+Saccharomyces mikatae          1       3       PLN     114525
+Saccharomyces paradoxus                1       3       PLN     27291
+Saccharomyces servazzii                1       3       PLN     27293
+Saccharomyces unisporus                1       3       PLN     27294
+Saccharum officinarum          1       1       PLN     4547
+Saguinus oedipus       cotton-top tamarin      1       2       PRI     9490
+Saimiri sciureus       common squirrel monkey  1       2       PRI     9521
+Salix viminalis        osier   1       1       PLN     40686
+Salmo salar    Atlantic salmon 1       2       VRT     8030
+Salmo trutta   brown trout     1       2       VRT     8032
+Salmonella enterica            11      0       BCT     28901
+Salmonella typhimurium         11      0       BCT     602
+Salvelinus alpinus     Arctic char     1       2       VRT     8036
+Sarcocystis neurona            1       4       INV     42890
+Sarcoptes scabiei              1       5       INV     52283
+Scherffelia dubia              1       1       PLN     3190
+Schistosoma japonicum          1       9       INV     6182
+Schistosoma mansoni            1       9       INV     6183
+Schizophyllum commune          1       4       PLN     5334
+Schizosaccharomyces pombe      fission yeast   1       4       PLN     4896
+Schmidtea mediterranea         1       9       INV     79327
+Sciaenops ocellatus            1       2       VRT     76340
+Sclerotinia sclerotiorum               1       4       PLN     5180
+Sebastes mystinus              1       2       VRT     72088
+Secale cereale rye     1       1       PLN     4550
+Selaginella lepidophylla               1       1       PLN     59777
+SEN virus              1       0       VRL     136966
+Seriola quinqueradiata five-ray yellowtail     1       2       VRT     8161
+Serratia marcescens            11      0       BCT     615
+Sesamum indicum        sesame  1       1       PLN     4182
+Sesbania rostrata              1       1       PLN     3895
+Shewanella oneidensis          11      0       BCT     70863
+Shigella flexneri              11      0       BCT     623
+Shrimp white spot syndrome virus               1       0       VRL     92652
+Silene latifolia               1       1       PLN     37657
+Silurana tropicalis    western clawed frog     1       2       VRT     8364
+Simian immunodeficiency virus          1       0       VRL     11723
+Simian virus 40                1       0       VRL     10633
+Simian-Human immunodeficiency virus            1       0       VRL     57667
+Sindbis virus          1       0       VRL     11034
+Sinorhizobium meliloti         11      0       BCT     382
+Solanum tuberosum      potato  1       1       PLN     4113
+Sorghum bicolor        sorghum 1       1       PLN     4558
+Sorghum halepense              1       1       PLN     4560
+Sorghum propinquum             1       1       PLN     132711
+Sparus aurata  gilthead seabream       1       2       VRT     8175
+Sphingomonas aromaticivorans           11      0       BCT     48935
+Spinacia oleracea      spinach 1       1       PLN     3562
+Spiroplasma kunkelii           4       0       BCT     47834
+Sporotrichum pruinosum         1       4       PLN     5306
+Staphylococcus aureus          11      0       BCT     1280
+Staphylococcus epidermidis             11      0       BCT     1282
+Stealth virus 1                1       0       VRL     36452
+Sterkiella histriomuscorum             6       4       INV     94289
+Stevia rebaudiana              1       1       PLN     55670
+Streptococcus agalactiae               11      0       BCT     1311
+Streptococcus dysgalactiae             11      0       BCT     1334
+Streptococcus equi             11      0       BCT     1336
+Streptococcus mitis            11      0       BCT     28037
+Streptococcus mutans           11      0       BCT     1309
+Streptococcus oralis           11      0       BCT     1303
+Streptococcus pneumoniae               11      0       BCT     1313
+Streptococcus pyogenes         11      0       BCT     1314
+Streptococcus suis             11      0       BCT     1307
+Streptococcus thermophilus             11      0       BCT     1308
+Streptomyces coelicolor                11      0       BCT     1902
+Streptomyces lividans          11      0       BCT     1916
+Strongylocentrotus purpuratus          1       9       INV     7668
+Strongyloides ratti            1       5       INV     34506
+Strongyloides stercoralis              1       5       INV     6248
+Struthio camelus       ostrich 1       2       VRT     8801
+Suaeda maritima                1       1       PLN     126913
+Suid herpesvirus 1             1       0       VRL     10345
+Sulfolobus solfataricus                11      0       BCT     2287
+Sus scrofa     pig     1       2       MAM     9823
+Symsagittifera roscofensis             1       5       INV     84072
+Syncerus caffer        African buffalo 1       2       MAM     9970
+Tadarida brasiliensis  Brazilian free-tailed bat       1       2       MAM     9438
+Taenia solium  pork tapeworm   1       9       INV     6204
+Takifugu rubripes              1       2       VRT     31033
+Tamarix androssowii            1       1       PLN     189785
+Tamias amoenus yellow-pine chipmunk    1       2       ROD     64679
+Tamias ruficaudus      red-tailed chipmunk     1       2       ROD     123792
+Teladorsagia circumcincta              1       5       INV     45464
+Telestes souffia               1       2       VRT     129883
+Tetrahymena thermophila                6       4       INV     5911
+Tetraodon nigroviridis         1       2       VRT     99883
+Thanatephorus cucumeris                1       4       PLN     107832
+Theileria parva                1       4       INV     5875
+Thellungiella halophila                1       1       PLN     98038
+Theobroma cacao        cacao   1       1       PLN     3641
+Thermoanaerobacter tengcongensis               11      0       BCT     119072
+Thermotoga maritima            11      0       BCT     2336
+Thermotoga sp. RQ2             11      0       BCT     126740
+Thermus thermophilus           11      0       BCT     274
+Timarcha balearica             1       5       INV     79517
+Toxocara canis         1       5       INV     6265
+Toxoplasma gondii              1       4       INV     5811
+Toxoptera citricida    brown citrus aphid      1       5       INV     223852
+Toxostoma curvirostre          1       2       VRT     99878
+Treponema pallidum             11      0       BCT     160
+Tribolium castaneum    red flour beetle        1       5       INV     7070
+Trichinella spiralis           1       5       INV     6334
+Trichoderma harzianum          1       4       PLN     5544
+Trichoderma reesei             1       4       PLN     51453
+Trichodesmium erythraeum               11      0       BCT     1206
+Trichomonas vaginalis          1       0       INV     5722
+Trichoplusia ni        cabbage looper  1       5       INV     7111
+Trichostrongylus vitrinus              1       5       INV     40352
+Trichosurus vulpecula  silver-gray brushtail possum    1       2       MAM     9337
+Trichuris muris                1       5       INV     70415
+Trichuris vulpis               1       5       INV     219738
+Trifolium repens       white clover    1       1       PLN     3899
+Triphysaria versicolor         1       1       PLN     64093
+Triticum aestivum      bread wheat     1       1       PLN     4565
+Triticum monococcum            1       1       PLN     4568
+Triticum turgidum              1       1       PLN     4571
+Tropheus moorii        blunthead cichlid       1       2       VRT     8150
+Trypanosoma brucei             1       4       INV     5691
+Trypanosoma carassii           1       4       INV     38249
+Trypanosoma cruzi              1       4       INV     5693
+TT virus               1       0       VRL     68887
+TTV-like mini virus            1       0       VRL     93678
+Tuber borchii  whitish truffle 1       4       PLN     42251
+Turkey rhinotracheitis virus           1       0       VRL     11264
+Turnip mosaic virus            1       0       VRL     12230
+Ureaplasma urealyticum         4       0       BCT     2130
+Ursus arctos   brown bear      1       2       MAM     9644
+Ustilago maydis                1       4       PLN     5270
+Vaccinia virus         1       0       VRL     10245
+Vaccinium corymbosum           1       1       PLN     69266
+Verticillium dahliae           1       4       PLN     27337
+Vesicular stomatitis virus             1       0       VRL     11276
+Vibrio cholerae                11      0       BCT     666
+Vibrio parahaemolyticus                11      0       BCT     670
+Vibrio vulnificus              11      0       BCT     672
+Vicia faba     fava bean       1       1       PLN     3906
+Vigna radiata          1       1       PLN     157791
+Vigna unguiculata      cowpea  1       1       PLN     3917
+Vitis aestivalis               1       1       PLN     3605
+Vitis hybrid cultivar          1       1       PLN     241073
+Vitis riparia          1       1       PLN     96939
+Vitis shuttleworthii           1       1       PLN     246827
+Vitis vinifera         1       1       PLN     29760
+West Nile virus                1       0       VRL     11082
+Wuchereria bancrofti           1       5       INV     6293
+Xanthomonas axonopodis         11      0       BCT     53413
+Xanthomonas campestris         11      0       BCT     339
+Xenopus laevis African clawed frog     1       2       VRT     8355
+Xenopus tropicalis     western clawed frog     1       2       VRT     8364
+Xiphias gladius        swordfish       1       2       VRT     8245
+Xylella fastidiosa             11      0       BCT     2371
+Yarrowia lipolytica            1       3       PLN     4952
+Yersinia enterocolitica                11      0       BCT     630
+Yersinia pestis                11      0       BCT     632
+Zamia furfuracea               1       1       PLN     42329
+Zea mays               1       1       PLN     4577
+Zeldia punctata                1       5       INV     49351
+Zinnia elegans         1       1       PLN     34245
+Zucchini yellow mosaic virus           1       0       VRL     12232
+Zygosaccharomyces rouxii               1       3       PLN     4956
diff --git a/jpred/data/coils/new.mat b/jpred/data/coils/new.mat

new file mode 100755 (executable)

index 0000000..5b256c0
--- /dev/null
+++ b/jpred/data/coils/new.mat
@@ -0,0 +1,33 @@
+%
+% New matrix
+%
+% weighted
+w  14 1.89 0.30 1.04 0.27 20
+w  21 1.79 0.24 0.92 0.22 25
+w  28 1.74 0.20 0.86 0.18 30
+uw 14 1.82 0.28 0.95 0.26 20
+uw 21 1.74 0.23 0.86 0.21 25
+uw 28 1.69 0.18 0.80 0.18 30
+%
+%   a     b     c     d     e     f     g
+L 2.998 0.269 0.367 3.852 0.510 0.514 0.562
+I 2.408 0.261 0.345 0.931 0.402 0.440 0.289
+V 1.525 0.479 0.350 0.887 0.286 0.350 0.362
+M 2.161 0.605 0.442 1.441 0.607 0.457 0.570
+F 0.490 0.075 0.391 0.639 0.125 0.081 0.038
+Y 1.319 0.064 0.081 1.526 0.204 0.118 0.096
+G 0.084 0.215 0.432 0.111 0.153 0.367 0.125
+A 1.283 1.364 1.077 2.219 0.490 1.265 0.903
+K 1.233 2.194 1.817 0.611 2.095 1.686 2.027
+R 1.014 1.476 1.771 0.114 1.667 2.006 1.844
+H 0.590 0.646 0.584 0.842 0.307 0.611 0.396
+E 0.281 3.351 2.998 0.789 4.868 2.735 3.812
+D 0.068 2.103 1.646 0.182 0.664 1.581 1.401
+Q 0.311 2.290 2.330 0.811 2.596 2.155 2.585
+N 1.231 1.683 2.157 0.197 1.653 2.430 2.065
+S 0.332 0.753 0.930 0.424 0.734 0.801 0.518
+T 0.197 0.543 0.647 0.680 0.905 0.643 0.808
+C 0.918 0.002 0.385 0.440 0.138 0.432 0.079
+W 0.066 0.064 0.065 0.747 0.006 0.115 0.014
+P 0.004 0.108 0.018 0.006 0.010 0.004 0.007
+%
diff --git a/jpred/i686/blastpgp b/jpred/i686/blastpgp

new file mode 100755 (executable)

index 0000000..b5a476b

Binary files /dev/null and b/jpred/i686/blastpgp differ
diff --git a/jpred/i686/fastacmd b/jpred/i686/fastacmd

new file mode 100755 (executable)

index 0000000..70543ea

Binary files /dev/null and b/jpred/i686/fastacmd differ
diff --git a/jpred/i686/hmmbuild b/jpred/i686/hmmbuild

new file mode 100755 (executable)

index 0000000..dbd7e79

Binary files /dev/null and b/jpred/i686/hmmbuild differ
diff --git a/jpred/i686/hmmconvert b/jpred/i686/hmmconvert

new file mode 100755 (executable)

index 0000000..2baae36

Binary files /dev/null and b/jpred/i686/hmmconvert differ
diff --git a/jpred/i686/jnet b/jpred/i686/jnet

new file mode 100755 (executable)

index 0000000..5dadc6a

Binary files /dev/null and b/jpred/i686/jnet differ
diff --git a/jpred/i686/oc b/jpred/i686/oc

new file mode 100755 (executable)

index 0000000..c5736db

Binary files /dev/null and b/jpred/i686/oc differ
diff --git a/jpred/i686/pairwise b/jpred/i686/pairwise

new file mode 100755 (executable)

index 0000000..a65fce0

Binary files /dev/null and b/jpred/i686/pairwise differ
diff --git a/jpred/jpred b/jpred/jpred

deleted file mode 100755 (executable)

index 261e527..0000000
--- a/jpred/jpred
+++ /dev/null
@@ -1,931 +0,0 @@
-#!/usr/bin/perl
-
-=head1 NAME
-
-jpred - Secondary structure prediction program
-
-=head1 SYNOPSIS
-
-  jpred --sequence <fasta file> [--output <output prefix>] [--db <database>] [--psi <psiblast output>] [--pred-nohits] [--verbose] [--debug] [--help] [--man]
-
-=head1 DESCRIPTION
-
-This is a program which predicts the secondary structure of a sequence given a path to a FASTA sequence. 
-It does all the PSI-BLAST searching and alignment 'meddling' as required by Jnet.
-
-The program is primarily design for use by the Jpred server, but it can be used directly by any user. 
-Some of the output may not be meaningful if used directly - it can be safely ignored.
-
-=head1 OPTIONS
-
-=over 5
-
-=item --sequence path
-
-The path to the sequence (in FASTA format) you want to predict.
-
-=item --output file
-
-A prefix to the filenames created by Jpred, defaults to the value set by --sequence.
-
-=item --db database
-
-Database to use for PSI-BLAST querying. This only accepts databases from a list which is pre-defined in the code. Crap I know, but that's the way it is at the moment. It's probably best to stick the default for the time being.
-
-Default: uniref90
-
-=item --psi path
-
-Path to a PSIBLAST output file.
-
-=item --pred-nohits
-
-Toggle allowing Jpred to make predictions even when there are no PSI-BLAST hits.
-
-=item --verbose
-
-Verbose mode. Print more information while running jpred.
-
-=item --debug
-
-Debug mode. Print debugging information while running jpred. 
-
-=item --help
-
-Gives help on the programs usage.
-
-=item --man
-
-Displays this man page.
-
-=back
-
-=head1 BUGS
-
-Can't cope with gaps in the query sequence.
-
-Doesn't accept alignments.
-
-If you find any others please contact me.
-
-=head1 AUTHORS
-
-Jonathan Barber <jon@compbio.dundee.ac.uk>
-
-Chris Cole <christian@cole.name> (current maintainer)
-
-=cut
-
-## TODO check for gaps in query sequence
-##      check for disallowed chars in sequence
-
-use strict;
-use warnings;
-use Getopt::Long;
-use Pod::Usage;
-use Carp;
-use UNIVERSAL qw(isa);
-use Data::Dumper;
-use File::Temp;
-
-use FindBin qw($Bin);
-use lib "$Bin/../lib";
-#use lib "lib";
-#use lib "/home/asherstnev/Projects/Jpred/jpred/trunk/lib";
-
-use Jpred;    # needed to define BLAST environment variables
-
-# my modules
-use HMMER::Profile;
-use HMMER::Profile::Jnet;
-
-use PSIBLAST;
-use PSIBLAST::PSSM;
-use PSIBLAST::Run;
-
-use FASTA::File;
-use FASTA;
-
-use Index;
-use OC;
-use Utils qw(profile);
-use Run qw(check);
-use Paths qw($pairwise $oc $jnet $hmmbuild $hmmconvert $psiblastbin);
-
-our $VERSION   = '3.0.2';
-my $MAX_ALIGN = 1000;      # maximum number of alignment sequences allowed
-my $NR_CUT    = 75;        # cut-off seqeunce ID value for defining non-redundancy
-
-# Light object to hold sequence information, light to prevent memory overload
-# for big search results. Even so this is quite memory intensive, I can't see
-# how to reduce the size further.
-{
-
-  package PSISEQ;
-
-  #use Compress::LZF qw(compress decompress);
-
-  sub new {
-    my ( $class, %args ) = @_;
-    my $self = [];
-    bless $self, $class;
-    for ( keys %args ) { $self->$_( $args{$_} ) }
-    return $self;
-  }
-
-  sub id {
-    return defined $_[1]
-      ? $_[0]->[0] = $_[1]
-      : $_[0]->[0];
-  }
-
-  sub start {
-    return defined $_[1]
-      ? $_[0]->[1] = $_[1]
-      : $_[0]->[1];
-  }
-
-  sub align {
-    if ( defined $_[1] ) {
-      ref $_[1] eq 'ARRAY' or die "Not passed ARRAY ref";
-
-      #$_[0]->[2] = compress(join "", @{ $_[1] });
-      $_[0]->[2] = join( "", @{ $_[1] } );
-    } else {
-
-      #return [ split //, decompress($_[0]->[2]) ];
-      return [ split( //, $_[0]->[2] ) ];
-    }
-  }
-}
-
-# Key to database information and information for accessing them
-my $dbPATH   = '/homes/chris/projects/Jnet/db';
-my $db_entry = "uniref90";
-my $database = {
-
-  ## default database used by Jpred
-  uniref90 => {
-    database   => 'uniref90.filt',
-    unfiltered => 'uniref90',
-  },
-
-  ## database used during Jnet training
-  training => {
-    database   => 'training/uniref90.filt',
-    unfiltered => 'training/uniref90',
-  },
-
-  ## cluster-specific path for Jpred
-  cluster => {
-    database   => '/local/gjb_lab/www-jpred/uniref90.filt',
-    unfiltered => '/local/gjb_lab/www-jpred/uniref90',
-  },
-
-  ## these other DBs are experimental ones used during development.
-  ## check they exist before using them.
-  swall => {
-
-    # generic entry for use with validate_jnet.pl
-    # real db location defined by validate_jnet.pl
-    database   => "$dbPATH/swall/swall.filt",    # CC new
-    unfiltered => "$dbPATH/swall/swall",
-  },
-  uniprot => {
-
-    # Path to PSIBLAST db
-    database   => "$dbPATH/3/swall.filt",        # CC new
-    unfiltered => "$dbPATH/3/swall",
-  },
-  uniref50 => {
-    database   => "$dbPATH/6/swall.filt",
-    unfiltered => "$dbPATH/6/swall",
-  },
-};
-
-# Gap characters in sequences
-our $GAP = '-';
-
-my ( $help, $man, $path, $output, $psiblast, $DEBUG, $VERBOSE );
-my $predNoHits = 0;    # define whether to make predictions when no PSI-BLAST hits are found
-GetOptions(
-  "help"        => \$help,
-  "man"         => \$man,
-  "verbose"     => \$VERBOSE,
-  "sequence=s"  => \$path,
-  "output=s"    => \$output,
-  "psi=s"       => \$psiblast,
-  "db=s"        => \$db_entry,
-  "pred-nohits" => \$predNoHits,
-  "debug"       => \$DEBUG
-) or pod2usage(2);
-pod2usage(1) if $help;
-pod2usage( verbose => 2 ) if $man;
-
-pod2usage(' --sequence argument not provided') unless $path;
-die "--db $db_entry not recognised" unless exists $database->{$db_entry};
-$output = $path unless $output;
-
-for ( [ "path", $path ], [ "output", $output ], [ "psi", $psiblast ], [ "db", $db_entry ] ) {
-  my ( $key, $value ) = @{$_};
-  defined $value or next;
-  errlog( join( ": ", $key, $value ), "\n" );
-}
-
-my $query = FASTA::File->new( read_file => $path );
-
-my @seqs;
-if (1) {
-  my $psi = PSIBLAST->new;    # CC PSIBLAST.pm doesn't have a new() class??
-  unless ( defined $psiblast && -e $psiblast ) {
-    my $psi_run = PSIBLAST::Run->new(
-      debug => $DEBUG,
-
-      #         path => "/software/jpred_bin/blastpgp",
-      path     => $psiblastbin,                       # CC new path
-      input    => $path,
-      output   => "$output.blast",
-      matrix   => "$output.profile",
-      database => $database->{$db_entry}{database},
-      ## potentially a better set of parameters (esp. -b & -v)
-      ## which avoid PSI-BLAST dying with large number of hits
-      # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -F "m S"'  # 'soft' filtering of the query sequence
-      # args => '-e0.001 -h0.0001 -m6 -b10000 -v10000 -j3' # stricter searching criteria
-      # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3'
-    );
-
-    # For reduced databases, get the size of the orginal and use this as
-    # the equivilent DB size
-    #print $db_entry, "\n";
-    if ( $db_entry =~ /^sp_red_/ ) {
-      ( my $entry = $db_entry ) =~ s/^sp_red_/sp_/;
-      $psi_run->args(
-        $psi_run->args . " -z " . fasta_seq_length( $database->{$entry}{database} )    # CC sub is below
-      );
-    }
-    print "BLAST matrix: $ENV{BLASTMAT}\n" if $DEBUG;
-    print "BLASTDB path: $ENV{BLASTDB}\n"  if $DEBUG;
-
-    print "Running PSI-BLAST on query against \'$database->{$db_entry}{database}\'...\n" if $VERBOSE;
-    $psi_run->run or die;                                                              # CC sub is from PSIBLAST::Run
-
-    $psi->read_file("$output.blast");                                                  # CC PSIBLAST.pm doesn't have a read_file(), but Read.pm does?
-    system("gzip -9f $output.blast");
-  } else {
-    if   ( $psiblast =~ /.gz$/ ) { $psi->read_gzip_file($psiblast) }                   # CC PSIBALST.pm doesn't have a read_gzip_file() object, but Read.pm does?
-    else                         { $psi->read_file($psiblast) }                        # CC ditto above
-  }
-
-  # Convert the last itteration into a collection of PSISEQ objects
-  for ( $psi->get_all ) {                                                              # CC sub is from PSIBLAST.pm
-    my ( $id, $start, $align ) = @{$_};
-    push @seqs,
-      PSISEQ->new(
-      id    => $id,
-      start => $start,
-      align => [ split( //, $align ) ]
-      );
-  }
-}
-
-## When there are no PSI-BLAST hits generate an HMM from the query
-## and run Jnet against that only.
-## Accuracy won't be as good, but at least it's a prediction
-if ( @seqs == 0 ) {
-  if ( $predNoHits == 0 ) {
-    warn "\nJPRED: Warning - no PSI-BLAST hits found and '--pred-nohits' option not set. Exiting...\n";
-    print ">>100% complete\n";
-    exit;
-  }
-  print ">>50% complete\n";
-  warn "\nJPRED: no PSI-BLAST hits found. Continuing with single query sequence only.\n\n";
-  print "Running HMMer on query...\n" if $VERBOSE;
-
-  # copy input query to alignment
-  system("cp $path $output.align") == 0 or croak "Error: unable to copy '$path'\n";
-
-  # Temp files required for HMMer
-  my ( $hmmbuild_out, $hmmconvert_out ) = map { File::Temp->new->filename } 1 .. 2;
-
-  system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $path");
-  system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
-
-  # Read in the HMMER file
-  my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
-
-  # Convert from HMMER::Profile to HMMER::Profile::Jnet
-  my $hmmer_jnet = HMMER::Profile::Jnet->new;
-  $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
-  $hmmer_jnet->write_file("$output.hmm");    # write_file is in the Read.pm called from the HMMER::Profile module
-  print ">>70% complete\n";
-
-  # Run Jnet for the prediction
-  print "Running JNet using the generated inputs from HMM only...\n" if $VERBOSE;
-  jnet( map { "$output.$_" } qw(hmm jnet) );    # CC sub is below
-
-  print "Jpred Finished\n";
-  exit;
-}
-
-psiseq2fasta( "0.fasta.gz", @seqs ) if $DEBUG;    # CC sub is below
-print ">>40% complete\n";
-
-# Make PSIBLAST truncated alignments the right length
-print "Untruncating the PSIBLAST alignments...\n" if $VERBOSE;
-@seqs = extend( $query, @seqs );                  # CC sub si below
-psiseq2fasta( "1.fasta.gz", @seqs ) if $DEBUG;
-
-# Remove masking from PSIBLAST alignment
-print "Unmasking the alignments...\n" if $VERBOSE;
-dex($_) for @seqs[ 1 .. $#seqs ];                 ## <-- CC dies here in dex() - found below
-psiseq2fasta( "2.fasta.gz", @seqs ) if $DEBUG;
-
-# Convert the sequences to upper case
-print "Converting sequences to the same case...\n" if $VERBOSE;
-toupper($_) for @seqs;                            # CC sub is below
-psiseq2fasta( "${output}_backup.fasta.gz", @seqs );
-
-# Remove excessive sequences
-print "Remove excessive sequences...\n" if $VERBOSE;
-@seqs = reduce( $MAX_ALIGN, @seqs );              # CC sub is below
-psiseq2fasta( "3.fasta.gz", @seqs ) if $DEBUG;
-
-# Remove sequences that are too long or too short
-print "Remove sequences which too long or short...\n" if $VERBOSE;
-@seqs = del_long_seqs( 50, @seqs );               # CC sub is below
-psiseq2fasta( "4.fasta.gz", @seqs ) if $DEBUG;
-
-# Remove redundant sequences based upon pairwise identity and OC clustering
-print "Remove redundant sequences...\n" if $VERBOSE;
-@seqs = nonred( $NR_CUT, @seqs );                 # CC sub is below
-psiseq2fasta( "5.fasta.gz", @seqs ) if $DEBUG;
-
-# Check that we haven't got rid of all of the sequences
-if ( @seqs < 2 ) {
-  warn "JPRED: All the sequences found by PSIBLAST were removed during filtering, reverting to prefiltered sequences\n";
-  @seqs = fasta2psiseq("${output}_backup.fasta.gz");
-}
-unlink("${output}_backup.fasta.gz") unless $DEBUG;
-
-# Remove gaps in the query sequence and same positions in the alignment
-print "Removing gaps in the query sequence...\n" if $VERBOSE;
-degap(@seqs);                                     # CC sub is below
-psiseq2fasta( "6.fasta.gz", @seqs ) if $DEBUG;
-
-# Output the alignment for the prediction
-print "Outputting cleaned-up PSI_BLAST alignment...\n" if $VERBOSE;
-psiseq2fasta( "$output.align", @seqs );
-
-{
-  # Equivilent to getpssm script
-  print "Output the PSSM matrix from the PSI-BLAST profile...\n";
-  my $pssm = PSIBLAST::PSSM->new( read_file => "$output.profile" );
-  $pssm->write_file("$output.pssm");              # CC write_file() sub is in Write.pm loaded via PSIBLAST::PSSM
-}
-print ">>50% complete\n";
-
-# Run HMMER on the sequences
-{
-  print "Running HMMer on sequences found by PSI-BLAST...\n" if $VERBOSE;
-  my $hmmer = hmmer(@seqs);                       # CC sub is below
-  $hmmer->write_file("$output.hmm");              # write_file is in the Read.pm called from the HMMER::Profile module
-}
-print ">>70% complete\n";
-
-# Run Jnet for the prediction
-print "Running JNet using the generated inputs from HMM and PSI-BLAST...\n" if $VERBOSE;
-jnet( map { "$output.$_" } qw(hmm jnet pssm) );    # CC sub is below
-
-print "Jpred Finished\n";
-
-# Then do an accuracy prediction
-
-############################################################
-# Functions
-############################################################
-
-=begin :private
-
-=head2 $PSISEQ = dex($PSISEQ)
-
-Returns a PSISEQ object which has any masked residues replaced by their entry from the unfiltered database. Does it in place.
-
-=cut
-
-BEGIN {
-  my $idx = Index->new( type => "Index::FastaCMD" ) or die "Index type cannot be found.";
-
-  sub dex {
-    my ($seq) = @_;
-
-    croak "JPRED: dex: can only take a PSISEQ object as an argument" unless isa $seq, 'PSISEQ';
-
-    # Only bother if we have a sequence which has been masked
-    return unless grep { uc $_ eq 'X' } @{ $seq->align };
-
-    my ( $id, $start, @align ) = ( $seq->id, $seq->start, @{ $seq->align } );
-
-    #$id = "$id"; # Add the EMBOSS USA
-    #$id = "sprot_37:$id"; # Add the EMBOSS USA
-    #$id = "sprot_43:$id"; # Add the EMBOSS USA
-    #      $id = $database->{$db_entry}{emboss} . ":$id";  # commented out to try FastaCMD module
-    my $searchdb = $database->{$db_entry}{unfiltered};
-    $start--;    # We need this to be zero based
-
-    my $f    = $idx->get_sequence( $id, $searchdb ) or croak "JPRED: No such entry for $id in $searchdb\n" and return;    # CC sub is from Index::EMBOSS
-    my @seqs = $f->get_entries;                                                                                           ## Sub is from Sequence::File
-    my $db   = shift @seqs;
-
-    unless ($db) {
-      confess "JPRED: dex: Accession number $id returned no sequences";
-    } elsif (@seqs) {
-      confess "JPRED: dex: Accession number $id returned more than one sequence";
-    }
-
-    my @db_seq = @{ $db->seq };
-
-    # $i is a pointer into the original, ungapped, unmasked sequence. $_ is
-    # for the aligned sequence
-    my $i = 0;
-    for ( 0 .. $#align ) {
-      next if $align[$_] =~ /$GAP/;
-
-      if ( $align[$_] eq 'X' ) {
-        unless ( defined $db_seq[ $i + $start ] ) {
-          croak "JPRED: dex: the database sequence is not as long as the query sequence!";
-        }
-        $align[$_] = $db_seq[ $i + $start ];
-      }
-      $i++;
-    }
-
-    $seq->align( \@align );
-  }
-}
-
-=head2 @PSISEQS_OUT = reduce ($max, @PSISEQS_IN);
-
-Reduces @PSISEQS_IN to at most $max sequences by taking every n sequences in @PSISEQ_IN.
-
-Equivilent to reduce script.
-
-=cut
-
-sub reduce {
-  my ( $max, @seqs ) = @_;
-
-  my $num = int( @seqs / $max );
-
-  my @res = shift @seqs;
-
-  # Don't bother if we have less than the required sequences
-  if ( @seqs < $max ) { return @res, @seqs }
-  if ( $num == 0 )    { return @res, @seqs }
-
-  for ( 0 .. $#seqs ) { push @res, $seqs[$_] if $_ % $num == 0 }
-
-  return @res;
-}
-
-=head2 nonred($cutoff, @PSISEQS);
-
-Removes redundant sequences at $cutoff level of sequence identity.
-
-Equivilent to nonred script.
-
-=cut
-
-sub nonred {
-  my ( $cutoff, @seqs ) = @_;
-
-  # Run pairwise and then OC
-  # Remove similar sequences
-
-  unless ( defined $cutoff ) { croak "JPRED: nonred() not passed a cutoff" }
-  unless (@seqs)             { croak "JPRED: No sequences passed to nonred()" }
-  if     ( @seqs == 1 ) {
-    warn "JPRED: Only one sequence passed to nonred(). Not reducing sequence redundancy\n";
-    return @seqs;
-  }
-
-  my $fasta = FASTA::File->new;
-
-  # Convert the sequences into a FASTA object, which is what
-  # pairwise expects.
-  $fasta->add_entries(
-    map {
-      my $f = FASTA->new( id => $_->id );
-      $f->seq( @{ $_->align } );
-      $f;
-      } @seqs
-  );
-
-  # Run pairwise via wrappers
-  use Pairwise;
-  my $pair = Pairwise->new( path => $pairwise );
-  my $foo = join "\n", $pair->run($fasta) or die $!;
-
-  # Run OC
-  my $ocres = OC->new( path => "$oc sim complete cut $cutoff" );
-  $ocres->read_string( join "", $ocres->run($foo) );
-
-  # Now found those entries that aren't related
-  my @keep;
-  {
-    for ( $ocres->get_groups ) {
-      my ( $group, $score, $size, @labels ) = @{$_};
-
-      # Keep the QUERY from the cluster, otherwise just get one
-      if ( grep { /QUERY/ } @labels ) {
-
-        # Make sure the query stays at the start
-        unshift @keep, "QUERY";
-        next;
-      } else {
-        push @keep, shift @labels;
-      }
-    }
-
-    push @keep, $ocres->get_unclustered;
-  }
-
-  # Return the matching entries.
-  my @return;
-
-  # We use the temporay to mimic the selection of sequences in the nonred
-  # script, which took the sequences in the order they occured in the file.
-  for (@seqs) {
-    my $label = $_->id;
-    if ( grep { $_ =~ /^$label$/ } @keep ) {
-      push @return, $_;
-    }
-  }
-
-  return @return;
-}
-
-=head2 @seqs = del_long_seqs($percentage, @PSISEQS)
-
-Removes those sequences that are more than $percentage longer or shorter than the first 
-sequence in @seqs. @seqs is an array of PSISEQ objects.
-
-Equivilent to trim_seqs script.
-
-=cut
-
-sub del_long_seqs {
-  my ( $factor, @seqs ) = @_;
-
-  # Keep the query sequence
-  my $query = shift @seqs;
-  my @res   = $query;
-
-  # Find the length of the query sequence without any gaps
-  my $length = ( () = ( join '', @{ $query->align } ) =~ /[^$GAP]/g );
-
-  # Calculate the upper and lower allowed bounds
-  my ( $upper, $lower );
-  {
-    my $bounds = ( $length / 100 ) * $factor;
-    ( $upper, $lower ) = ( $length + $bounds, $length - $bounds );
-  }
-
-  # Now try each sequence and see how long they are
-  for (@seqs) {
-    my $l = ( () = ( join '', @{ $_->align } ) =~ /[^$GAP]/g );
-    if ( $l >= $lower && $l <= $upper ) { push @res, $_ }
-  }
-
-  return @res;
-}
-
-=head2 toupper ($PSISEQ)
-
-Converts sequence held in PSISEQ object to uppercase.
-
-=cut
-
-sub toupper {
-  croak "JPRED: toupper: argument not a PSISEQ object" unless isa $_[0], 'PSISEQ';
-  $_[0]->align( [ split //, uc join '', @{ $_[0]->align } ] );
-}
-
-=head2 degap($PSISEQ_QUERY, @PSISEQS)
-
-Removes gaps in the query sequence ($PSISEQ_QUERY) and corresponding positions in @PSISEQS. Change made in place.
-
-Equivilent to fasta2jnet script.
-
-=cut
-
-sub degap {
-  my (@seqs) = @_;
-
-  # Find where the gaps in the query sequence are
-  my @gaps;
-  {
-    my $i = 0;
-    for ( @{ $seqs[0]->align } ) {
-      push @gaps, $i if $_ !~ /$GAP/;
-      $i++;
-    }
-  }
-
-  return unless @gaps;
-
-  # Remove the gaps in all the sequences.
-  # Derefences the array reference and takes a slice inside the method call
-  # arguments, then coerce back to an array ref.
-  for (@seqs) {
-    $_->align( [ @{ $_->align }[@gaps] ] );
-  }
-}
-
-=head2 getfreq($filename, @PSISEQS)
-
-Creates a PSIBLAST like profile and writes it to the $filename.
-
-Equivilant to profile or getfreq (older) script. This doesn't create the same answer as 
-the old jpred, as it got the numbers from PSIBLAST (v2.0.3), whereas this a *similar* output, 
-but it's *not* the same.
-
-=cut
-
-sub getfreq {
-  my ( $fn, @seqs ) = @_;
-
-  croak "JPRED: Passed non PSISEQ object" if grep { !isa( $_, 'PSISEQ' ) } @seqs;
-
-  # Create a PSIBLAST like profile from the alignment
-  # This doesn't greate the same result as old Jpred, I think this is because
-  # differences in the input between old and new
-
-  # For testing
-  #   my $f = FASTA::File->new(read_file => "/homes/jon/jnet/test/1bk4/1bk4.align.fa");
-  #   my @profile = profile(
-  #      map { join "", @{ $_->seq } } $f->get_entries
-  #   );
-
-  my @profile = profile( map { join "", @{ $_->align } } @seqs );
-
-  open my $fh, ">$fn" or die "JPRED: $fn: $!";
-  print $fh join( " ", @{$_} ), "\n" for @profile;
-}
-
-=head2 HMMER::Profile::Jnet = hmmer(@PSISEQS)
-
-Creates a HMMER profile from the aligned sequences in @PSISEQS. Returns a HMMER::Profile::Jnet object.
-
-Equivilent to gethmm script.
-
-=cut
-
-sub hmmer {
-  my (@seqs) = @_;
-
-  # Temp files required
-  my ( $hmmbuild_out, $hmmconvert_out, $tmp_fasta ) = map { File::Temp->new->filename } 1 .. 3;
-
-  # Create the FASTA file
-  psiseq2fasta( $tmp_fasta, @seqs );
-
-  system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $tmp_fasta");
-  system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
-
-  # Read in the HMMER file
-  my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
-
-  # Convert from HMMER::Profile to HMMER::Profile::Jnet
-  my $hmmer_jnet = HMMER::Profile::Jnet->new;
-  $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
-
-  return $hmmer_jnet;
-}
-
-=head2 jnet($hmmer, $out, $pssm )
-
-Runs Jnet. Pass the paths of the filenames to do the prediction on
-
-=cut
-
-sub jnet {
-  my ( $hmmer, $outfile, $pssm ) = @_;
-  if ($pssm) {
-
-    # run Jnet prediction with all the profile data
-    system("$jnet --concise --hmmer $hmmer --pssm $pssm > $outfile");
-  } else {
-
-    # run Jnet prediction with only HMMer and alignment data
-    system("$jnet --concise --hmmer $hmmer > $outfile");
-  }
-  check( "jnet", $? ) or exit 1;
-}
-
-=head1 psiseq2fasta($path, @PSISEQ)
-
-Writes a FASTA file given an array of PSISEQ objects.
-
-=cut
-
-sub psiseq2fasta {
-  my ( $fn, @seqs ) = @_;
-
-  confess "JPRED: Not passed filename" if isa $fn, 'PSISEQ';
-  @seqs or confess "JPRED: not passed PSISEQs";
-
-  confess "JPRED: Not PSISEQ" if grep { not isa $_, 'PSISEQ' } @seqs;
-
-  # Changed from using FASTA::File object due to seg faulting on some large,
-  # long alignments, presumably due to running out of memory.
-  #   my $fasta = FASTA::File->new;
-  #   $fasta->add_entries(
-  #      map {
-  #         my $f = FASTA->new(id => $_->id);
-  #         $f->seq(@{$_->align});
-  #         $f;
-  #      } @seqs
-  #   );
-  #   $fasta->write_file($fn);
-
-  my $fh;
-  $fn =~ /\.gz$/
-    ? ( open $fh, "| gzip -9 > $fn" or die "JPRED: $!" )
-    : ( open $fh, ">$fn" or die "JPRED: $!" );
-
-  for (@seqs) {
-    print $fh ">", $_->id, "\n";
-    my $seq = join( "", @{ $_->align } );
-    $seq =~ s/(.{72})/$1\n/g;
-    chomp $seq;
-    print $fh $seq . "\n";
-  }
-  close $fh;
-}
-
-=head1 @PSISEQ = fasta2psiseq($path)
-
-Reads in a FASTA file and returns an array of PSISEQ objects.
-
-=cut
-
-sub fasta2psiseq {
-  my ($fn) = @_;
-
-  my $fasta =
-    $fn =~ /\.gz$/
-    ? FASTA::File->new( read_gzip_file => $fn )
-    : FASTA::File->new( read_file      => $fn );
-  $fasta or die "JPRED: $!";
-
-  my @seqs;
-  for ( $fasta->get_entries ) {
-    my $seq = PSISEQ->new;
-    $seq->id( $_->id );
-    $seq->align( [ @{ $_->seq } ] );
-    push @seqs, $seq;
-  }
-
-  return @seqs;
-}
-
-sub fasta2psiseq_lowmem {
-  my ($fn) = @_;
-
-  local $/ = "\n";
-  my $fh;
-  $fn =~ /\.gz$/
-    ? ( open $fh, "gzip -dc $fn|" or die $! )
-    : ( open $fh, $fn or die $! );
-
-  my @seqs;
-
-  my ( $id, $seq );
-  while (<$fh>) {
-    chomp;
-    if (s/^>//) {
-      $seq =~ s/ //g if defined $seq;
-
-      if ( $id and $seq ) {
-        my $psi = PSISEQ->new( id => $id );
-        $psi->align( [ split //, $seq ] );
-        push @seqs, $psi;
-        undef $id;
-        undef $seq;
-      } else {
-        $id = $_;
-      }
-    } else {
-      $seq .= $_;
-    }
-  }
-  if ( $id and $seq ) {
-    my $psi = PSISEQ->new( id => $id );
-    $psi->seq($seq);
-    push @seqs, $psi;
-  }
-
-  return @seqs;
-}
-
-=head1 die_if_no_seqs($size, $message, @seqs)
-
-Exits with error message if @seqs is not at least $size.
-
-=cut
-
-sub die_if_no_seqs {
-  my ( $size, $message, @seqs ) = @_;
-
-  confess "JPRED: Not PSISEQ" if grep { not isa $_, 'PSISEQ' } @seqs;
-
-  chomp $message;
-  die "JPRED: $message\n" unless @seqs > $size;
-}
-
-=head1 extend($FASTA::File, @PSISEQ)
-
-Sometimes PSIBLAST truncates the outputed alignment where it can't matched residues 
-against the query, this function extends the alignment so that all of the query is 
-present in the alignment. The other sequences are extended with gap characters.
-
-=cut
-
-sub extend {
-  my ( $query, @seqs ) = @_;
-
-  croak "JPRED: Not a Sequence::File" if grep { not isa $_, 'Sequence::File' } $query;
-  croak "JPRED: Not PSISEQ"           if grep { not isa $_, 'PSISEQ' } @seqs;
-
-  # Get the query sequence
-  my $q_query = $query->get_entry(0);
-
-  # Get the query sequence from the PSIBLAST alignment
-  my $a_query = shift @seqs;
-
-  # The gap size required to expand the alignment
-  my ( $start_gap_length, $end_gap_length );
-  {
-
-    # Make handling the sequence easier
-    my $q_seq = join "", @{ [ $q_query->seq ] };
-    my $a_seq = join "", @{ $a_query->align };
-
-    $q_seq =~ s/-//g;
-    $a_seq =~ s/-//g;
-
-    ( $q_seq, $a_seq ) = map { uc $_ } $q_seq, $a_seq;
-
-    $start_gap_length = index( $q_seq, $a_seq );
-    croak "JPRED: query sequence from alignment not found in original query sequence" if $start_gap_length == -1;
-
-    $end_gap_length = length($q_seq) - length($a_seq) - $start_gap_length;
-  }
-
-  # Add the gaps to the end of the alignments
-  for (@seqs) {
-    $_->align( [ ($GAP) x $start_gap_length, @{ $_->align }, ($GAP) x $end_gap_length ] );
-  }
-
-  # Put the query sequence back
-  unshift @seqs,
-    PSISEQ->new(
-    id    => $a_query->id,
-    align => [
-      ( $start_gap_length ? @{ $q_query->seq }[ 0 .. ( $start_gap_length - 1 ) ] : () ),
-      @{ $a_query->align },
-      ( $end_gap_length ? @{ $q_query->seq }[ -$end_gap_length .. -1 ] : () ),
-    ]
-    );
-
-  return @seqs;
-}
-
-=head1 $int = fasta_seq_length($path)
-
-Given the path to a FASTA database, find the number of residues/bases in it. Counts whitespace as a residue.
-
-=cut
-
-sub fasta_seq_length {
-  my ($fn) = @_;
-  open my $fh, $fn or croak "Can't open file $fn: $!\n";
-
-  my $length = 0;
-  local $_, $/ = "\n";
-  while (<$fh>) {
-    next if /^>/;
-    chomp;
-    $length += tr///c;
-  }
-
-  return $length;
-}
-
-=head1 log(@messages)
-
-Report messages to STDERR
-
-=cut
-
-sub errlog { print STDERR @_ }
diff --git a/jpred/jpred.pl b/jpred/jpred.pl

new file mode 100755 (executable)

index 0000000..73ab009
--- /dev/null
+++ b/jpred/jpred.pl
@@ -0,0 +1,932 @@
+#!/usr/bin/perl
+
+=head1 NAME
+
+jpred - Secondary structure prediction program
+
+=head1 SYNOPSIS
+
+  jpred --sequence <fasta file> [--output <output prefix>] [--db <database>] [--psi <psiblast output>] [--pred-nohits] [--verbose] [--debug] [--help] [--man]
+
+=head1 DESCRIPTION
+
+This is a program which predicts the secondary structure of a sequence given a path to a FASTA sequence. 
+It does all the PSI-BLAST searching and alignment 'meddling' as required by Jnet.
+
+The program is primarily design for use by the Jpred server, but it can be used directly by any user. 
+Some of the output may not be meaningful if used directly - it can be safely ignored.
+
+=head1 OPTIONS
+
+=over 5
+
+=item -sequence path to input FASTA file
+
+The path to the sequence (in FASTA format) you want to predict.
+
+=item -output file
+
+A prefix to the filenames created by Jpred, defaults to the value set by --sequence.
+
+=item --db database
+
+Database to use for PSI-BLAST querying. This only accepts databases from a list which is pre-defined in the code. Crap I know, but that's the way it is at the moment. It's probably best to stick the default for the time being.
+
+Default: uniref90
+
+=item -psi path
+
+Path to a PSIBLAST output file.
+
+=item --pred-nohits
+
+Toggle allowing Jpred to make predictions even when there are no PSI-BLAST hits.
+
+=item --verbose
+
+Verbose mode. Print more information while running jpred.
+
+=item --debug
+
+Debug mode. Print debugging information while running jpred. 
+
+=item --help
+
+Gives help on the programs usage.
+
+=item --man
+
+Displays this man page.
+
+=back
+
+=head1 BUGS
+
+Can't cope with gaps in the query sequence.
+
+Doesn't accept alignments.
+
+If you find any others please contact me.
+
+=head1 AUTHORS
+
+Jonathan Barber <jon@compbio.dundee.ac.uk>
+Chris Cole <christian@cole.name>
+Alexander Sherstnev <a.sherstnev@dundee.ac.uk> (current maintainer)
+
+=cut
+
+## TODO check for gaps in query sequence
+##      check for disallowed chars in sequence
+
+use strict;
+use warnings;
+use Getopt::Long;
+use Pod::Usage;
+use Carp;
+use Data::Dumper;
+use File::Temp;
+
+#use UNIVERSAL;
+
+# path to Jpred modules
+#use FindBin qw($Bin);
+#use lib "$Bin/../lib";
+use lib "lib";
+use lib "/home/asherstnev/Projects/Jpred.project/jpred/branches/portable/lib";
+
+# internal jpred modules
+use Jpred;
+use Paths qw($pairwise $oc $jnet $hmmbuild $hmmconvert $psiblastbin check_OS);
+use HMMER::Profile;
+use HMMER::Profile::Jnet;
+use PSIBLAST;
+use PSIBLAST::PSSM;
+use PSIBLAST::Run;
+use FASTA::File;
+use FASTA;
+use Index;
+use Pairwise;
+use OC;
+use Utils qw(profile);
+use Run qw(check);
+
+our $VERSION = '3.0.2';
+my $MAX_ALIGN = 10000;    # maximum number of alignment sequences allowed
+my $NR_CUT    = 75;       # cut-off seqeunce ID value for defining non-redundancy
+
+# Gap characters in sequences
+our $GAP = '-';
+
+#####################################################################################################
+# Light object to hold sequence information, light to prevent memory overload
+# for big search results. Even so this is quite memory intensive, I can't see
+# how to reduce the size further.
+{
+
+  package PSISEQ;
+
+  sub new {
+    my ( $class, %args ) = @_;
+    my $self = [];
+    bless $self, $class;
+    for ( keys %args ) { $self->$_( $args{$_} ) }
+    return $self;
+  }
+
+  sub id {
+    return defined $_[1]
+      ? $_[0]->[0] = $_[1]
+      : $_[0]->[0];
+  }
+
+  sub start {
+    return defined $_[1]
+      ? $_[0]->[1] = $_[1]
+      : $_[0]->[1];
+  }
+
+  sub align {
+    if ( defined $_[1] ) {
+      ref $_[1] eq 'ARRAY' or die "Not passed ARRAY ref";
+
+      $_[0]->[2] = join( "", @{ $_[1] } );
+    } else {
+      return [ split( //, $_[0]->[2] ) ];
+    }
+  }
+}
+
+#####################################################################################################
+my $infile;
+my $output;
+my $psiblast;
+my $ncpu       = 1;           # number of CPUs for psiblast calculations
+my $predNoHits = 0;           # define whether to make predictions when no PSI-BLAST hits are found
+my $db_path    = ".";
+my $db_entry   = "unknown";
+
+my ( $help, $man, $DEBUG, $VERBOSE );
+
+GetOptions(
+  "in|sequence=s" => \$infile,
+  "out|output=s"  => \$output,
+  "psi=s"         => \$psiblast,
+  "dbname=s"      => \$db_entry,
+  "dbpath=s"      => \$db_path,
+  "ncpu=s"        => \$ncpu,
+  "pred-nohits"   => \$predNoHits,
+  "help"          => \$help,
+  "man"           => \$man,
+  "debug"         => \$DEBUG,
+  "verbose"       => \$VERBOSE
+) or pod2usage(2);
+pod2usage(1) if $help;
+pod2usage( verbose => 2 ) if $man;
+
+#####################################################################################################
+# Key to database information and information for accessing them
+my $database = {
+
+  ## default database used by Jpred
+  uniref90 => {
+    database   => $db_path . "/uniref90.filt",
+    unfiltered => $db_path . "/uniref90",
+  },
+
+  ## database used during Jnet training
+  training => {
+    database   => $db_path . "/training/uniref90.filt",
+    unfiltered => $db_path . "/training/uniref90",
+  },
+
+  ## database used for ported Jpred
+  ported_db => {
+    database   => $db_path . "/databases/uniref90.filt",
+    unfiltered => $db_path . "/databases/uniref90",
+  },
+  ## cluster-specific path for Jpred
+  cluster => {
+    database   => "/homes/www-jpred/databases/uniref90.filt",
+    unfiltered => "/homes/www-jpred/databases/uniref90",
+  },
+
+  ## these other DBs are experimental ones used during development.
+  ## check they exist before using them.
+  swall => {
+
+    # generic entry for use with validate_jnet.pl
+    # real db location defined by validate_jnet.pl
+    database   => $db_path . "/swall/swall.filt",
+    unfiltered => $db_path . "/swall/swall",
+  },
+
+  uniprot => {
+
+    # Path to PSIBLAST db
+    database   => $db_path . "/3/swall.filt",
+    unfiltered => $db_path . "/3/swall",
+  },
+  uniref50 => {
+    database   => $db_path . "/6/swall.filt",
+    unfiltered => $db_path . "/6/swall",
+  },
+};
+
+pod2usage(' --sequence argument not provided') unless $infile;
+die "--db $db_entry not recognised" unless exists $database->{$db_entry};
+$output = $infile . ".res" unless $output;
+$ncpu = 1 if ( 1 > $ncpu or 8 < $ncpu );
+
+for ( [ "input", $infile ], [ "output", $output ], [ "psi", $psiblast ], [ "db", $db_entry ] ) {
+  my ( $key, $value ) = @{$_};
+  defined $value or next;
+  errlog( join( ": ", $key, $value ), "\n" );
+}
+
+#####################################################################################################
+my $platform = check_OS();
+print "JPRED: checking platiform... $platform\n" if $DEBUG;
+
+#####################################################################################################
+my $query = FASTA::File->new( read_file => $infile );
+
+my @seqs;
+my $psi = PSIBLAST->new;
+unless ( defined $psiblast && -e $psiblast ) {
+  ## potentially a better set of parameters (esp. -b & -v) which avoid PSI-BLAST dying with large number of hits
+  # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -F "m S"'  # 'soft' filtering of the query sequence
+  # args => '-e0.001 -h0.0001 -m6 -b10000 -v10000 -j3'        # stricter searching criteria
+  # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3'
+  my $psi_run = PSIBLAST::Run->new(
+    debug    => $DEBUG,
+    args     => "-a" . $ncpu . " -e0.05 -h0.01 -m6 -b10000 -v10000 -j3",
+    path     => $psiblastbin,
+    input    => $infile,
+    output   => "$output.blast",
+    matrix   => "$output.profile",
+    database => $database->{$db_entry}{database},
+  );
+
+  # For reduced databases, get the size of the orginal and use this as
+  # the equivilent DB size
+  if ( $db_entry =~ /^sp_red_/ ) {
+    ( my $entry = $db_entry ) =~ s/^sp_red_/sp_/;
+    $psi_run->args(
+      $psi_run->args . " -z " . fasta_seq_length( $database->{$entry}{database} )    # CC sub is below
+    );
+  }
+  print "BLAST matrix: $ENV{BLASTMAT}\n" if $DEBUG;
+  print "BLASTDB path: $ENV{BLASTDB}\n"  if $DEBUG;
+
+  print "Running PSI-BLAST on query against \'$database->{$db_entry}{database}\'...\n" if $VERBOSE;
+  $psi_run->run or die;                                                              # CC sub is from PSIBLAST::Run
+
+  $psi->read_file("$output.blast");                                                  # CC PSIBLAST.pm doesn't have a read_file(), but Read.pm does?
+  system("gzip -9f $output.blast");
+} else {
+  if   ( $psiblast =~ /.gz$/ ) { $psi->read_gzip_file($psiblast) }                   # CC PSIBALST.pm doesn't have a read_gzip_file() object, but Read.pm does?
+  else                         { $psi->read_file($psiblast) }                        # CC ditto above
+}
+
+#####################################################################################################
+# Convert the last itteration into a collection of PSISEQ objects
+for ( $psi->get_all ) {                                                              # CC sub is from PSIBLAST.pm
+  my ( $id, $start, $align ) = @{$_};
+  push @seqs,
+    PSISEQ->new(
+    id    => $id,
+    start => $start,
+    align => [ split( //, $align ) ]
+    );
+}
+
+#####################################################################################################
+## When there are no PSI-BLAST hits generate an HMM from the query
+## and run Jnet against that only.
+## Accuracy won't be as good, but at least it's a prediction
+if ( @seqs == 0 ) {
+  if ( $predNoHits == 0 ) {
+    warn "\nJPRED: Warning! no PSI-BLAST hits found and '--pred-nohits' option not set. Exiting...\n";
+    print ">>100% complete\n";
+    exit;
+  } else {
+    print ">>50% complete\n";
+    warn "\nJPRED: no PSI-BLAST hits found. Continuing with single query sequence only.\n\n";
+    print "Running HMMer on query...\n" if $VERBOSE;
+
+    # copy input query to alignment
+    #system("cp $path $output.align") == 0 or croak "Error: unable to copy '$path'\n";
+    open( my $ifh, "<", $infile )            or die "JPRED: cannot open file $infile: $!";
+    open( my $ofh, ">", $output . ".align" ) or die "JPRED: cannot open file $output\.align: $!";
+    while (<$ifh>) { print $ofh, $_ }
+    close $ifh;
+    close $ofh;
+
+    # Temp files required for HMMer
+    my ( $hmmbuild_out, $hmmconvert_out ) = map { File::Temp->new->filename } 1 .. 2;
+
+    system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $infile");
+    system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
+
+    # Read in the HMMER file
+    my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+    # Convert from HMMER::Profile to HMMER::Profile::Jnet
+    my $hmmer_jnet = HMMER::Profile::Jnet->new;
+    $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
+    $hmmer_jnet->write_file("$output.hmm");    # write_file is in the Read.pm called from the HMMER::Profile module
+    print ">>70% complete\n";
+
+    # Run Jnet for the prediction
+    print "Running JNet using the generated inputs from HMM only...\n" if $VERBOSE;
+    jnet( map { "$output.$_" } qw(hmm jnet) );    # CC sub is below
+  }
+} else {
+  psiseq2fasta( "0.fasta.gz", @seqs ) if $DEBUG;    # CC sub is below
+  print ">>40% complete\n";
+
+  #####################################################################################################
+  # Make PSIBLAST truncated alignments the right length
+  print "Untruncating the PSIBLAST alignments...\n" if $VERBOSE;
+  @seqs = extend( $query, @seqs );                  # CC sub si below
+  psiseq2fasta( "1.fasta.gz", @seqs ) if $DEBUG;
+
+  #####################################################################################################
+  # Remove masking from PSIBLAST alignment
+  print "Unmasking the alignments...\n" if $VERBOSE;
+  my $idx = Index->new( type => "Index::FastaCMD" ) or die "Index type cannot be found.";
+  remove_seq_masks( $idx, $_ ) for @seqs[ 1 .. $#seqs ];
+  psiseq2fasta( "2.fasta.gz", @seqs ) if $DEBUG;
+
+  #####################################################################################################
+  # Convert the sequences to upper case
+  print "Converting sequences to the same case...\n" if $VERBOSE;
+  toupper($_) for @seqs;    # CC sub is below
+  psiseq2fasta( "${output}_backup.fasta.gz", @seqs );
+
+  #####################################################################################################
+  # Remove excessive sequences
+  print "Remove excessive sequences...\n" if $VERBOSE;
+  @seqs = reduce( $MAX_ALIGN, @seqs );
+  psiseq2fasta( "3.fasta.gz", @seqs ) if $DEBUG;
+
+  #####################################################################################################
+  # Remove sequences that are too long or too short
+  print "Remove sequences which too long or short...\n" if $VERBOSE;
+  @seqs = del_long_seqs( 50, @seqs );
+  psiseq2fasta( "4.fasta.gz", @seqs ) if $DEBUG;
+
+  #####################################################################################################
+  # Remove redundant sequences based upon pairwise identity and OC clustering
+  print "Remove redundant sequences...\n" if $VERBOSE;
+  @seqs = nonred( $NR_CUT, @seqs );
+  psiseq2fasta( "5.fasta.gz", @seqs ) if $DEBUG;
+
+  #####################################################################################################
+  # Check that we haven't got rid of all of the sequences
+  if ( @seqs < 2 ) {
+    warn "JPRED: All the sequences found by PSIBLAST were removed during filtering, reverting to prefiltered sequences\n";
+    @seqs = fasta2psiseq("${output}_backup.fasta.gz");
+  }
+  unlink("${output}_backup.fasta.gz") unless $DEBUG;
+
+  # Remove gaps in the query sequence and same positions in the alignment
+  print "Removing gaps in the query sequence...\n" if $VERBOSE;
+  degap(@seqs);
+  psiseq2fasta( "6.fasta.gz", @seqs ) if $DEBUG;
+
+  # Output the alignment for the prediction
+  print "Outputting cleaned-up PSI_BLAST alignment...\n" if $VERBOSE;
+  psiseq2fasta( "$output.align", @seqs );
+
+  #####################################################################################################
+  # Equivilent to getpssm script
+  print "Output the PSSM matrix from the PSI-BLAST profile...\n";
+  my $pssm = PSIBLAST::PSSM->new( read_file => "$output.profile" );
+  $pssm->write_file("$output.pssm");    # CC write_file() sub is in Write.pm loaded via PSIBLAST::PSSM
+  print ">>50% complete\n";
+
+  #####################################################################################################
+  # Run HMMER on the sequences
+  print "Running HMMer on sequences found by PSI-BLAST...\n" if $VERBOSE;
+  my $hmmer = hmmer(@seqs);             # CC sub is below
+  $hmmer->write_file("$output.hmm");    # write_file is in the Read.pm called from the HMMER::Profile module
+  print ">>70% complete\n";
+
+  #####################################################################################################
+  # Run Jnet for the prediction
+  print "Running JNet using the generated inputs from HMM and PSI-BLAST...\n" if $VERBOSE;
+  jnet( map { "$output.$_" } qw(hmm jnet pssm) );    # CC sub is below
+}
+
+print ">>100% complete\n";
+print "Jpred Finished\n";
+exit;
+
+#####################################################################################################
+# Functions
+#####################################################################################################
+
+=begin :private
+
+=head2 $PSISEQ = remove_seq_masks($PSISEQ)
+
+Returns a PSISEQ object which has any masked residues replaced by their entry from the unfiltered database. 
+Does it in place.
+
+=cut
+
+#####################################################################################################
+sub remove_seq_masks {
+  my $idx = shift;
+  my $seq = shift;
+
+  # Only bother if we have a sequence which has been masked
+  return unless grep { uc $_ eq 'X' } @{ $seq->align };
+
+  my ( $id, $start, @align ) = ( $seq->id, $seq->start, @{ $seq->align } );
+  my $searchdb = $database->{$db_entry}{unfiltered};
+  $start--;    # We need this to be zero based
+
+  my $f    = $idx->get_sequence( $id, $searchdb ) or croak "JPRED: No such entry for $id in $searchdb\n" and return;
+  my @seqs = $f->get_entries;
+  my $db   = shift @seqs;
+
+  unless ($db) {
+    confess "JPRED: remove_seq_masks: Accession number $id returned no sequences";
+  } elsif (@seqs) {
+    confess "JPRED: remove_seq_masks: Accession number $id returned more than one sequence";
+  }
+
+  my @db_seq = @{ $db->seq };
+
+  # $i is a pointer into the original, ungapped, unmasked sequence. $_ is for the aligned sequence
+  my $i = 0;
+  for ( 0 .. $#align ) {
+    next if $align[$_] =~ /$GAP/;
+
+    if ( $align[$_] eq 'X' ) {
+      unless ( defined $db_seq[ $i + $start ] ) {
+        croak "JPRED: remove_seq_masks: the database sequence is not as long as the query sequence!";
+      }
+      $align[$_] = $db_seq[ $i + $start ];
+    }
+    $i++;
+  }
+  $seq->align( \@align );
+}
+
+=head2 @PSISEQS_OUT = reduce ($max, @PSISEQS_IN);
+
+Reduces @PSISEQS_IN to at most $max sequences by taking every n sequences in @PSISEQ_IN.
+
+Equivilent to reduce script.
+
+=cut
+
+#####################################################################################################
+sub reduce {
+  my ( $max, @seqs ) = @_;
+
+  my $num = int( @seqs / $max );
+  my @res = shift @seqs;
+
+  # Don't bother if we have less than the required sequences
+  if ( @seqs < $max or 0 == $num ) {
+    return @res, @seqs;
+  }
+
+  for ( 0 .. $#seqs ) {
+    push @res, $seqs[$_] if ( 0 == $_ % $num );
+  }
+
+  return @res;
+}
+
+=head2 nonred($cutoff, @PSISEQS);
+
+Removes redundant sequences at $cutoff level of sequence identity.
+
+Equivilent to nonred script.
+
+=cut
+
+#####################################################################################################
+sub nonred {
+  my ( $cutoff, @seqs ) = @_;
+
+  # Run pairwise and then OC and remove similar sequences
+  unless ( defined $cutoff ) { croak "JPRED: nonred() not passed a cutoff" }
+  unless (@seqs)             { croak "JPRED: No sequences passed to nonred()" }
+  if     ( @seqs == 1 ) {
+    warn "JPRED: Only one sequence passed to nonred(). Not reducing sequence redundancy\n";
+    return @seqs;
+  }
+
+  # Convert the sequences into a FASTA object, which is what pairwise expects (simpler version).
+  my $fasta = FASTA::File->new;
+  foreach (@seqs) {
+    my $f = FASTA->new( id => $_->id );
+    $f->seq( @{ $_->align } );
+    $fasta->add_entries($f);
+  }
+
+  # Run pairwise
+  my $pair = Pairwise->new( path => $pairwise );
+  my $foo = join "\n", $pair->run($fasta) or die $!;
+
+  # Run OC
+  my $ocres = OC->new( path => "$oc sim complete cut $cutoff" );
+  $ocres->read_string( join "", $ocres->run($foo) );
+
+  # Now found those entries that are unrelated
+  my @keep;
+  for ( $ocres->get_groups ) {
+    my ( $group, $score, $size, @labels ) = @{$_};
+
+    # Keep the QUERY from the cluster, otherwise just get onelt
+    if ( grep { /QUERY/ } @labels ) {
+
+      # Make sure the query stays at the start
+      unshift @keep, "QUERY";
+      next;
+    } else {
+      push @keep, shift @labels;
+    }
+  }
+  push @keep, $ocres->get_unclustered;
+
+  # Return the matching entries.
+  # We use the temporay to mimic the selection of sequences in the nonred
+  # script, which took the sequences in the order they occured in the file.
+  my @filtered_res;
+  for (@seqs) {
+    my $label = $_->id;
+    if ( grep { $_ =~ /^$label$/ } @keep ) {
+      push @filtered_res, $_;
+    }
+  }
+
+  return @filtered_res;
+}
+
+=head2 @seqs = del_long_seqs($percentage, @PSISEQS)
+
+Removes those sequences that are more than $percentage longer or shorter than the first 
+sequence in @seqs. @seqs is an array of PSISEQ objects.
+
+Equivilent to trim_seqs script.
+
+=cut
+
+#####################################################################################################
+sub del_long_seqs {
+  my ( $factor, @seqs ) = @_;
+
+  # Keep the query sequence (we assume query is the 1st FASTA record)
+  my $query = shift @seqs;
+  my @res   = $query;
+
+  # Find the length of the query sequence without any gaps
+  my $length = ( () = ( join '', @{ $query->align } ) =~ /[^$GAP]/g );
+
+  # Calculate the upper and lower allowed bounds
+  my ( $upper, $lower );
+  {
+    my $bounds = ( $length / 100 ) * $factor;
+    ( $upper, $lower ) = ( $length + $bounds, $length - $bounds );
+  }
+
+  # Now try each sequence and see how long they are
+  for (@seqs) {
+    my $l = ( () = ( join '', @{ $_->align } ) =~ /[^$GAP]/g );
+    if ( $l >= $lower && $l <= $upper ) { push @res, $_ }
+  }
+
+  return @res;
+}
+
+=head2 toupper ($PSISEQ)
+
+Converts sequence held in PSISEQ object to uppercase.
+
+=cut
+
+#####################################################################################################
+sub toupper {
+  $_[0]->align( [ split //, uc join '', @{ $_[0]->align } ] );
+}
+
+=head2 degap($PSISEQ_QUERY, @PSISEQS)
+
+Removes gaps in the query sequence ($PSISEQ_QUERY) and corresponding positions in @PSISEQS. Change made in place.
+
+Equivilent to fasta2jnet script.
+
+=cut
+
+#####################################################################################################
+sub degap {
+  my (@seqs) = @_;
+
+  # Find where the gaps in the query sequence are
+  my @gaps;
+  my $i = 0;
+  for ( @{ $seqs[0]->align } ) {
+    push @gaps, $i if $_ !~ /$GAP/;
+    $i++;
+  }
+
+  return unless @gaps;
+
+  # Remove the gaps in all the sequences.
+  # Derefences the array reference and takes a slice inside the method call
+  # arguments, then coerce back to an array ref.
+  for (@seqs) {
+    $_->align( [ @{ $_->align }[@gaps] ] );
+  }
+}
+
+=head2 getfreq($filename, @PSISEQS)
+
+Creates a PSIBLAST like profile and writes it to the $filename.
+
+Equivilant to profile or getfreq (older) script. This doesn't create the same answer as 
+the old jpred, as it got the numbers from PSIBLAST (v2.0.3), whereas this a *similar* output, 
+but it's *not* the same.
+
+=cut
+
+#####################################################################################################
+sub getfreq {
+  my ( $fn, @seqs ) = @_;
+
+  #croak "JPRED: Passed non PSISEQ object" if grep { !isa( $_, 'PSISEQ' ) } @seqs;
+
+  # Create a PSIBLAST like profile from the alignment
+  # This doesn't greate the same result as old Jpred, I think this is because
+  # differences in the input between old and new
+
+  # For testing
+  #   my $f = FASTA::File->new(read_file => "/homes/jon/jnet/test/1bk4/1bk4.align.fa");
+  #   my @profile = profile(
+  #      map { join "", @{ $_->seq } } $f->get_entries
+  #   );
+
+  my @profile = profile( map { join "", @{ $_->align } } @seqs );
+
+  open my $fh, ">$fn" or die "JPRED: $fn: $!";
+  print $fh join( " ", @{$_} ), "\n" for @profile;
+}
+
+=head2 HMMER::Profile::Jnet = hmmer(@PSISEQS)
+
+Creates a HMMER profile from the aligned sequences in @PSISEQS. Returns a HMMER::Profile::Jnet object.
+
+Equivilent to gethmm script.
+
+=cut
+
+#####################################################################################################
+sub hmmer {
+  my (@seqs) = @_;
+
+  # Temp files required
+  my ( $hmmbuild_out, $hmmconvert_out, $tmp_fasta ) = map { File::Temp->new->filename } 1 .. 3;
+
+  # Create the FASTA file
+  psiseq2fasta( $tmp_fasta, @seqs );
+
+  # Run HMMer
+  system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $tmp_fasta");
+  system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
+
+  # Read in the HMMER file
+  my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+  # Convert from HMMER::Profile to HMMER::Profile::Jnet
+  my $hmmer_jnet = HMMER::Profile::Jnet->new;
+  $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
+
+  return $hmmer_jnet;
+}
+
+=head2 jnet($hmmer, $out, $pssm )
+
+Runs Jnet. Pass the paths of the filenames to do the prediction on
+
+=cut
+
+#####################################################################################################
+sub jnet {
+  my ( $hmmer, $outfile, $pssm ) = @_;
+  if ($pssm) {
+
+    # run Jnet prediction with all the profile data
+    system("$jnet --concise --hmmer $hmmer --pssm $pssm > $outfile");
+  } else {
+
+    # run Jnet prediction with only HMMer and alignment data
+    system("$jnet --concise --hmmer $hmmer > $outfile");
+  }
+  check( "jnet", $? ) or exit 1;
+}
+
+=head1 psiseq2fasta($path, @PSISEQ)
+
+Writes a FASTA file given an array of PSISEQ objects.
+
+=cut
+
+#####################################################################################################
+sub psiseq2fasta {
+  my ( $fn, @seqs ) = @_;
+
+  #confess "JPRED: Not passed filename" if isa $fn, 'PSISEQ';
+  confess "JPRED: not passed PSISEQs" unless @seqs;
+
+  #confess "JPRED: Not PSISEQ" if grep { not isa $_, 'PSISEQ' } @seqs;
+
+  # Changed from using FASTA::File object due to seg faulting on some large,
+  # long alignments, presumably due to running out of memory.
+  #   my $fasta = FASTA::File->new;
+  #   $fasta->add_entries(
+  #      map {
+  #         my $f = FASTA->new(id => $_->id);
+  #         $f->seq(@{$_->align});
+  #         $f;
+  #      } @seqs
+  #   );
+  #   $fasta->write_file($fn);
+
+  my $fh;
+  $fn =~ /\.gz$/
+    ? ( open $fh, "| gzip -9 > $fn" or die "JPRED: $!" )
+    : ( open $fh, ">$fn" or die "JPRED: $!" );
+
+  for (@seqs) {
+    print $fh ">", $_->id, "\n";
+    my $seq = join( "", @{ $_->align } );
+    $seq =~ s/(.{72})/$1\n/g;
+    chomp $seq;
+    print $fh $seq . "\n";
+  }
+  close $fh;
+}
+
+=head1 @PSISEQ = fasta2psiseq($path)
+
+Reads in a FASTA file and returns an array of PSISEQ objects.
+
+=cut
+
+#####################################################################################################
+sub fasta2psiseq {
+  my ($fn) = @_;
+
+  my $fasta =
+    $fn =~ /\.gz$/
+    ? FASTA::File->new( read_gzip_file => $fn )
+    : FASTA::File->new( read_file      => $fn );
+  $fasta or die "JPRED: $!";
+
+  my @seqs;
+  for ( $fasta->get_entries ) {
+    my $seq = PSISEQ->new;
+    $seq->id( $_->id );
+    $seq->align( [ @{ $_->seq } ] );
+    push @seqs, $seq;
+  }
+
+  return @seqs;
+}
+
+#####################################################################################################
+sub fasta2psiseq_lowmemory {
+  my $filename = shift;
+
+  local $/ = "\n";
+  my $fh;
+  $filename =~ /\.gz$/
+    ? ( open $fh, "gzip -dc $filename|" or die $! )
+    : ( open $fh, $filename or die $! );
+
+  my @seqs;
+  my ( $id, $seq );
+  while (<$fh>) {
+    chomp;
+    if (s/^>//) {
+      $seq =~ s/ //g if defined $seq;
+
+      if ( $id and $seq ) {
+        my $psi = PSISEQ->new( id => $id );
+        $psi->align( [ split //, $seq ] );
+        push @seqs, $psi;
+        undef $id;
+        undef $seq;
+      } else {
+        $id = $_;
+      }
+    } else {
+      $seq .= $_;
+    }
+  }
+  if ( $id and $seq ) {
+    my $psi = PSISEQ->new( id => $id );
+    $psi->seq($seq);
+    push @seqs, $psi;
+  }
+
+  return @seqs;
+}
+
+=head1 extend($FASTA::File, @PSISEQ)
+
+Sometimes PSIBLAST truncates the outputed alignment where it can't matched residues 
+against the query, this function extends the alignment so that all of the query is 
+present in the alignment. The other sequences are extended with gap characters.
+
+=cut
+
+#####################################################################################################
+sub extend {
+  my ( $query, @seqs ) = @_;
+
+  #croak "JPRED: Not a Sequence::File" if grep { not isa $_, 'Sequence::File' } $query;
+  #croak "JPRED: Not PSISEQ"           if grep { not isa $_, 'PSISEQ' } @seqs;
+
+  # Get the query sequence
+  my $q_query = $query->get_entry(0);
+
+  # Get the query sequence from the PSIBLAST alignment
+  my $a_query = shift @seqs;
+
+  # The gap size required to expand the alignment
+  my ( $start_gap_length, $end_gap_length );
+  {
+
+    # Make handling the sequence easier
+    my $q_seq = join "", @{ [ $q_query->seq ] };
+    my $a_seq = join "", @{ $a_query->align };
+
+    $q_seq =~ s/-//g;
+    $a_seq =~ s/-//g;
+
+    ( $q_seq, $a_seq ) = map { uc $_ } $q_seq, $a_seq;
+
+    $start_gap_length = index( $q_seq, $a_seq );
+    croak "JPRED: query sequence from alignment not found in original query sequence" if $start_gap_length == -1;
+
+    $end_gap_length = length($q_seq) - length($a_seq) - $start_gap_length;
+  }
+
+  # Add the gaps to the end of the alignments
+  for (@seqs) {
+    $_->align( [ ($GAP) x $start_gap_length, @{ $_->align }, ($GAP) x $end_gap_length ] );
+  }
+
+  # Put the query sequence back
+  unshift @seqs,
+    PSISEQ->new(
+    id    => $a_query->id,
+    align => [
+      ( $start_gap_length ? @{ $q_query->seq }[ 0 .. ( $start_gap_length - 1 ) ] : () ),
+      @{ $a_query->align },
+      ( $end_gap_length ? @{ $q_query->seq }[ -$end_gap_length .. -1 ] : () ),
+    ]
+    );
+
+  return @seqs;
+}
+
+=head1 $int = fasta_seq_length($path)
+
+Given the path to a FASTA database, find the number of residues/bases in it. Counts whitespace as a residue.
+
+=cut
+
+#####################################################################################################
+sub fasta_seq_length {
+  my ($fn) = @_;
+  open my $fh, $fn or croak "Can't open file $fn: $!\n";
+
+  my $length = 0;
+  local $_, $/ = "\n";
+  while (<$fh>) {
+    next if /^>/;
+    chomp;
+    $length += tr///c;
+  }
+
+  return $length;
+}
+
+=head1 log(@messages)
+
+Report messages to STDERR
+
+=cut
+
+#####################################################################################################
+sub errlog { print STDERR @_ }
diff --git a/jpred/jpred_jabaws.pl b/jpred/jpred_jabaws.pl

new file mode 100755 (executable)

index 0000000..bd23814
--- /dev/null
+++ b/jpred/jpred_jabaws.pl
@@ -0,0 +1,1425 @@
+#!/usr/bin/perl
+
+=head1 NAME
+
+jpred - Secondary structure prediction program
+
+=head1 SYNOPSIS
+
+./jpred.pl -in <FILE1> [-outfile <FILE2>] [-logfile <FILE3>] [-output <FILEPREFIX>] [-dbname <DBNAME>] [-dbpath <PATH>] [-ncpu NNN] [-psi <psiblast output>] [-pred-nohits] [-no-final] [-jabaws] [-verbose] [-debug] [-help] [-man]
+
+=head1 DESCRIPTION
+
+This is a program for predicting the secondary structure of a multiple sequence alignment or a protein sequence. 
+The input file can be stored in 3 formats: FASTA, MSF, or BLC. 
+For the single sequence the program does all the PSI-BLAST searching, preparing PSSM and HMM profiles and 
+predicting the secondary structure with Jnet. For the multiple sequence alignment only the HMM profile, 
+created from the alignment, is used in Jnet.
+
+=head1 OPTIONS
+
+=over 5
+
+=item -in <FILE1>
+
+The path to the sequence file (in FASTA, MSF, or BLC format)
+
+=item -output <FILEPREFIX>
+
+A prefix to the filenames created by Jpred, defaults to the value set by -sequence/-in.
+
+=item -outfile <FILE2>
+
+An output file, by default it is undefined and the -output option is working
+
+=item -logfile <FILE3>
+
+Logging file, by default it is undefined and logging switched off
+
+=item -dbpath PATH
+
+Path to the uniref database used for PSI-BLAST querying. default value: .
+
+=item -dbname database
+
+Database to use for PSI-BLAST querying. This only accepts databases from a list which is pre-defined in the code.
+Default value: uniref90
+
+=item -psi path
+
+Path to a PSIBLAST output file.
+
+=item -ncpu NNN
+
+Number of CPU used by jpred.pl. Maximum value is 8
+Default: NNN = 1
+
+=item -pred-nohits
+
+Toggle allowing Jpred to make predictions even when there are no PSI-BLAST hits.
+
+=item -no-final
+
+By default jpred generates a fasts file with sequences found with PSI-BLAST and predicted sequence features
+The option untoggles this step and stops jpred at the concise file generation
+
+=item -jabaws
+
+Redefines some basic variables in order to use the script within JABAWS
+
+=item -verbose
+
+Verbose mode. Print more information while running jpred.
+
+=item -debug
+
+Debug mode. Print debugging information while running jpred. 
+
+=item -help
+
+Gives help on the programs usage.
+
+=item -man
+
+Displays this man page.
+
+=back
+
+=head1 BUGS
+
+Can't cope with gaps in the query sequence.
+
+Doesn't accept alignments.
+
+If you find any others please contact authors.
+
+=head1 AUTHORS
+
+Jonathan Barber <jon@compbio.dundee.ac.uk>
+Chris Cole <christian@cole.name>
+Alexander Sherstnev <a.sherstnev@dundee.ac.uk> (current maintainer)
+
+=cut
+
+## TODO check for gaps in query sequence
+##      check for disallowed chars in sequence
+
+use strict;
+use warnings;
+use Getopt::Long;
+use Pod::Usage;
+use Carp;
+use Data::Dumper;
+use File::Temp;
+
+# path to Jpred modules
+use FindBin qw($Bin);
+use lib "$Bin/lib";
+
+# internal jpred modules
+use Jpred;
+use Paths qw($pairwise $oc $jnet $hmmbuild $hmmconvert $psiblastbin $alscript $readseq check_OS setup_env);
+use HMMER::Profile;
+use HMMER::Profile::Jnet;
+use PSIBLAST;
+use PSIBLAST::PSSM;
+use PSIBLAST::Run;
+use FASTA::File;
+use FASTA;
+use Index;
+use Pairwise;
+use OC;
+use Utils qw(profile);
+use Run qw(check);
+
+our $VERSION = '3.0.2';
+my $MAX_ALIGN = 10000;    # maximum number of alignment sequences allowed
+my $NR_CUT    = 75;       # cut-off seqeunce ID value for defining non-redundancy
+
+# Gap characters in sequences
+our $GAP = '-';
+
+#####################################################################################################
+# Light object to hold sequence information, light to prevent memory overload
+# for big search results. Even so this is quite memory intensive, I can't see
+# how to reduce the size further.
+{
+
+  package PSISEQ;
+
+  sub new {
+    my ( $class, %args ) = @_;
+    my $self = [];
+    bless $self, $class;
+    for ( keys %args ) { $self->$_( $args{$_} ) }
+    return $self;
+  }
+
+  sub id {
+    return defined $_[1]
+      ? $_[0]->[0] = $_[1]
+      : $_[0]->[0];
+  }
+
+  sub start {
+    return defined $_[1]
+      ? $_[0]->[1] = $_[1]
+      : $_[0]->[1];
+  }
+
+  sub align {
+    if ( defined $_[1] ) {
+      ref $_[1] eq 'ARRAY' or die "Not passed ARRAY ref";
+
+      $_[0]->[2] = join( "", @{ $_[1] } );
+    } else {
+      return [ split( //, $_[0]->[2] ) ];
+    }
+  }
+}
+
+#####################################################################################################
+my $infile;
+my $infastafile;
+my $format;
+my $goal = "align";
+my $seqgoal;
+my $outfile;
+my $prefix;
+my $psiblast;
+my $jabaws;
+my $logfile;
+my $ncpu       = 1;                              # number of CPUs for psiblast calculations
+my $predNoHits = 0;                              # define whether to make predictions when no PSI-BLAST hits are found
+my $db_path    = "/homes/www-jpred/databases";
+my $db_entry   = "cluster";
+my $nofinal;
+
+my ( $help, $man, $DEBUG, $VERBOSE );
+
+GetOptions(
+  "in=s"        => \$infile,
+  "output=s"    => \$prefix,
+  "outfile=s"   => \$outfile,
+  "logfile=s"   => \$logfile,
+  "psi=s"       => \$psiblast,
+  "dbname=s"    => \$db_entry,
+  "dbpath=s"    => \$db_path,
+  "ncpu=s"      => \$ncpu,
+  "pred-nohits" => \$predNoHits,
+  "no-final"    => \$nofinal,
+  "jabaws"      => \$jabaws,
+
+  "help"    => \$help,
+  "man"     => \$man,
+  "debug"   => \$DEBUG,
+  "verbose" => \$VERBOSE
+) or pod2usage(2);
+pod2usage(1) if $help;
+pod2usage( verbose => 2 ) if $man;
+
+#####################################################################################################
+# Key to database information and information for accessing them
+my $database = {
+
+  ## default database used by Jpred
+  uniref90 => {
+    database   => $db_path . "/uniref90.filt",
+    unfiltered => $db_path . "/uniref90",
+  },
+
+  ## database used during Jnet training
+  training => {
+    database   => $db_path . "/training/uniref90.filt",
+    unfiltered => $db_path . "/training/uniref90",
+  },
+
+  ## database used for ported Jpred
+  ported_db => {
+    database   => $db_path . "/uniref90.filt",
+    unfiltered => $db_path . "/uniref90",
+  },
+
+  ## cluster-specific path for Jpred
+  cluster => {
+    database   => $db_path . "/uniref90.filt",
+    unfiltered => $db_path . "/uniref90",
+  },
+
+  ## these other DBs are experimental ones used during development.
+  ## check they exist before using them.
+  # generic entry for use with validate_jnet.pl
+  # real db location defined by validate_jnet.pl
+  swall => {
+    database   => $db_path . "/swall/swall.filt",
+    unfiltered => $db_path . "/swall/swall",
+  },
+
+  # Path to PSIBLAST db
+  uniprot => {
+    database   => $db_path . "/3/swall.filt",
+    unfiltered => $db_path . "/3/swall",
+  },
+
+  uniref50 => {
+    database   => $db_path . "/6/swall.filt",
+    unfiltered => $db_path . "/6/swall",
+  },
+};
+
+my $dpf = $database->{$db_entry}{database}.'.pal';
+my $dpu = $database->{$db_entry}{unfiltered}.'.pal';
+pod2usage("ERROR! Input file should be provided with -sequence/-in")                                              unless $infile;
+pod2usage("ERROR! Unknown database at $db_path. Use -dbpath and -dbname for configuring the database")            unless exists $database->{$db_entry};
+pod2usage("ERROR! UNIREF filtered   database is not available at $dpf Use -dbpath and -dbname for configuring the database") unless -f $dpf;
+pod2usage("ERROR! UNIREF unfiltered database is not available at $dpu Use -dbpath and -dbname for configuring the database") unless -f $dpu;
+
+#####################################################################################################
+# lots of preparation steps
+if ( defined $prefix ) {
+  unless ( defined $outfile ) {
+    $outfile = $prefix . ".res.fasta";
+  }
+} else {
+  if ( defined $outfile ) {
+    print "WARNING! file prefix is not defined. Jpred will use $outfile.tmp as the prefix\n";
+    $prefix = $outfile . ".tmp";
+  } else {
+    print "WARNING! file prefix is not defined. Jpred will use $infile.res as the prefix\n";
+    $prefix  = $infile . ".res";
+    $outfile = $prefix . ".jnet";
+  }
+}
+
+if ( 1 > $ncpu or 8 < $ncpu ) {
+  print "WARNING! the nuber of CPUs should be between 1 and 8. Jpred will use 1 CPU\n";
+  $ncpu = 1;
+}
+
+$VERBOSE = 1 if $DEBUG;
+
+my $LOG;
+if ( defined $logfile ) {
+  open( $LOG, ">", $logfile ) or die "ERROR! unable to open '$logfile': ${!}\nDied";
+}
+
+for ( [ "input file", $infile ], [ "out file", $outfile ], [ "outprefix", $prefix ], [ "psi", $psiblast ], [ "db name", $db_entry ], [ "db path", $db_path ] ) {
+  my ( $key, $value ) = @{$_};
+  defined $value or next;
+  my $par = join( ": ", $key, $value );
+  print "$par\n" if $DEBUG;
+  print $LOG "$par\n" if $LOG;
+}
+
+if ( defined $jabaws ) {
+  setup_jpred_env($Bin);
+  setup_env($Bin);
+}
+my $platform = check_OS();
+print "JPRED: checking platiform... $platform\n" if $DEBUG;
+print $LOG "JPRED: checking platiform... $platform\n" if $LOG;
+
+#####################################################################################################
+# check input file format
+my $nseq = check_FASTA_format($infile);
+if ( 0 < $nseq ) {
+  $format = "fasta";
+  if ( 1 == $nseq ) {
+    # one FASTA record
+    $goal = 'seq';
+  } else {
+    unless ( 0 < check_FASTA_alignment($infile)) {
+      die "\nERROR! jpred requires either FASTA alignment or 1 sequence in the FASTA, MSF, or BLC formats\n";
+    }
+  }
+} elsif ( 0 < check_MSF_format($infile) ) {
+  $format = "msf";
+} elsif ( 0 < check_BLC_format($infile) ) {
+  $format = "blc";
+} else {
+  die "ERROR! unknown input file format for multiple sequence alignment (can be FASTA, MSF, or BLC). exit...\n";
+}
+$infastafile = $infile . ".fasta" if ( 'msf' eq $format or 'blc' eq $format );
+
+#####################################################################################################
+if ( 'seq' eq $goal ) {
+  my $query = FASTA::File->new( read_file => $infile );
+  my @seqs;
+  my $psi = PSIBLAST->new;
+  unless ( defined $psiblast && -e $psiblast ) {
+    ## potentially a better set of parameters (esp. -b & -v) which avoid PSI-BLAST dying with large number of hits
+    # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -F "m S"'  # 'soft' filtering of the query sequence
+    # args => '-e0.001 -h0.0001 -m6 -b10000 -v10000 -j3'        # stricter searching criteria
+    # args => '-e0.05 -h0.01 -m6 -b10000 -v10000 -j3'
+    my $psi_run = PSIBLAST::Run->new(
+      debug    => $DEBUG,
+      args     => "-a" . $ncpu . " -e0.05 -h0.01 -m6 -b10000 -v10000 -j3",
+      path     => $psiblastbin,
+      input    => $infile,
+      output   => "$prefix.blast",
+      matrix   => "$prefix.profile",
+      database => $database->{$db_entry}{database},
+    );
+
+    # For reduced databases, get the size of the orginal and use this as
+    # the equivilent DB size
+    if ( $db_entry =~ /^sp_red_/ ) {
+      ( my $entry = $db_entry ) =~ s/^sp_red_/sp_/;
+      $psi_run->args(
+        $psi_run->args . " -z " . fasta_seq_length( $database->{$entry}{database} )    # CC sub is below
+      );
+    }
+    print "BLAST matrix: $ENV{BLASTMAT}\n"      if $DEBUG;
+    print "BLASTDB path: $ENV{BLASTDB}\n"       if $DEBUG;
+    print $LOG "BLAST matrix: $ENV{BLASTMAT}\n" if $LOG;
+    print $LOG "BLASTDB path: $ENV{BLASTDB}\n"  if $LOG;
+
+    print "Running PSI-BLAST on query against \'$database->{$db_entry}{database}\'...\n" if $VERBOSE;
+    print $LOG "Running PSI-BLAST on query against \'$database->{$db_entry}{database}\'...\n" if $LOG;
+    $psi_run->run or die;                                                              # CC sub is from PSIBLAST::Run
+
+    $psi->read_file("$prefix.blast");                                                  # CC PSIBLAST.pm doesn't have a read_file(), but Read.pm does?
+    system("gzip -9f $prefix.blast");
+  } else {
+    if   ( $psiblast =~ /.gz$/ ) { $psi->read_gzip_file($psiblast) }                   # CC PSIBALST.pm doesn't have a read_gzip_file() object, but Read.pm does?
+    else                         { $psi->read_file($psiblast) }                        # CC ditto above
+  }
+
+#####################################################################################################
+  # Convert the last itteration into a collection of PSISEQ objects
+  for ( $psi->get_all ) {                                                              # CC sub is from PSIBLAST.pm
+    my ( $id, $start, $align ) = @{$_};
+    push @seqs,
+      PSISEQ->new(
+      id    => $id,
+      start => $start,
+      align => [ split( //, $align ) ]
+      );
+  }
+
+#####################################################################################################
+  # When there are no PSI-BLAST hits generate an HMM from the query and run Jnet against that only.
+  # Accuracy won't be as good, but at least it's a prediction
+  if ( @seqs == 0 ) {
+    if ( $predNoHits == 0 ) {
+      warn "\nJPRED: Warning! no PSI-BLAST hits found and '-pred-nohits' option not set. Exiting...\n";
+      print ">>100% complete\n";
+      print $LOG "\nJPRED: Warning! no PSI-BLAST hits found and '-pred-nohits' option not set. Exiting...\n" if $LOG;
+      print $LOG ">>100% complete\n"                                                                         if $LOG;
+      close($LOG)                                                                                            if $LOG;
+      exit;
+    } else {
+      print ">>50% complete\n";
+      warn "\nJPRED: no PSI-BLAST hits found. Continuing with single query sequence only.\n\n";
+      print "Running HMMer on query...\n"                                                            if $VERBOSE;
+      print $LOG ">>50% complete\n"                                                                  if $LOG;
+      print $LOG "\nJPRED: no PSI-BLAST hits found. Continuing with single query sequence only.\n\n" if $LOG;
+      print $LOG "Running HMMer on query...\n"                                                       if $LOG;
+
+      # copy input query to alignment
+      #system("cp $path $prefix.align") == 0 or croak "Error: unable to copy '$path'\n";
+      open( my $ifh, "<", $infile )            or die "JPRED: cannot open file $infile: $!";
+      open( my $ofh, ">", $prefix . ".align" ) or die "JPRED: cannot open file $prefix\.align: $!";
+      while (<$ifh>) { print $ofh, $_ }
+      close $ifh;
+      close $ofh;
+
+      # Temp files required for HMMer
+      my ( $hmmbuild_out, $hmmconvert_out ) = map { File::Temp->new->filename } 1 .. 2;
+      system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $infile");
+      system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
+      unlink $hmmbuild_out;
+
+      # Read in the HMMER file
+      my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+      # Convert from HMMER::Profile to HMMER::Profile::Jnet
+      my $hmmer_jnet = HMMER::Profile::Jnet->new;
+      $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
+      $hmmer_jnet->write_file("$prefix.hmm");
+      print ">>70% complete\n";
+      print $LOG ">>70% complete\n" if $LOG;
+
+      # Run Jnet for the prediction
+      print "Running JNet using the generated inputs from HMM only...\n" if $VERBOSE;
+      print $LOG "Running JNet using the generated inputs from HMM only...\n" if $LOG;
+      my $jnetlog = jnet( map { "$prefix.$_" } qw(hmm jnet) );
+      print ">>90% complete\n";
+      print $LOG ">>90% complete\n" if $LOG;
+      print $jnetlog                if $VERBOSE;
+      print $LOG $jnetlog           if $LOG;
+    }
+  } else {
+    psiseq2fasta( "0.fasta.gz", @seqs ) if $DEBUG;
+    print ">>40% complete\n";
+    print $LOG ">>40% complete\n" if $LOG;
+
+    #####################################################################################################
+    # Make PSIBLAST truncated alignments the right length
+    print "Untruncating the PSIBLAST alignments...\n" if $VERBOSE;
+    print $LOG "Untruncating the PSIBLAST alignments...\n" if $LOG;
+    @seqs = extend( $query, @seqs );
+    psiseq2fasta( "1.fasta.gz", @seqs ) if $DEBUG;
+
+    #####################################################################################################
+    # Remove masking from PSIBLAST alignment
+    print "Unmasking the alignments...\n" if $VERBOSE;
+    print $LOG "Unmasking the alignments...\n" if $LOG;
+    my $idx = Index->new( type => "Index::FastaCMD" ) or die "Index type cannot be found.";
+    remove_seq_masks( $idx, $_ ) for @seqs[ 1 .. $#seqs ];
+    psiseq2fasta( "2.fasta.gz", @seqs ) if $DEBUG;
+
+    #####################################################################################################
+    # Convert the sequences to upper case
+    print "Converting sequences to the same case...\n" if $VERBOSE;
+    print $LOG "Converting sequences to the same case...\n" if $LOG;
+    toupper($_) for @seqs;    # CC sub is below
+    psiseq2fasta( "${prefix}_backup.fasta.gz", @seqs );
+
+    #####################################################################################################
+    # Remove excessive sequences
+    print "Remove excessive sequences...\n" if $VERBOSE;
+    print $LOG "Remove excessive sequences...\n" if $LOG;
+    @seqs = reduce( $MAX_ALIGN, @seqs );
+    psiseq2fasta( "3.fasta.gz", @seqs ) if $DEBUG;
+
+    #####################################################################################################
+    # Remove sequences that are too long or too short
+    print "Remove sequences which too long or short...\n" if $VERBOSE;
+    print $LOG "Remove sequences which too long or short...\n" if $LOG;
+    @seqs = del_long_seqs( 50, @seqs );
+    psiseq2fasta( "4.fasta.gz", @seqs ) if $DEBUG;
+
+    #####################################################################################################
+    # Remove redundant sequences based upon pairwise identity and OC clustering
+    print "Remove redundant sequences...\n" if $VERBOSE;
+    print $LOG "Remove redundant sequences...\n" if $LOG;
+    @seqs = nonred( $NR_CUT, @seqs );
+    psiseq2fasta( "5.fasta.gz", @seqs ) if $DEBUG;
+
+    #####################################################################################################
+    # Check that we haven't got rid of all of the sequences
+    if ( @seqs < 2 ) {
+      warn "JPRED: All the sequences found by PSIBLAST were removed during filtering, reverting to prefiltered sequences\n";
+      print $LOG "JPRED: All the sequences found by PSIBLAST were removed during filtering, reverting to prefiltered sequences\n" if $LOG;
+      @seqs = fasta2psiseq("${prefix}_backup.fasta.gz");
+    }
+    unlink("${prefix}_backup.fasta.gz") unless $DEBUG;
+
+    # Remove gaps in the query sequence and same positions in the alignment
+    print "Removing gaps in the query sequence...\n" if $VERBOSE;
+    print $LOG "Removing gaps in the query sequence...\n" if $LOG;
+    degap(@seqs);
+    psiseq2fasta( "6.fasta.gz", @seqs ) if $DEBUG;
+
+    # Output the alignment for the prediction
+    print "Outputting cleaned-up PSI_BLAST alignment...\n" if $VERBOSE;
+    print $LOG "Outputting cleaned-up PSI_BLAST alignment...\n" if $LOG;
+    psiseq2fasta( "$prefix.align", @seqs );
+
+    #####################################################################################################
+    # Equivilent to getpssm script
+    print "Output the PSSM matrix from the PSI-BLAST profile...\n";
+    print $LOG "Output the PSSM matrix from the PSI-BLAST profile...\n" if $LOG;
+    my $pssm = PSIBLAST::PSSM->new( read_file => "$prefix.profile" );
+    $pssm->write_file("$prefix.pssm");    # CC write_file() sub is in Write.pm loaded via PSIBLAST::PSSM
+    print ">>50% complete\n";
+    print $LOG ">>50% complete\n" if $LOG;
+
+    #####################################################################################################
+    # Run HMMER on the sequences
+    print "Running HMMer on sequences found by PSI-BLAST...\n" if $VERBOSE;
+    print $LOG "Running HMMer on sequences found by PSI-BLAST...\n" if $LOG;
+    my $hmmer = hmmer(@seqs);             # CC sub is below
+    $hmmer->write_file("$prefix.hmm");    # write_file is in the Read.pm called from the HMMER::Profile module
+    print ">>70% complete\n";
+    print $LOG ">>70% complete\n" if $LOG;
+#####################################################################################################
+    # Run Jnet for the prediction
+    print "Running JNet using the generated inputs from HMM and PSI-BLAST...\n" if $VERBOSE;
+    print $LOG "Running JNet using the generated inputs from HMM and PSI-BLAST...\n" if $LOG;
+    my $jnetlog = jnet( map { "$prefix.$_" } qw(hmm jnet pssm) );    # CC sub is below
+    print ">>90% complete\n";
+    print $LOG ">>90% complete\n" if $LOG;
+    print $jnetlog                if $VERBOSE;
+    print $LOG $jnetlog           if $LOG;
+  }
+} else {
+  if ( 'fasta' eq $format ) {
+    print "Read FASTA file\n";
+    my $hmmer1 = hmm_for_align($infile);
+    $hmmer1->write_file("$prefix.hmm");                              # write_file is in the Read.pm called from the HMMER::Profile module
+  } elsif ( 'msf' eq $format ) {
+    msf2fasta( $infile, $infastafile );
+    my $hmmer2 = hmm_for_align($infastafile);
+    $hmmer2->write_file("$prefix.hmm");                              # write_file is in the Read.pm called from the HMMER::Profile module
+  } elsif ( 'blc' eq $format ) {
+    my $tmpfile = File::Temp->new->filename;
+    blc2msf( $infile, $tmpfile );
+    msf2fasta( $infile, $infastafile );
+    my $hmmer3 = hmm_for_align($infastafile);
+    $hmmer3->write_file("$prefix.hmm");                              # write_file is in the Read.pm called from the HMMER::Profile module
+  } else {
+    die "ERROR! unknown input format '$format'. exit...\n";
+  }
+  print ">>70% complete\n";
+  print $LOG ">>70% complete\n" if $LOG;
+#####################################################################################################
+  # Run Jnet for the prediction
+  print "Running JNet using the generated inputs from HMM only...\n" if $VERBOSE;
+  print $LOG "Running JNet using the generated inputs from HMM only...\n" if $LOG;
+  my $jnetlog = jnet( map { "$prefix.$_" } qw(hmm jnet) );           # CC sub is below
+  print ">>90% complete\n";
+  print $LOG ">>90% complete\n" if $LOG;
+  print $jnetlog                if $VERBOSE;
+  print $LOG $jnetlog           if $LOG;
+}
+
+unless ( defined $nofinal ) {
+  my $aligfile      = $prefix . ".align";
+  my $jnetfile      = $prefix . ".jnet";
+  my $jnetfastafile = $prefix . ".jnet.fasta";
+  $aligfile = $infile if ( 'fasta' eq $format );
+  $aligfile = $infastafile if ( 'msf' eq $format or 'blc' eq $format );
+  concise2fasta( $jnetfile, $jnetfastafile );
+  open( my $IN1, "<", $aligfile )      or die "ERROR! unable to open '$aligfile': ${!}\nDied";
+  open( my $IN2, "<", $jnetfastafile ) or die "ERROR! unable to open '$jnetfastafile': ${!}\nDied";
+  open( my $OUT, ">", $outfile )       or die "ERROR! unable to open '$outfile': ${!}\nDied";
+  while (<$IN2>) { print $OUT $_; }
+  while (<$IN1>) { print $OUT $_; }
+  close($IN1);
+  close($IN2);
+  close($OUT);
+  unlink $jnetfastafile;
+  my $seqs = FASTA::File->new( read_file => $outfile );
+  open( my $OUT2, ">", $outfile ) or die "ERROR! unable to open '$outfile': ${!}\n";
+  $seqs->write($OUT2);
+  close($OUT2);
+} else {
+  if ( defined $outfile and $prefix . ".jnet" ne $outfile ) {
+    rename $prefix . ".jnet", $outfile;
+  }
+}
+
+print ">>100% complete\n";
+print "Jpred Finished\n";
+print $LOG ">>100% complete\n" if $LOG;
+print $LOG "Jpred Finished\n"  if $LOG;
+close($LOG)                    if $LOG;
+exit;
+
+#####################################################################################################
+# Functions
+#####################################################################################################
+sub check_FASTA_format {
+  my $infile = shift;
+
+  open( my $IN, "<", $infile ) or die "ERROR! unable to open '$infile': ${!}\n";
+  my $check_first_line = 1;
+  my $nseq             = 0;
+  local $/ = "\n>";
+  while (<$IN>) {
+    if ($check_first_line) {
+      return 0 unless (/^>/);
+      $check_first_line = 0;
+    }
+    s/^>//g;
+    s/>$//g;
+
+    my ( $id, @seqs ) = split /\n/, $_;
+    return 0 unless ( defined $id or @seqs );
+    my $seq = join( "", @seqs );
+    return 0 unless ( $seq =~ /[a-zA-Z\.-]/ );
+    ++$nseq;
+  }
+  close($IN);
+
+  return $nseq;
+}
+#####################################################################################################
+sub check_FASTA_alignment {
+  my $infile = shift;
+
+  open( my $IN, "<", $infile ) or die "ERROR! unable to open '$infile': ${!}\n";
+  my $check_first_line = 1;
+  my $nseq             = 0;
+  my $seqlen = -1;
+  local $/ = "\n>";
+  while (<$IN>) {
+    if ($check_first_line) {
+      return 0 unless (/^>/);
+      $check_first_line = 0;
+    }
+    s/^>//g;
+    s/>$//g;
+
+    my ( $id, @seqs ) = split /\n/, $_;
+    return 0 unless ( defined $id or @seqs );
+    my $seq = join( "", @seqs );
+    return 0 unless ( $seq =~ /[a-zA-Z\.-]/ );
+    if (-1 == $seqlen) {
+      $seqlen = length ($seq);
+    } else {
+      return 0 if ($seqlen != length ($seq) );
+    }
+    ++$nseq;
+  }
+  close($IN);
+
+  return $nseq;
+}
+#####################################################################################################
+sub check_MSF_format {
+  my $infile = shift;
+  $? = 0;
+  system("$readseq -fMSF -a -p < $infile > /dev/null");
+  return 0 if ($?);
+
+  return 1;
+}
+#####################################################################################################
+sub check_BLC_format {
+  my $infile = shift;
+
+  my ( $tmpfile1, $tmpfile2 ) = map { File::Temp->new->filename } 1 .. 2;
+  open my $fh, ">$tmpfile1" or die "$tmpfile1: $!\n";
+  print $fh "silent_mode\nblock_file $infile\n";
+  print $fh "output_file /dev/null\nmax_nseq 2000\n";
+  print $fh "pir_save $tmpfile2\nsetup\n";
+  close $fh;
+
+  $? = 0;
+  system("$alscript -s -f $tmpfile1");
+  $? = 0;
+  system("$readseq -f8 -a -p < $tmpfile2 > /dev/null");
+  unlink $tmpfile1;
+  unlink $tmpfile2;
+  return 0 if ($?);
+
+  return 1;
+}
+############################################################################################################################################
+# convertor BLC -> MSF
+sub msf2fasta {
+  my $infile  = shift;
+  my $outfile = shift;
+
+  my $sequence = "";
+  open( my $IN, "<", $infile ) or die "ERROR! unable to open '$infile': ${!}\n";
+  while (<$IN>) {
+    $sequence .= $_;
+  }
+  close($IN);
+
+  $sequence =~ s/~/\./g;
+
+  ## check for non-unique sequence names - readseq has problems with these
+  my @lines = split /\n/, $sequence;
+  my %names;
+  foreach my $line (@lines) {
+    if ( $line =~ /Name:\s+(\S+)/ ) {
+      die "ERROR! Alignment has non-unique sequence ids. exit...\n" if ( defined( $names{$1} ) && $names{$1} >= 1 );
+      $names{$1}++;
+    }
+  }
+
+  my $tmpfile1 = File::Temp->new->filename;
+  my $tmpfile2 = File::Temp->new->filename;
+  open my $FILE, ">$tmpfile1" or die "open $tmpfile1 failed: $!";
+  print $FILE $sequence;
+  close $FILE;
+
+  $? = 0;
+  system("$readseq -fMSF -a -p < $tmpfile1 > $tmpfile2");
+  die "Reformatting of $infile failed. exit...\n" if ($?);
+  unlink $tmpfile1;
+
+  $? = 0;
+  system("$readseq -f8 -a -p < $tmpfile2 > $outfile");
+  die "Reformatting of $infile failed. exit...\n" if ($?);
+  unlink $tmpfile2;
+
+  die "Reformatting the input alignment has failed. exit...\n" unless ( -e $outfile );
+}
+
+############################################################################################################################################
+# convertor BLC -> MSF
+sub blc2msf {
+  my ( $in, $out ) = @_;
+
+  my ( $tmp, $tmp_pir ) = map { File::Temp->new->filename } 1 .. 2;
+
+  open my $fh, ">$tmp" or die "$tmp: $!\n";
+  print $fh "silent_mode\nblock_file $infile\n";
+  print $fh "output_file /dev/null\nmax_nseq 2000\n";
+  print $fh "pir_save $tmp_pir\nsetup\n";
+  close $fh;
+
+  $? = 0;
+  system("$alscript -s -f $tmp");
+  die "Reformatting of $infile failed. exit...\n" if ($?);
+  system("$readseq -f=MSF -o=$out -a $tmp_pir");
+
+  unlink $tmp;
+  unlink $tmp_pir;
+}
+
+#####################################################################################################
+
+=begin :private
+
+=head2 fasta2concise ($infile, $outfile)
+
+Convert a file with PSI-BLAST sequences and prediction in the fasta format into concise file
+
+=cut
+
+sub fasta2concise {
+  my $infile  = shift;
+  my $outfile = shift;
+
+  open( my $IN, "<", $infile ) or die "ERROR! unable to open '$infile': ${!}\nDied";
+  my ( $seq, @seqs, @title );
+  while (<$IN>) {
+    if (s/^>//) {
+      if ($seq) {
+        $seq =~ s/\n|\s//g;
+        $seq =~ s/(.)/$1,/g;
+        push @seqs, $seq;
+        $seq = "";
+      }
+      chomp;
+      push @title, $_;
+    } else {
+      chomp;
+      $seq .= $_;
+    }
+  }
+  $seq =~ s/\n|\s//g;
+  $seq =~ s/(.)/$1,/g;
+  push @seqs, $seq;
+  close($IN);
+
+  if ( @title != @seqs ) {
+    die("non matching number of titles and sequences!\n");
+  }
+
+  open( my $OUT, ">", $outfile ) or die "ERROR! unable to open '$outfile': ${!}\nDied";
+  foreach ( 0 .. $#title ) {
+    print $OUT "align" . ( $_ + 1 ) . ";$title[$_]:$seqs[$_]\n";
+  }
+  close($OUT);
+}
+
+=begin :private
+
+=head2 concise2fasta ($infile, $outfile)
+
+Convert a file with PSI-BLAST sequences and prediction in the concise format into fasta file
+
+=cut
+
+#####################################################################################################
+sub concise2fasta {
+  my $infile  = shift;
+  my $outfile = shift;
+
+  my ( @seqs, %seq, @pred, %pred );
+
+  my @var = (
+    "Lupas_21",  "Lupas_14", "Lupas_28", "MULTCOIL",  "MULTCOIL_TRIMER", "MULTCOIL_DIMER", "JNETPSSM", "JNETFREQ",
+    "JNETALIGN", "JNETHMM",  "JNETSOL5", "JNETSOL25", "JNETSOL0",        "jnetpred",       "jpred"
+  );
+
+  # parse input concise file
+  open( my $IN, "<", $infile ) or die "ERROR! unable to open '$infile': ${!}\nDied";
+  while (<$IN>) {
+    unless (/^\n/) {
+      my ( $id, $seq ) = split( ":", $_ );
+      if ( defined $id and defined $seq ) {    # Check we have proper values
+        $seq =~ s/,//g;
+        chomp $seq;
+        if ( $id =~ /;/ ) {                    # Then it's an alignment
+          @_ = split( ";", $id );
+          push @seqs, $_[1];
+          $seq{ $_[1] } = $seq;
+        }
+        foreach my $v (@var) {
+          if ( $v eq $id ) {
+            push @pred, $v;
+            $pred{$v} = $seq;
+          }
+        }
+      }
+    }
+  }
+  close($IN);
+
+  open( my $OUT, ">", $outfile ) or die "ERROR! unable to open '$outfile': ${!}\nDied";
+
+  # print out sequences found with PSI-BLAST
+  foreach (@seqs) {
+    $seq{$_} =~ s/(.{72})/$1\n/g;
+    print $OUT ">$_\n$seq{$_}\n";
+  }
+
+  # print out predictions
+  foreach my $p (@pred) {
+    $pred{$p} =~ s/[TCYWXZSI\?_]/-/g;
+    $pred{$p} =~ s/B/E/g;
+    $pred{$p} =~ s/G/H/g;
+
+    if ( $p =~ /SOL/ ) {
+      $pred{$p} =~ s/E/B/g;
+    }
+    $pred{$p} =~ s/(.{72})/$1\n/g;
+    print $OUT ">$p\n$pred{$p}\n";
+  }
+  close($OUT);
+}
+
+=begin :private
+
+=head2 $PSISEQ = remove_seq_masks($PSISEQ)
+
+Returns a PSISEQ object which has any masked residues replaced by their entry from the unfiltered database. 
+Does it in place.
+
+=cut
+
+#####################################################################################################
+sub remove_seq_masks {
+  my $idx = shift;
+  my $seq = shift;
+
+  # Only bother if we have a sequence which has been masked
+  return unless grep { uc $_ eq 'X' } @{ $seq->align };
+
+  my ( $id, $start, @align ) = ( $seq->id, $seq->start, @{ $seq->align } );
+  my $searchdb = $database->{$db_entry}{unfiltered};
+  $start--;    # We need this to be zero based
+
+  my $f    = $idx->get_sequence( $id, $searchdb ) or croak "JPRED: No such entry for $id in $searchdb\n" and return;
+  my @seqs = $f->get_entries;
+  my $db   = shift @seqs;
+
+  unless ($db) {
+    confess "JPRED: remove_seq_masks: Accession number $id returned no sequences";
+  } elsif (@seqs) {
+    confess "JPRED: remove_seq_masks: Accession number $id returned more than one sequence";
+  }
+
+  my @db_seq = @{ $db->seq };
+
+  # $i is a pointer into the original, ungapped, unmasked sequence. $_ is for the aligned sequence
+  my $i = 0;
+  for ( 0 .. $#align ) {
+    next if $align[$_] =~ /$GAP/;
+
+    if ( $align[$_] eq 'X' ) {
+      unless ( defined $db_seq[ $i + $start ] ) {
+        croak "JPRED: remove_seq_masks: the database sequence is not as long as the query sequence!";
+      }
+      $align[$_] = $db_seq[ $i + $start ];
+    }
+    $i++;
+  }
+  $seq->align( \@align );
+}
+
+=head2 @PSISEQS_OUT = reduce ($max, @PSISEQS_IN);
+
+Reduces @PSISEQS_IN to at most $max sequences by taking every n sequences in @PSISEQ_IN.
+
+Equivilent to reduce script.
+
+=cut
+
+#####################################################################################################
+sub reduce {
+  my ( $max, @seqs ) = @_;
+
+  my $num = int( @seqs / $max );
+  my @res = shift @seqs;
+
+  # Don't bother if we have less than the required sequences
+  if ( @seqs < $max or 0 == $num ) {
+    return @res, @seqs;
+  }
+
+  for ( 0 .. $#seqs ) {
+    push @res, $seqs[$_] if ( 0 == $_ % $num );
+  }
+
+  return @res;
+}
+
+=head2 nonred($cutoff, @PSISEQS);
+
+Removes redundant sequences at $cutoff level of sequence identity.
+
+Equivilent to nonred script.
+
+=cut
+
+#####################################################################################################
+sub nonred {
+  my ( $cutoff, @seqs ) = @_;
+
+  # Run pairwise and then OC and remove similar sequences
+  unless ( defined $cutoff ) { croak "JPRED: nonred() not passed a cutoff" }
+  unless (@seqs)             { croak "JPRED: No sequences passed to nonred()" }
+  if     ( @seqs == 1 ) {
+    warn "JPRED: Only one sequence passed to nonred(). Not reducing sequence redundancy\n";
+    return @seqs;
+  }
+
+  # Convert the sequences into a FASTA object, which is what pairwise expects (simpler version).
+  my $fasta = FASTA::File->new;
+  foreach (@seqs) {
+    my $f = FASTA->new( id => $_->id );
+    $f->seq( @{ $_->align } );
+    $fasta->add_entries($f);
+  }
+
+  # Run pairwise
+  my $pair = Pairwise->new( path => $pairwise );
+  my $foo = join "\n", $pair->run($fasta) or die $!;
+
+  # Run OC
+  my $ocres = OC->new( path => "$oc sim complete cut $cutoff" );
+  $ocres->read_string( join "", $ocres->run($foo) );
+
+  # Now found those entries that are unrelated
+  my @keep;
+  for ( $ocres->get_groups ) {
+    my ( $group, $score, $size, @labels ) = @{$_};
+
+    # Keep the QUERY from the cluster, otherwise just get onelt
+    if ( grep { /QUERY/ } @labels ) {
+
+      # Make sure the query stays at the start
+      unshift @keep, "QUERY";
+      next;
+    } else {
+      push @keep, shift @labels;
+    }
+  }
+  push @keep, $ocres->get_unclustered;
+
+  # Return the matching entries.
+  # We use the temporay to mimic the selection of sequences in the nonred
+  # script, which took the sequences in the order they occured in the file.
+  my @filtered_res;
+  for (@seqs) {
+    my $label = $_->id;
+    if ( grep { $_ =~ /^$label$/ } @keep ) {
+      push @filtered_res, $_;
+    }
+  }
+
+  return @filtered_res;
+}
+
+=head2 @seqs = del_long_seqs($percentage, @PSISEQS)
+
+Removes those sequences that are more than $percentage longer or shorter than the first 
+sequence in @seqs. @seqs is an array of PSISEQ objects.
+
+Equivilent to trim_seqs script.
+
+=cut
+
+#####################################################################################################
+sub del_long_seqs {
+  my ( $factor, @seqs ) = @_;
+
+  # Keep the query sequence (we assume query is the 1st FASTA record)
+  my $query = shift @seqs;
+  my @res   = $query;
+
+  # Find the length of the query sequence without any gaps
+  my $length = ( () = ( join '', @{ $query->align } ) =~ /[^$GAP]/g );
+
+  # Calculate the upper and lower allowed bounds
+  my ( $upper, $lower );
+  {
+    my $bounds = ( $length / 100 ) * $factor;
+    ( $upper, $lower ) = ( $length + $bounds, $length - $bounds );
+  }
+
+  # Now try each sequence and see how long they are
+  for (@seqs) {
+    my $l = ( () = ( join '', @{ $_->align } ) =~ /[^$GAP]/g );
+    if ( $l >= $lower && $l <= $upper ) { push @res, $_ }
+  }
+
+  return @res;
+}
+
+=head2 toupper ($PSISEQ)
+
+Converts sequence held in PSISEQ object to uppercase.
+
+=cut
+
+#####################################################################################################
+sub toupper {
+  $_[0]->align( [ split //, uc join '', @{ $_[0]->align } ] );
+}
+
+=head2 degap($PSISEQ_QUERY, @PSISEQS)
+
+Removes gaps in the query sequence ($PSISEQ_QUERY) and corresponding positions in @PSISEQS. Change made in place.
+
+Equivilent to fasta2jnet script.
+
+=cut
+
+#####################################################################################################
+sub degap {
+  my (@seqs) = @_;
+
+  # Find where the gaps in the query sequence are
+  my @gaps;
+  my $i = 0;
+  for ( @{ $seqs[0]->align } ) {
+    push @gaps, $i if $_ !~ /$GAP/;
+    $i++;
+  }
+
+  return unless @gaps;
+
+  # Remove the gaps in all the sequences.
+  # Derefences the array reference and takes a slice inside the method call
+  # arguments, then coerce back to an array ref.
+  for (@seqs) {
+    $_->align( [ @{ $_->align }[@gaps] ] );
+  }
+}
+
+=head2 getfreq($filename, @PSISEQS)
+
+Creates a PSIBLAST like profile and writes it to the $filename.
+
+Equivilant to profile or getfreq (older) script. This doesn't create the same answer as 
+the old jpred, as it got the numbers from PSIBLAST (v2.0.3), whereas this a *similar* output, 
+but it's *not* the same.
+
+=cut
+
+#####################################################################################################
+sub getfreq {
+  my ( $fn, @seqs ) = @_;
+
+  #croak "JPRED: Passed non PSISEQ object" if grep { !isa( $_, 'PSISEQ' ) } @seqs;
+
+  # Create a PSIBLAST like profile from the alignment
+  # This doesn't greate the same result as old Jpred, I think this is because
+  # differences in the input between old and new
+
+  # For testing
+  #   my $f = FASTA::File->new(read_file => "/homes/jon/jnet/test/1bk4/1bk4.align.fa");
+  #   my @profile = profile(
+  #      map { join "", @{ $_->seq } } $f->get_entries
+  #   );
+
+  my @profile = profile( map { join "", @{ $_->align } } @seqs );
+
+  open my $fh, ">$fn" or die "JPRED: $fn: $!";
+  print $fh join( " ", @{$_} ), "\n" for @profile;
+}
+
+=head2 HMMER::Profile::Jnet = hmmer(@PSISEQS)
+
+Creates a HMMER profile from the aligned sequences in @PSISEQS. Returns a HMMER::Profile::Jnet object.
+
+Equivilent to gethmm script.
+
+=cut
+
+#####################################################################################################
+sub hmmer {
+  my (@seqs) = @_;
+
+  # Temp files required
+  my ( $hmmbuild_out, $hmmconvert_out, $tmp_fasta ) = map { File::Temp->new->filename } 1 .. 3;
+
+  # Create the FASTA file
+  psiseq2fasta( $tmp_fasta, @seqs );
+
+  # Run HMMer
+  system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $tmp_fasta");
+  system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
+
+  # Read in the HMMER file
+  my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+  # Convert from HMMER::Profile to HMMER::Profile::Jnet
+  my $hmmer_jnet = HMMER::Profile::Jnet->new;
+  $hmmer_jnet->add_line( @{$_} ) for $hmmer->get_line;
+
+  return $hmmer_jnet;
+}
+
+=head2 jnet($hmmer, $out, $pssm )
+
+Runs Jnet. Pass the paths of the filenames to do the prediction on
+
+=cut
+
+#################################################################################################################################################
+
+=head2 get_hmm($alignFile, $name)
+
+Adapted from the hmmer() function in Jpred as written by JDB.
+
+Generates an HMMer profile output compatible with Jnet.
+
+Equivilent to gethmm script.
+
+=cut
+
+sub hmm_for_align {
+  my $fastafile = shift;
+
+  # Temp files required
+  print "hmm_for_align: fastafile = $fastafile\n";
+  my ( $hmmbuild_out, $hmmconvert_out ) = map { File::Temp->new->filename } 1 .. 2;
+
+  system("$hmmbuild -F --fast --amino --gapmax 1 --wblosum $hmmbuild_out $fastafile");
+  system("$hmmconvert -F -p $hmmbuild_out $hmmconvert_out");
+
+  # Read in the HMMER file
+  my $hmmer = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+  # Read in the HMMER file
+  my $hmmer_tmp = HMMER::Profile->new( read_file => $hmmconvert_out );
+
+  # Convert from HMMER::Profile to HMMER::Profile::Jnet
+  my $hmmer_jnet = HMMER::Profile::Jnet->new;
+  $hmmer_jnet->add_line( @{$_} ) for $hmmer_tmp->get_line;
+
+  return $hmmer_jnet;
+}
+
+#####################################################################################################
+sub jnet {
+  my ( $hmmer, $outfile, $pssm ) = @_;
+  if ($pssm) {
+
+    # run Jnet prediction with all the profile data
+    system("$jnet --concise --hmmer $hmmer --pssm $pssm > $outfile");
+  } else {
+
+    # run Jnet prediction with only HMMer and alignment data
+    system("$jnet --concise --hmmer $hmmer > $outfile");
+  }
+  check( "jnet", $? ) or exit 1;
+  my $res     = "";
+  my $logging = "";
+  open( my $IN, "<", $outfile ) or die "ERROR! unable to open '$outfile': ${!}\nDied";
+  while (<$IN>) {
+    if (/^jnetpred:|^JNET[A-Z0-9]+:/) {
+      $res .= $_;
+    } else {
+      $logging .= $_;
+    }
+  }
+  close $IN;
+  open( my $OUT, ">", $outfile ) or die "ERROR! unable to open '$outfile': ${!}\nDied";
+  print $OUT "\n" . $res;
+  close $OUT;
+  return $logging;
+}
+
+=head1 psiseq2fasta($path, @PSISEQ)
+
+Writes a FASTA file given an array of PSISEQ objects.
+
+=cut
+
+#####################################################################################################
+sub psiseq2fasta {
+  my ( $fn, @seqs ) = @_;
+
+  #confess "JPRED: Not passed filename" if isa $fn, 'PSISEQ';
+  confess "JPRED: not passed PSISEQs" unless @seqs;
+
+  #confess "JPRED: Not PSISEQ" if grep { not isa $_, 'PSISEQ' } @seqs;
+
+  # Changed from using FASTA::File object due to seg faulting on some large,
+  # long alignments, presumably due to running out of memory.
+  #   my $fasta = FASTA::File->new;
+  #   $fasta->add_entries(
+  #      map {
+  #         my $f = FASTA->new(id => $_->id);
+  #         $f->seq(@{$_->align});
+  #         $f;
+  #      } @seqs
+  #   );
+  #   $fasta->write_file($fn);
+
+  my $fh;
+  $fn =~ /\.gz$/
+    ? ( open $fh, "| gzip -9 > $fn" or die "JPRED: $!" )
+    : ( open $fh, ">$fn" or die "JPRED: $!" );
+
+  for (@seqs) {
+    print $fh ">", $_->id, "\n";
+    my $seq = join( "", @{ $_->align } );
+    $seq =~ s/(.{72})/$1\n/g;
+    chomp $seq;
+    print $fh $seq . "\n";
+  }
+  close $fh;
+}
+
+=head1 @PSISEQ = fasta2psiseq($path)
+
+Reads in a FASTA file and returns an array of PSISEQ objects.
+
+=cut
+
+#####################################################################################################
+sub fasta2psiseq {
+  my ($fn) = @_;
+
+  my $fasta =
+    $fn =~ /\.gz$/
+    ? FASTA::File->new( read_gzip_file => $fn )
+    : FASTA::File->new( read_file      => $fn );
+  $fasta or die "JPRED: $!";
+
+  my @seqs;
+  for ( $fasta->get_entries ) {
+    my $seq = PSISEQ->new;
+    $seq->id( $_->id );
+    $seq->align( [ @{ $_->seq } ] );
+    push @seqs, $seq;
+  }
+
+  return @seqs;
+}
+
+#####################################################################################################
+sub fasta2psiseq_lowmemory {
+  my $filename = shift;
+
+  local $/ = "\n";
+  my $fh;
+  $filename =~ /\.gz$/
+    ? ( open $fh, "gzip -dc $filename|" or die $! )
+    : ( open $fh, $filename or die $! );
+
+  my @seqs;
+  my ( $id, $seq );
+  while (<$fh>) {
+    chomp;
+    if (s/^>//) {
+      $seq =~ s/ //g if defined $seq;
+
+      if ( $id and $seq ) {
+        my $psi = PSISEQ->new( id => $id );
+        $psi->align( [ split //, $seq ] );
+        push @seqs, $psi;
+        undef $id;
+        undef $seq;
+      } else {
+        $id = $_;
+      }
+    } else {
+      $seq .= $_;
+    }
+  }
+  if ( $id and $seq ) {
+    my $psi = PSISEQ->new( id => $id );
+    $psi->seq($seq);
+    push @seqs, $psi;
+  }
+
+  return @seqs;
+}
+
+#####################################################################################################
+
+=head1 extend($FASTA::File, @PSISEQ)
+
+Sometimes PSIBLAST truncates the outputed alignment where it can't matched residues 
+against the query, this function extends the alignment so that all of the query is 
+present in the alignment. The other sequences are extended with gap characters.
+
+=cut
+
+sub extend {
+  my ( $query, @seqs ) = @_;
+
+  #croak "JPRED: Not a Sequence::File" if grep { not isa $_, 'Sequence::File' } $query;
+  #croak "JPRED: Not PSISEQ"           if grep { not isa $_, 'PSISEQ' } @seqs;
+
+  # Get the query sequence
+  my $q_query = $query->get_entry(0);
+
+  # Get the query sequence from the PSIBLAST alignment
+  my $a_query = shift @seqs;
+
+  # The gap size required to expand the alignment
+  my ( $start_gap_length, $end_gap_length );
+  {
+
+    # Make handling the sequence easier
+    my $q_seq = join "", @{ [ $q_query->seq ] };
+    my $a_seq = join "", @{ $a_query->align };
+
+    $q_seq =~ s/-//g;
+    $a_seq =~ s/-//g;
+
+    ( $q_seq, $a_seq ) = map { uc $_ } $q_seq, $a_seq;
+
+    $start_gap_length = index( $q_seq, $a_seq );
+    croak "JPRED: query sequence from alignment not found in original query sequence" if $start_gap_length == -1;
+
+    $end_gap_length = length($q_seq) - length($a_seq) - $start_gap_length;
+  }
+
+  # Add the gaps to the end of the alignments
+  for (@seqs) {
+    $_->align( [ ($GAP) x $start_gap_length, @{ $_->align }, ($GAP) x $end_gap_length ] );
+  }
+
+  # Put the query sequence back
+  unshift @seqs,
+    PSISEQ->new(
+    id    => $a_query->id,
+    align => [
+      ( $start_gap_length ? @{ $q_query->seq }[ 0 .. ( $start_gap_length - 1 ) ] : () ),
+      @{ $a_query->align },
+      ( $end_gap_length ? @{ $q_query->seq }[ -$end_gap_length .. -1 ] : () ),
+    ]
+    );
+
+  return @seqs;
+}
+
+#####################################################################################################
+
+=head1 $int = fasta_seq_length($path)
+
+Given the path to a FASTA database, find the number of residues/bases in it. Counts whitespace as a residue.
+
+=cut
+
+sub fasta_seq_length {
+  my ($fn) = @_;
+  open my $fh, $fn or croak "Can't open file $fn: $!\n";
+
+  my $length = 0;
+  local $_, $/ = "\n";
+  while (<$fh>) {
+    next if /^>/;
+    chomp;
+    $length += tr///c;
+  }
+
+  return $length;
+}
diff --git a/jpred/lib/BLC.pm b/jpred/lib/BLC.pm

index 618bb43..42bf0ee 100755 (executable)
--- a/jpred/lib/BLC.pm
+++ b/jpred/lib/BLC.pm
@@ -5,9 +5,9 @@ use warnings;
  use Carp;
  
  use constant {
-       ID => 0,
-       TITLE => 1,
-       SEQ => 2
+  ID    => 0,
+  TITLE => 1,
+  SEQ   => 2
  };
  
  =head2 my $blc = new BLC;
@@ -15,13 +15,13 @@ use constant {
  =cut
  
  sub new {
-       my $proto = shift;
-       my $class = ref($proto) || $proto;
-       my $self = { 
-               _itteration => 0,
-               _max_itteration => 0,
-       };
-       return bless $self, $class;
+  my $proto = shift;
+  my $class = ref($proto) || $proto;
+  my $self  = {
+    _itteration     => 0,
+    _max_itteration => 0,
+  };
+  return bless $self, $class;
  }
  
  =head2 my $blc->read_file($file)
@@ -31,54 +31,56 @@ Read in a BLC file.
  =cut
  
  sub read_file {
-       my @seqs;
-       my $self = shift;
-       my ($fn) = @_;
-
-       open BLC, $fn or croak "$fn: $!\n";
-
-       while (<BLC>) {
-               chomp;
-               if (s/^>//) {
-                       s/\s*$//g;
-                       my ($id, $title) = split /\s+/, $_, 2;
-                       $title = '' unless $title;
-                       push @seqs, [ $id, $title ];
-               }
-
-               # This regex copes with odd variations in the start of
-               # the iterations line that marks the start of sequences
-               if (/^\s*\*\s*[Ii]teration:?\s*(\d+)\s*$/) {
-                       # The start position of the sequences is the same
-                       # as the offset of the asterix from the start of
-                       # the line
-                       my $start = index $_, '*', 0;
-                       my $iter = $1;
-                       croak "Iteration not greater than 0 in BLC file $fn" unless $iter > 0;
-
-                       while (<BLC>) {
-                               chomp;
-                               last if /^\s{$start}\*\s*$/;
-                               my $line = substr $_, $start, @seqs;
-
-                               foreach (0..$#seqs) {
-                                       # Not just $iter, as we need to
-                                       # leave room for the title
-                                       # and header
-                                       $seqs[$_]->[SEQ + $iter - 1] .= substr($line, $_, 1);
-                               }
-                       }
-               }
-       }
-       close BLC;
-       croak "No sequences found in BLC file $fn" unless @seqs;
-
-       foreach (@seqs) {
-               my ($id, $title, @seqs) = @{$_};
-               $title = '' unless defined $title;
-               $id = '' unless defined $id;
-               $self->set_sequence($id, $title, @seqs);
-       }
+  my @seqs;
+  my $self = shift;
+  my ($fn) = @_;
+
+  open BLC, $fn or croak "$fn: $!\n";
+
+  while (<BLC>) {
+    chomp;
+    if (s/^>//) {
+      s/\s*$//g;
+      my ( $id, $title ) = split /\s+/, $_, 2;
+      $title = '' unless $title;
+      push @seqs, [ $id, $title ];
+    }
+
+    # This regex copes with odd variations in the start of
+    # the iterations line that marks the start of sequences
+    if (/^\s*\*\s*[Ii]teration:?\s*(\d+)\s*$/) {
+
+      # The start position of the sequences is the same
+      # as the offset of the asterix from the start of
+      # the line
+      my $start = index $_, '*', 0;
+      my $iter = $1;
+      croak "Iteration not greater than 0 in BLC file $fn" unless $iter > 0;
+
+      while (<BLC>) {
+        chomp;
+        last if /^\s{$start}\*\s*$/;
+        my $line = substr $_, $start, @seqs;
+
+        foreach ( 0 .. $#seqs ) {
+
+          # Not just $iter, as we need to
+          # leave room for the title
+          # and header
+          $seqs[$_]->[ SEQ + $iter - 1 ] .= substr( $line, $_, 1 );
+        }
+      }
+    }
+  }
+  close BLC;
+  croak "No sequences found in BLC file $fn" unless @seqs;
+
+  foreach (@seqs) {
+    my ( $id, $title, @seqs ) = @{$_};
+    $title = '' unless defined $title;
+    $id    = '' unless defined $id;
+    $self->set_sequence( $id, $title, @seqs );
+  }
  }
  
  =head2 $blc->set_sequence($id, $title, @seq)
@@ -88,28 +90,28 @@ Add a BLC file to the object of $id, $title and @sequence, one sequence per iter
  =cut
  
  sub set_sequence {
-       my $self = shift;
-       my ($id, $title, @data) = @_;
-       push @{$self->{_seqs}}, [ $id, $title, @data ];
+  my $self = shift;
+  my ( $id, $title, @data ) = @_;
+  push @{ $self->{_seqs} }, [ $id, $title, @data ];
  }
  
  =head2 $blc->get_sequence($number)
  
-Returns a list of the ($id, $title, @sequences) where each member of @sequences is from the itterations, from first to final. Defaults to the first sequences.
+Returns a list of the ($id, $title, @sequences) where each member of @sequences 
+is from the itterations, from first to final. Defaults to the first sequences.
  
  =cut
  
  sub get_sequence {
-       my ($self, $number) = @_;
-       if (defined $number and $number > $self->get_num_seqs) {
-               croak "You're trying to retrive a sequence past than the end of the BLC file in get_sequence($number)";
-       }
-       elsif (defined $number and $self->get_num_seqs + $number < 0) {
-               croak "You're trying to retrive a sequence before the begining of the BLC file in get_sequence($number)";
-       }
-       $number = 0 unless defined $number;
-
-       return @{${$self->{_seqs}}[$number]};
+  my ( $self, $number ) = @_;
+  if ( defined $number and $number > $self->get_num_seqs ) {
+    croak "You're trying to retrive a sequence past than the end of the BLC file in get_sequence($number)";
+  } elsif ( defined $number and $self->get_num_seqs + $number < 0 ) {
+    croak "You're trying to retrive a sequence before the begining of the BLC file in get_sequence($number)";
+  }
+  $number = 0 unless defined $number;
+
+  return @{ ${ $self->{_seqs} }[$number] };
  }
  
  =head2 $blc->get_num_seqs()
@@ -119,20 +121,22 @@ Returns the number of sequences in the BLC file.
  =cut
  
  sub get_num_seqs {
-       my ($self) = @_;
-       return $#{$self->{_seqs}};
+  my ($self) = @_;
+  return $#{ $self->{_seqs} };
  }
  
  =head2 $blc->get_sequences($iteration)
  
-Returns all of the sequences in a block file for a particular itteration, in the same order as they occured in the block file. If left undefined, it will return the sequences from the first itteration.
+Returns all of the sequences in a block file for a particular itteration, 
+in the same order as they occured in the block file. If left undefined, 
+it will return the sequences from the first itteration.
  
  =cut
  
  sub get_sequences {
-       my ($self, $iteration) = @_;
-       $iteration = 0 unless $iteration and $iteration > 0;
-       return map { $_->[SEQ + $iteration] } @{$self->{_seqs}};
+  my ( $self, $iteration ) = @_;
+  $iteration = 0 unless $iteration and $iteration > 0;
+  return map { $_->[ SEQ + $iteration ] } @{ $self->{_seqs} };
  }
  
  =head2 $blc->get_seq_ids($number)
@@ -142,13 +146,12 @@ Returns the ID for the $number sequence to occur in the file, if left undefined
  =cut
  
  sub get_seq_ids {
-       my ($self, $number) = @_;
-       if (defined $number) {
-               return ${$self->{_seqs}[$number]}[ID];
-       }
-       else {
-               return map { $_->[ID] } @{$self->{_seqs}};
-       }
+  my ( $self, $number ) = @_;
+  if ( defined $number ) {
+    return ${ $self->{_seqs}[$number] }[ID];
+  } else {
+    return map { $_->[ID] } @{ $self->{_seqs} };
+  }
  }
  
  =head2 $blc->get_seq_titles($number)
@@ -158,13 +161,12 @@ Returns the titles for the number sequence to occur in the file, if left undefin
  =cut
  
  sub get_seq_titles {
-       my ($self, $number) = @_;
-       if (defined $number) {
-               return ${$self->{_seqs}[$number]}[TITLE];
-       }
-       else {
-               return map { $_->[TITLE] } @{$self->{_seqs}};
-       }
+  my ( $self, $number ) = @_;
+  if ( defined $number ) {
+    return ${ $self->{_seqs}[$number] }[TITLE];
+  } else {
+    return map { $_->[TITLE] } @{ $self->{_seqs} };
+  }
  }
  
  =head2 $blc->print_blc($fh);
@@ -174,30 +176,30 @@ This will print the BLC file object to the filehandle if given, otherwise to STD
  =cut
  
  sub print_blc {
-       my ($self, $fh) = @_;
-
-       if ($fh) { *OUT = $fh }
-       else { *OUT = *STDOUT }
-
-       # Print the IDs
-       print OUT ">$_\n" foreach $self->get_seq_ids;
-
-       # Get the sequences
-       #my @sequences = $self->get_sequences
-       my $i = 0;
-       while (1) {
-               my @sequences = $self->get_sequences($i);
-               last unless defined $sequences[0];
-               print OUT "* iteration ".($i + 1)."\n";
-               foreach my $j (0..length($sequences[0]) -1) {
-                       foreach (@sequences) {
-                               print OUT substr $_, $j, 1;
-                       }
-                       print OUT "\n";
-               }
-               print OUT "*\n";
-               $i++;
-       } 
+  my ( $self, $fh ) = @_;
+
+  if   ($fh) { *OUT = $fh }
+  else       { *OUT = *STDOUT }
+
+  # Print the IDs
+  print OUT ">$_\n" foreach $self->get_seq_ids;
+
+  # Get the sequences
+  #my @sequences = $self->get_sequences
+  my $i = 0;
+  while (1) {
+    my @sequences = $self->get_sequences($i);
+    last unless defined $sequences[0];
+    print OUT "* iteration " . ( $i + 1 ) . "\n";
+    foreach my $j ( 0 .. length( $sequences[0] ) - 1 ) {
+      foreach (@sequences) {
+        print OUT substr $_, $j, 1;
+      }
+      print OUT "\n";
+    }
+    print OUT "*\n";
+    $i++;
+  }
  }
  
  =head2 $blc->print_fasta($fh)
@@ -207,20 +209,20 @@ Prints the BLC file out in FASTA format, each sequence is 72 characters wide.
  =cut
  
  sub print_fasta {
-       my ($self, $fh) = @_;
+  my ( $self, $fh ) = @_;
  
-       if ($fh) { *OUT = $fh }
-       else { *OUT = *STDOUT }
+  if   ($fh) { *OUT = $fh }
+  else       { *OUT = *STDOUT }
  
-       my @ids = $self->get_seq_ids;
-       my @sequences = $self->get_sequences;
+  my @ids       = $self->get_seq_ids;
+  my @sequences = $self->get_sequences;
  
-       croak "Different number of sequences and IDs\n" unless @ids == @sequences;
-       foreach (0..$#ids) {
-               print OUT ">$ids[$_]\n";
-               $sequences[$_] =~ s/(.{72})/$1\n/g;
-               print OUT "$sequences[$_]\n";
-       }
+  croak "Different number of sequences and IDs\n" unless @ids == @sequences;
+  foreach ( 0 .. $#ids ) {
+    print OUT ">$ids[$_]\n";
+    $sequences[$_] =~ s/(.{72})/$1\n/g;
+    print OUT "$sequences[$_]\n";
+  }
  }
  
  =head2 $blc->next_itteration;
@@ -228,8 +230,8 @@ sub print_fasta {
  =cut
  
  sub next_itteration {
-       my ($self) = @_;
-       $self->itteration($self->itteration + 1);
+  my ($self) = @_;
+  $self->itteration( $self->itteration + 1 );
  }
  
  =head2 $blc->next_itteration;
@@ -237,8 +239,8 @@ sub next_itteration {
  =cut
  
  sub max_itteration {
-       my ($self) = @_;
-       return $self->{_max_itteration};
+  my ($self) = @_;
+  return $self->{_max_itteration};
  }
  
  =head2 $blc->itteration($number)
@@ -248,17 +250,14 @@ If $number is defined, sets the itteration to $number, otherwise returns the num
  =cut
  
  sub itteration {
-       my ($self, $itteration) = @_;
-       if (defined $itteration) {
-               if ($itteration < 1) {
-                       return undef;
-               }
-               #if ($itteration > $self->{_max_itteration};
-               #$self->{_itteration} = $itteration;
-       }
-       else {
-               return $self->{_itteration};
-       }
+  my ( $self, $itteration ) = @_;
+  if ( defined $itteration ) {
+    if ( $itteration < 1 ) {
+      return undef;
+    }
+  } else {
+    return $self->{_itteration};
+  }
  }
  
  1;
diff --git a/jpred/lib/DSSP/SCOP.pm b/jpred/lib/DSSP/SCOP.pm

index a05baca..9b0a00f 100644 (file)
--- a/jpred/lib/DSSP/SCOP.pm
+++ b/jpred/lib/DSSP/SCOP.pm
@@ -6,6 +6,7 @@ use Carp;
  use Scalar::Util qw(looks_like_number);
  
  use base qw(DSSP);
+use lib '..';
  use Utils qw($split_resid sort_resid);
  
  =head1 NAME
diff --git a/jpred/lib/Index/EMBOSS.pm b/jpred/lib/Index/EMBOSS.pm

index 4d2d06c..484c4f1 100644 (file)
--- a/jpred/lib/Index/EMBOSS.pm
+++ b/jpred/lib/Index/EMBOSS.pm
@@ -14,38 +14,40 @@ use FASTA::File;
  sub read_index { 1 }
  
  sub get_sequence {
-       my ($self, $key) = @_;
-       croak "No value for get_sequence" unless $key;
-
-       my @cmd = split / /, "seqret -filter $key";
-
-       my $pid = open3(undef, \*RD, \*ERR, @cmd);
-
-       my $seqs = FASTA::File->new(read => \*RD);
-       my @err = <ERR>;
-
-       pop @err;
-       pop @err;
-
-       close RD; close ERR;
-       waitpid $pid, 0;
-       
-       # Everything was okay...
-       if (WIFEXITED($?) and not WEXITSTATUS($?)) { return $seqs }
-       # Non-zero exit
-       elsif (WIFEXITED($?) and WEXITSTATUS($?)) {
-               carp "seqret had a problem: $?; $!";
-               carp @err;
-       }
-       # Was it stopped by an external program
-       elsif (WIFSIGNALED($?)) {
-               carp "seqret halted by external signal ".WTERMSIG($?)
-       }
-       else {
-               carp "seqret suffered from a random pantwetting event"
-       }
-
-       return undef;
+  my ( $self, $key ) = @_;
+  croak "No value for get_sequence" unless $key;
+
+  my @cmd = split / /, "seqret -filter $key";
+
+  my $pid = open3( undef, \*RD, \*ERR, @cmd );
+
+  my $seqs = FASTA::File->new( read => \*RD );
+  my @err = <ERR>;
+
+  pop @err;
+  pop @err;
+
+  close RD;
+  close ERR;
+  waitpid $pid, 0;
+
+  # Everything was okay...
+  if ( WIFEXITED($?) and not WEXITSTATUS($?) ) { return $seqs }
+
+  # Non-zero exit
+  elsif ( WIFEXITED($?) and WEXITSTATUS($?) ) {
+    carp "seqret had a problem: $?; $!";
+    carp @err;
+  }
+
+  # Was it stopped by an external program
+  elsif ( WIFSIGNALED($?) ) {
+    carp "seqret halted by external signal " . WTERMSIG($?);
+  } else {
+    carp "seqret suffered from a random pantwetting event";
+  }
+
+  return undef;
  }
  
  1;
diff --git a/jpred/lib/Index/FastaCMD.pm b/jpred/lib/Index/FastaCMD.pm

index 0d428b9..d937b8b 100644 (file)
--- a/jpred/lib/Index/FastaCMD.pm
+++ b/jpred/lib/Index/FastaCMD.pm
@@ -8,7 +8,10 @@ Index::FastaCMD - module to use the fastacmd program to read BLAST formatted dat
  
  =head1 DESCRIPTION
  
-This module was written as a replacement for Index::EMBOSS as EMBOSS needed to be statically linked to libgd, whcih wasn't a very sysadmin-friendly way of installing the software. As BLAST is pretty ubiquitous the fastacmd was deemed to be a better option. Copied heavily from Index::EMBOSS.
+This module was written as a replacement for Index::EMBOSS as Emboss needed to be statically 
+linked to libgd, whcih was is a very sysadmin-friendly way of installing the software. 
+As BLAST is pretty ubiquitous the fastacmd was deemed to be a better option. Copied heavily 
+from Index::EMBOSS.
  
  =head1 SYNOPSIS
  
@@ -18,7 +21,9 @@ This module was written as a replacement for Index::EMBOSS as EMBOSS needed to b
  
  =item 0.2
  
-Added 'use Path' module to ensure that the correct fastacmd binary is used. Previously on the cluster the wrong fastacmd was used, which resulted in a failure. Now is more robust although the path to fastacmd is hardcoded in Paths.pm
+Added 'use Path' module to ensure that the correct fastacmd binary is used. Previously on the 
+cluster the wrong fastacmd was used, which resulted in a failure. Now is more robust although 
+the path to fastacmd is hardcoded in Paths.pm
  
  =head1 AUTHOR
  
@@ -26,11 +31,9 @@ Chris Cole <christian@cole.name>
  
  =cut
  
-
  use strict;
  use warnings;
  
-
  use Carp;
  use POSIX qw(WIFEXITED WEXITSTATUS WIFSIGNALED WTERMSIG);
  use IPC::Open3;
@@ -41,42 +44,42 @@ use FASTA::File;
  use Paths qw($fastacmd);
  
  sub get_sequence {
-   my ($self, $key, $db) = @_;
-   
-   my $appName = $fastacmd;
-   
-   croak "No sequence code given for get_sequence" unless $key;
-   croak "No database given for get_sequence" unless $db;
-   
-   my @cmd = split / /, "$appName -s $key -d $db";
-
-   my $pid = open3(undef, \*RD, \*ERR, @cmd);
-
-   my $seq = FASTA::File->new(read => \*RD);
-   my @err = <ERR>;
-
-   pop @err;
-   pop @err;
-
-   close RD; close ERR;
-   waitpid $pid, 0;
-   
-   # Everything was okay...
-   if (WIFEXITED($?) and not WEXITSTATUS($?)) { return $seq }
-   # Non-zero exit
-   elsif (WIFEXITED($?) and WEXITSTATUS($?)) {
-      carp "Command: '@cmd' had a problem: $?; $!";
-      carp @err;
-   }
-   # Was it stopped by an external program
-   elsif (WIFSIGNALED($?)) {
-      carp "$appName halted by external signal ".WTERMSIG($?)
-   }
-   else {
-      carp "$appName suffered from a random pantwetting event"
-   }
-
-   return undef;
+  my ( $self, $key, $db ) = @_;
+
+  croak "No sequence code given for get_sequence" unless $key;
+  croak "No database given for get_sequence"      unless $db;
+
+  my @cmd = split / /, "$fastacmd -s $key -d $db";
+
+  my $pid = open3( undef, \*RD, \*ERR, @cmd );
+
+  my $seq = FASTA::File->new( read => \*RD );
+  my @err = <ERR>;
+
+  pop @err;
+  pop @err;
+
+  close RD;
+  close ERR;
+  waitpid $pid, 0;
+
+  # Everything was okay...
+  if ( WIFEXITED($?) and not WEXITSTATUS($?) ) { return $seq }
+
+  # Non-zero exit
+  elsif ( WIFEXITED($?) and WEXITSTATUS($?) ) {
+    carp "Command: '@cmd' had a problem: $?; $!";
+    carp @err;
+  }
+
+  # Was it stopped by an external program
+  elsif ( WIFSIGNALED($?) ) {
+    carp "$fastacmd halted by external signal " . WTERMSIG($?);
+  } else {
+    carp "$fastacmd suffered from a random pantwetting event";
+  }
+
+  return undef;
  }
  
  1;
diff --git a/jpred/lib/Jpred.pm b/jpred/lib/Jpred.pm

index 7119d28..17f6bc1 100755 (executable)
--- a/jpred/lib/Jpred.pm
+++ b/jpred/lib/Jpred.pm
@@ -13,36 +13,37 @@ BEGIN {
    use Exporter;
    our @ISA = ('Exporter');
    our @EXPORT = qw(
-    $WEBSERVER
-    $WEBSERVERCGI
-    $SERVERROOT
-    $SRSSERVER
-    $CHKLOG
-    $RESULTS
-    $PDBLNK
-    $CSS
-    $IMAGES
-    $JNET
-    $TIMEOUT
-    $BATCHLIM
-    $DUNDEE
-    $JPREDUSER
-    $JPREDEMAIL
-    $MAILHOST
-    $JPREDROOT
-    $BINDIR
-    $LIBDIR
-    $JOBDIR
-    $PREFIX
-    $RESOURCE
-    $BLASTDB
-    $SWALL
-    $SWALLFILT
-    $PDB
-    $PDB_DAT
-    $JPREDHEAD
-    $JPREDFOOT
-    &xsystem
+  $WEBSERVER
+  $WEBSERVERCGI
+  $SERVERROOT
+  $SRSSERVER
+  $CHKLOG
+  $RESULTS
+  $PDBLNK
+  $CSS
+  $IMAGES
+  $JNET
+  $TIMEOUT
+  $BATCHLIM
+  $DUNDEE
+  $JPREDUSER
+  $JPREDEMAIL
+  $MAILHOST
+  $JPREDROOT
+  $BINDIR
+  $LIBDIR
+  $JOBDIR
+  $PREFIX
+  $RESOURCE
+  $BLASTDB
+  $SWALL
+  $SWALLFILT
+  $PDB
+  $PDB_DAT
+  $JPREDHEAD
+  $JPREDFOOT
+  xsystem
+  setup_jpred_env
    );
    our @EXPORT_OK = @EXPORT;
  }
@@ -52,9 +53,8 @@ BEGIN {
  use lib '/sw/lib/perl5.10.1/lib/perl5';
  
  # URIs
-our $WEBSERVER = 'http://www.compbio.dundee.ac.uk/www-jpred';
-
-#our $WEBSERVER    = 'http://webserv1.cluster.lifesci.dundee.ac.uk:3209';
+#our $WEBSERVER    = 'http://www.compbio.dundee.ac.uk/www-jpred';
+our $WEBSERVER    = 'http://webserv1.cluster.lifesci.dundee.ac.uk:3209';
  our $WEBSERVERCGI = "$WEBSERVER/cgi-bin";
  
  #$SERVERROOT = "$WEBSERVER/~www-jpred";
@@ -79,9 +79,9 @@ our $JPREDEMAIL = 'www-jpred@compbio.dundee.ac.uk';
  our $MAILHOST   = 'smtp.lifesci.dundee.ac.uk';        # CC 19/05/06 - updated to current smtp host from weevil
  
  # Server paths
-our $JPREDROOT = '/homes/www-jpred/live';
-
+#our $JPREDROOT = '/homes/www-jpred/live';
  #our $JPREDROOT = '/homes/www-jpred/devel';
+our $JPREDROOT = '/home/asherstnev/Projects/Jpred.project/jpred/branches/portable';
  
  # Directory for binaries either on the cluster or on the www server
  our $BINDIR = "$JPREDROOT/bin";
@@ -90,11 +90,11 @@ our $BINDIR = "$JPREDROOT/bin";
  our $LIBDIR = "$JPREDROOT/lib";
  
  # Cluster paths
-our $JOBDIR = "$JPREDROOT/public_html/results";    # directory for output
+our $JOBDIR = "$JPREDROOT/public_html/results";       # directory for output
  
  # Cluster names
-our $PREFIX   = "jp_";                             # Prefix for job submissions (qstat will only display 10 chars of job name)
-our $RESOURCE = "www_service2";                    # Resource for the submission to use
+our $PREFIX   = "jp_";                                # Prefix for job submissions (qstat will only display 10 chars of job name)
+our $RESOURCE = "www_service2";                       # Resource for the submission to use
  
  # Variables for external programs
  # psiblast
@@ -109,6 +109,22 @@ our $PDB_DAT   = '/db/blastdb/DB.dat';
  # ncoils matrix location
  $ENV{COILSDIR} = "$JPREDROOT/data/coils";
  
+sub setup_jpred_env {
+  my $newJPREDROOT = shift;
+
+  $JPREDROOT = $newJPREDROOT if (defined $newJPREDROOT);
+
+  $BINDIR = "$JPREDROOT/bin";
+  $LIBDIR = "$JPREDROOT/lib";
+  $JOBDIR = "$JPREDROOT/public_html/results";
+
+  $ENV{BLASTMAT} = "$JPREDROOT/data/blast";
+  $BLASTDB = $JPREDROOT . "/databases";
+  $ENV{BLASTDB} = $BLASTDB;
+  $SWALL     = "$BLASTDB/uniref90";
+  $SWALLFILT = "$SWALL.filt";
+}
+
  # Error checking system call
  sub xsystem {
    my ($command) = @_;
diff --git a/jpred/lib/OC.pm b/jpred/lib/OC.pm

index 436285c..61ac1b4 100644 (file)
--- a/jpred/lib/OC.pm
+++ b/jpred/lib/OC.pm
@@ -31,28 +31,27 @@ Reads an OC file from a filehandle.
  =cut
  
  sub read {
-       my ($self, $fh) = @_;
-
-       local $/ = "\n";
-
-       while (<$fh>) {
-               chomp;
-               next if /^\s*$/;
-
-               if (s/^##\s*//) {
-                       my ($num, $score, $size) = split;
-                       my $nl = <$fh>;
-                       $nl =~ s/^\s+//;
-                       my (@labels) = map { chomp; $_ } split / /, $nl;
-
-                       # Add to self
-                       $self->add_group($num, $score, $size, @labels);
-               }
-               elsif (/^UNCLUSTERED ENTITIES$/) {
-                       my (@labels) = map { chomp; $_ } <$fh>;
-                       $self->add_unclustered(@labels);
-               }
-       }
+  my ( $self, $fh ) = @_;
+
+  local $/ = "\n";
+
+  while (<$fh>) {
+    chomp;
+    next if /^\s*$/;
+
+    if (s/^##\s*//) {
+      my ( $num, $score, $size ) = split;
+      my $nl = <$fh>;
+      $nl =~ s/^\s+//;
+      my (@labels) = map { chomp; $_ } split / /, $nl;
+
+      # Add to self
+      $self->add_group( $num, $score, $size, @labels );
+    } elsif (/^UNCLUSTERED ENTITIES$/) {
+      my (@labels) = map { chomp; $_ } <$fh>;
+      $self->add_unclustered(@labels);
+    }
+  }
  }
  
  =head $oc->add_group($number, $score, $size, @labels)
@@ -62,17 +61,17 @@ Add information about a group.
  =cut
  
  sub add_group {
-       my ($self, $num, $score, $size, @labels) = @_;
+  my ( $self, $num, $score, $size, @labels ) = @_;
  
-       for (qw(num score size)) {
-               croak "No value for $_ passed to add_group" unless eval "defined \$$_"
-       }
+  for (qw(num score size)) {
+    croak "No value for $_ passed to add_group" unless eval "defined \$$_";
+  }
  
-       croak "No labels passed to add_group" unless @labels;
+  croak "No labels passed to add_group" unless @labels;
  
-       $self->{__PACKAGE__."score"}{$num} = $score;
-       $self->{__PACKAGE__."size"}{$num} = $size;
-       $self->{__PACKAGE__."labels"}{$num} = [ @labels ];
+  $self->{ __PACKAGE__ . "score" }{$num}  = $score;
+  $self->{ __PACKAGE__ . "size" }{$num}   = $size;
+  $self->{ __PACKAGE__ . "labels" }{$num} = [@labels];
  }
  
  =head2 $oc->add_unclustered(@labels)
@@ -82,8 +81,8 @@ Adds those entities that are unclustered.
  =cut
  
  sub add_unclustered {
-       my ($self, @labels) = @_;
-       $self->{__PACKAGE__."unclust"} = \@labels;
+  my ( $self, @labels ) = @_;
+  $self->{ __PACKAGE__ . "unclust" } = \@labels;
  }
  
  =head2 $oc->get_unclustered
@@ -93,8 +92,8 @@ Returns those unclustered entities as a list.
  =cut
  
  sub get_unclustered {
-       my ($self) = @_;
-       return @{$self->{__PACKAGE__."unclust"}} if defined $self->{__PACKAGE__."unclust"};
+  my ($self) = @_;
+  return @{ $self->{ __PACKAGE__ . "unclust" } } if defined $self->{ __PACKAGE__ . "unclust" };
  }
  
  =head2 ($score, $size, @labels) = $oc->get_group($n);
@@ -104,22 +103,20 @@ Returns information about a particular group. If the group doesn't exist you get
  =cut
  
  sub get_group {
-       my ($self, $num) = @_;
-       if (defined $num) {
-               if (exists $self->{__PACKAGE__."score"}{$num}) {
-                       return 
-                               $self->{__PACKAGE__."score"}{$num},
-                               $self->{__PACKAGE__."size"}{$num},
-                               @{ $self->{__PACKAGE__."labels"}{$num} };
-               }
-               else {
-                       carp "No such group '$num'";
-                       return undef;
-               }
-       }
-       else {
-               croak "No value passed to get_group";
-       }
+  my ( $self, $num ) = @_;
+  if ( defined $num ) {
+    if ( exists $self->{ __PACKAGE__ . "score" }{$num} ) {
+      return
+        $self->{ __PACKAGE__ . "score" }{$num},
+        $self->{ __PACKAGE__ . "size" }{$num},
+        @{ $self->{ __PACKAGE__ . "labels" }{$num} };
+    } else {
+      carp "No such group '$num'";
+      return undef;
+    }
+  } else {
+    croak "No value passed to get_group";
+  }
  }
  
  =head1 @info = $oc->get_groups;
@@ -129,11 +126,9 @@ Returns information about all of the groups. This is an array of arrays, the sec
  =cut
  
  sub get_groups {
-       my ($self) = @_;
+  my ($self) = @_;
  
-       map {
-               [ $_, $self->get_group($_) ]
-       } sort keys %{ $self->{__PACKAGE__."score"} };
+  map { [ $_, $self->get_group($_) ] } sort keys %{ $self->{ __PACKAGE__ . "score" } };
  }
  
  =head1 $oc->run();
@@ -141,23 +136,23 @@ sub get_groups {
  =cut
  
  sub run {
-       my ($self, $file) = @_;
-       
-       local $/ = undef;
-       local $| = 1;
+  my ( $self, $file ) = @_;
  
-       my $pid = open3(\*WRT, \*RD, \*ERR, $self->path);
+  local $/ = undef;
+  local $| = 1;
  
-       print WRT $file;
-       close WRT;
+  my $pid = open3( \*WRT, \*RD, \*ERR, $self->path );
  
-       my @output = join "\n", split "\n", <RD>;
-       close RD;
+  print WRT $file;
+  close WRT;
  
-       waitpid $pid, 0;
-       check($self->path, $?) or die "OC was naughty";
+  my @output = join "\n", split "\n", <RD>;
+  close RD;
  
-       return @output;
+  waitpid $pid, 0;
+  check( $self->path, $? ) or die "OC was naughty";
+
+  return @output;
  }
  
  1;
diff --git a/jpred/lib/PSIBLAST.pm b/jpred/lib/PSIBLAST.pm

index 04818b4..e470e63 100644 (file)
--- a/jpred/lib/PSIBLAST.pm
+++ b/jpred/lib/PSIBLAST.pm
@@ -34,106 +34,105 @@ Reads a PSIBLAST file from a filehandle.
  =cut
  
  sub read {
-       my ($self, $fh) = @_;
+  my ( $self, $fh ) = @_;
  
-       croak "No filehandle passed to method read" unless ref $fh eq 'GLOB';
+  croak "No filehandle passed to method read" unless ref $fh eq 'GLOB';
  
-       # Make sure that $/ is a defined value
-       local $/ = "\n";
+  # Make sure that $/ is a defined value
+  local $/ = "\n";
  
-       $self->_blastpgp_parse($fh);
+  $self->_blastpgp_parse($fh);
  }
  
  sub _blastpgp_parse {
-       my ($self, $fh) = @_;
-
-       local $_;
-       my $version = <$fh>;
-       my $pos;
-
-       #die "Wrong version of BLASTP" if $version !~ /BLASTP 2.2.6 \[Apr-09-2003\]/;
-
-       # Find the position of the last itteration
-       while (<$fh>) {
-               <$fh>, $pos = tell $fh if /^Sequences used in model and found again:/
-       }
-
-       # and make sure we found it...
-       unless ($pos) { $self->{psi} = undef, return }
-       seek $fh, $pos, 0;
-
-       # Now read in the last itteration
-       # @alignments holds the lines containing the aligment
-       # @order is a list of the IDs
-       # $flag indicates that the ID's have been collected
-       #
-       # All of this has to be list based as there may be multiple local
-       # alignments against the same sequence
-       my (@alignments, @order, $flag);
-
-       while (<$fh>) {
-               # Have we reached the end of the alignment
-               last if /^\s*Database: /;
-
-               # Skip babble
-               next if /^Sequences not found previously or not previously below threshold:/;
-               #next if /^\s*$/;
-
-               chomp;
-               # Capture E scores and check to see if we've reached the start of the alignment
-               unless (/^QUERY\s*/ or @alignments) {
-                       next if /^$/;
-                       my ($id, $bit, $e) = unpack "A70A3A*", $_;
-                       ($id) = (split /\s+/, $id)[0];
-                       s/\s*//g for $bit, $e;
-
-                       # Store the scores
-                       $self->{$id}{bit} = $bit;
-                       $self->{$id}{evalue} = $e;
-                       next;
-               }
-
-               # Have we reached the end of the first block of the
-               # alignment
-               $flag = 1, next if /^$/;
-
-               # Add IDs if we're still in the first block
-               push @order, (split)[0] unless $flag;
-               # Add alignment lines
-               push @alignments, $_;
-       }
-       
-       $self->size(scalar @order);
-
-       # Add sequences and start positions to self 
-       for (0..$#alignments) {
-               my $i = $_ % @order;
-               my @fields = split ' ', $alignments[$_], 4;
-
-               # blastpgp output allways has a ID at the begining of the line, but can
-               # have a variable number of fields after that. e.g.:
-# $seqid $start $seq                                                         $end
-# O24727        ------------------------------------------------------------
-# O24727   0    ------------------------------------------------------------
-# O24727   26   -Y--A---A-----L-----R----S-------L---------G-------P----V--- 35
-
-               if (@fields == 4 or @fields == 3) {
-                       $self->{psi}{$i}{seq} .= $fields[2];
-                       $self->{psi}{$i}{start} = $fields[1]
-                               unless defined $self->{psi}{$i}{start};
-               }
-               elsif (@fields == 2) { $self->{psi}{$i}{seq} .= $fields[1] }
-               else {
-                       croak "Fatal error! Wrong number of fields in BLAST alignment:\n$alignments[$_]\n"
-               }
-       }
-       
-       # Add IDs
-       for (0..$#order) {
-               $self->{psi}{$_}{id} = $order[$_];
-       }
-
-       1;
+  my ( $self, $fh ) = @_;
+
+  local $_;
+  my $version = <$fh>;
+  my $pos;
+
+  # Find the position of the last itteration
+  while (<$fh>) {
+    <$fh>, $pos = tell $fh if /^Sequences used in model and found again:/;
+  }
+
+  # and make sure we found it...
+  unless ($pos) { $self->{psi} = undef, return }
+  seek $fh, $pos, 0;
+
+  # Now read in the last itteration
+  # @alignments holds the lines containing the aligment
+  # @order is a list of the IDs
+  # $flag indicates that the ID's have been collected
+  #
+  # All of this has to be list based as there may be multiple local
+  # alignments against the same sequence
+  my ( @alignments, @order, $flag );
+
+  while (<$fh>) {
+
+    # Have we reached the end of the alignment
+    last if /^\s*Database: /;
+
+    # Skip babble
+    next if /^Sequences not found previously or not previously below threshold:/;
+
+    chomp;
+
+    # Capture E scores and check to see if we've reached the start of the alignment
+    unless ( /^QUERY\s*/ or @alignments ) {
+      next if /^$/;
+      my ( $id, $bit, $e ) = unpack "A70A3A*", $_;
+      ($id) = ( split /\s+/, $id )[0];
+      s/\s*//g for $bit, $e;
+
+      # Store the scores
+      $self->{$id}{bit}    = $bit;
+      $self->{$id}{evalue} = $e;
+      next;
+    }
+
+    # Have we reached the end of the first block of the alignment
+    $flag = 1, next if /^$/;
+
+    # Add IDs if we're still in the first block
+    push @order, (split)[0] unless $flag;
+
+    # Add alignment lines
+    push @alignments, $_;
+  }
+
+  $self->size( scalar @order );
+
+  # Add sequences and start positions to self
+  for ( 0 .. $#alignments ) {
+    my $i = $_ % @order;
+    my @fields = split ' ', $alignments[$_], 4;
+
+    # blastpgp output allways has a ID at the begining of the line, but can
+    # have a variable number of fields after that. e.g.:
+    # $seqid $start $seq                                                         $end
+    # O24727        ------------------------------------------------------------
+    # O24727   0    ------------------------------------------------------------
+    # O24727   26   -Y--A---A-----L-----R----S-------L---------G-------P----V--- 35
+
+    if ( @fields == 4 or @fields == 3 ) {
+      $self->{psi}{$i}{seq} .= $fields[2];
+      $self->{psi}{$i}{start} = $fields[1]
+        unless defined $self->{psi}{$i}{start};
+    } elsif ( @fields == 2 ) {
+      $self->{psi}{$i}{seq} .= $fields[1];
+    } else {
+      croak "Fatal error! Wrong number of fields in BLAST alignment:\n$alignments[$_]\n";
+    }
+  }
+
+  # Add IDs
+  for ( 0 .. $#order ) {
+    $self->{psi}{$_}{id} = $order[$_];
+  }
+
+  1;
  }
  
  =head2 @ids = $psi->get_ids
@@ -143,9 +142,10 @@ The IDs that were in the last iteration in the order they appeared.
  =cut
  
  sub get_ids {
-       my ($self) = @_;
-       #return map { $self->{psi}{$_}{id} } sort { $a <=> $b } keys %{$self->{psi}}
-       return map { $self->{psi}{$_}{id} } 0..$self->size - 1;
+  my ($self) = @_;
+
+  #return map { $self->{psi}{$_}{id} } sort { $a <=> $b } keys %{$self->{psi}}
+  return map { $self->{psi}{$_}{id} } 0 .. $self->size - 1;
  }
  
  =head2 @alignments = $psi->get_alignments
@@ -155,9 +155,10 @@ The alignment from the last iteration in the same order as they appeared.
  =cut
  
  sub get_alignments {
-       my ($self) = @_;
-       #return map { $self->{psi}{$_}{seq} } sort { $a <=> $b } keys %{$self->{psi}};
-       return map { $self->{psi}{$_}{seq} } 0..$self->size - 1;
+  my ($self) = @_;
+
+  #return map { $self->{psi}{$_}{seq} } sort { $a <=> $b } keys %{$self->{psi}};
+  return map { $self->{psi}{$_}{seq} } 0 .. $self->size - 1;
  }
  
  =head2 @starts = $psi->get_starts
@@ -167,8 +168,8 @@ The start position of the first residue from the alignments, returned in the sam
  =cut
  
  sub get_starts {
-       my ($self) = @_;
-       return map { $self->{psi}{$_}{start} } sort { $a <=> $b } keys %{$self->{psi}};
+  my ($self) = @_;
+  return map { $self->{psi}{$_}{start} } sort { $a <=> $b } keys %{ $self->{psi} };
  }
  
  =head2 @all = $psi->get_all
@@ -178,13 +179,13 @@ Returns an array of arrays containing the ID, start position and alignment from
  =cut
  
  sub get_all {
-       my ($self) = @_;
+  my ($self) = @_;
  
-       my @ids = $self->get_ids;
-       my @starts = $self->get_starts;
-       my @alignments = $self->get_alignments;
+  my @ids        = $self->get_ids;
+  my @starts     = $self->get_starts;
+  my @alignments = $self->get_alignments;
  
-       return map { [ $ids[$_], $starts[$_], $alignments[$_] ] } 0..$#ids
+  return map { [ $ids[$_], $starts[$_], $alignments[$_] ] } 0 .. $#ids;
  }
  
  =head2 $psi->evalue($label)
@@ -192,10 +193,10 @@ sub get_all {
  =cut
  
  sub evalue {
-       my ($self, $label) = @_;
-       defined $label or confess "No label passed\n";
-       exists $self->{evalue}{$label} or warn "No such label '$label'\n" and return undef;
-       return $self->{evalue}{$label};
+  my ( $self, $label ) = @_;
+  defined $label or confess "No label passed\n";
+  exists $self->{evalue}{$label} or warn "No such label '$label'\n" and return undef;
+  return $self->{evalue}{$label};
  }
  
  =head2 $psi->bit($label)
@@ -203,10 +204,10 @@ sub evalue {
  =cut
  
  sub bit {
-       my ($self, $label) = @_;
-       defined $label or confess "No label passed\n";
-       exists $self->{bit}{$label} or warn "No such label '$label'\n" and return undef;
-       return $self->{bit}{$label};
+  my ( $self, $label ) = @_;
+  defined $label or confess "No label passed\n";
+  exists $self->{bit}{$label} or warn "No such label '$label'\n" and return undef;
+  return $self->{bit}{$label};
  }
  
  =head2 $psi->size
@@ -216,14 +217,13 @@ Returns the number of sequences in the alignments.
  =cut
  
  sub size {
-       my ($self, $size) = @_;
-
-       unless (defined $size) {
-               exists $self->{size} and return $self->{size};
-       }
-       else {
-               $self->{size} = $size;
-       }
+  my ( $self, $size ) = @_;
+
+  unless ( defined $size ) {
+    exists $self->{size} and return $self->{size};
+  } else {
+    $self->{size} = $size;
+  }
  }
  
  =head2 BUGS
diff --git a/jpred/lib/PSIBLAST/Run.pm b/jpred/lib/PSIBLAST/Run.pm

index bf74c71..56cb471 100644 (file)
--- a/jpred/lib/PSIBLAST/Run.pm
+++ b/jpred/lib/PSIBLAST/Run.pm
@@ -16,11 +16,8 @@ sub new {
    # -b max number of alignments reported (default 250)
    # -v max number of sequences described (default 500)
    # -j max number of itterations (default 1)
-  $self->args("-e0.05 -h0.01 -m6 -b10000 -v10000 -j3");
-
-  #$self->args("-a2 -e0.05 -h0.01 -m6 -b20000 -v20000 -j15");
-  #    $self->BLASTMAT("/software/jpred_bin/blast");
-  #    $self->BLASTDB("/software/jpred_uniprot_all_filt");
+  # $self->args("-e0.05 -h0.01 -m6 -b10000 -v10000 -j3");
+  # $self->args("-a2 -e0.05 -h0.01 -m6 -b20000 -v20000 -j15");
  
    # Automatically run any arguments passed to the constructor
    for ( keys %args ) {
@@ -37,7 +34,7 @@ sub database { defined $_[1] ? $_[0]->{data}   = "-d $_[1]" : $_[0]->{data} }
  sub input    { defined $_[1] ? $_[0]->{input}  = "-i $_[1]" : $_[0]->{input} }
  sub output   { defined $_[1] ? $_[0]->{output} = "-o $_[1]" : $_[0]->{output} }
  sub matrix   { defined $_[1] ? $_[0]->{matrix} = "-Q $_[1]" : $_[0]->{matrix} }
-sub debug    { defined $_[1] ? $_[0]->{debug}  = $_[1]      : $_[0]->{debug} }    # CC corrected - now works as expected. Before, debug was always on.
+sub debug    { defined $_[1] ? $_[0]->{debug}  = $_[1]      : $_[0]->{debug} }
  sub BLASTMAT { $ENV{BLASTMAT} = $_[1] }
  sub BLASTDB  { $ENV{BLASTDB}  = $_[1] }
  
@@ -59,11 +56,7 @@ sub run {
    my $cmd = join " ", @cmd;
  
    # Execute PSIBLAST and check it ran okay
-  if ( $self->debug ) {
-
-    #for (keys %ENV) { warn "$_=$ENV{$_}\n" }
-    warn "$cmd\n";
-  }
+  warn "$cmd\n" if ( $self->debug );
  
    system($cmd) == 0 or check( "blastpgp", $? ) and die "blastpgp was naughty";
  
diff --git a/jpred/lib/Pairwise.pm b/jpred/lib/Pairwise.pm

index 370d226..e8abdb2 100644 (file)
--- a/jpred/lib/Pairwise.pm
+++ b/jpred/lib/Pairwise.pm
@@ -3,8 +3,6 @@ package Pairwise;
  use strict;
  use warnings;
  use Carp;
-use IPC::Open3;
-use UNIVERSAL qw(isa);
  use File::Temp;
  use base qw(Root Common);
  
@@ -12,17 +10,40 @@ use Run qw(check);
  
  sub path {
    my ( $self, $path ) = @_;
-  if ( defined $path ) { $self->{path} = $path }
-  else {
-    if   ( defined $self->{path} ) { return $self->{path} }
-    else                           { croak "Path not defined" }
+  if ( defined $path ) {
+    $self->{path} = $path;
+  } else {
+    if ( defined $self->{path} ) {
+      return $self->{path};
+    } else {
+      croak "Pairwise::run: path to pairwise not defined";
+    }
    }
  }
  
  sub run {
    my ( $self, $fasta ) = @_;
  
-  croak "Non FASTA::File object passed to Pairwise::run" unless isa $fasta, 'FASTA::File';
+  local $/ = undef;
+  local $? = 0;
+
+  my $f1 = File::Temp->new->filename;
+  my $f2 = File::Temp->new->filename;
+  $fasta->write_file($f1);
+  my $pairwise = $self->path;
+  system("$pairwise $f1 > $f2");
+  check( $pairwise, $? ) or croak "Pairwise::run: $pairwise was naughty\n";
+  open( my $fh, "<", $f2 );
+  my @output = join "\n", split "\n", <$fh>;
+  close $fh;
+  unlink $f1;
+  unlink $f2;
+
+  return @output;
+}
+
+sub old_run {
+  my ( $self, $fasta ) = @_;
  
    local ( $/, $? ) = ( undef, 0 );
  
diff --git a/jpred/lib/Paths.pm b/jpred/lib/Paths.pm

index 7ca2847..9a51953 100644 (file)
--- a/jpred/lib/Paths.pm
+++ b/jpred/lib/Paths.pm
@@ -11,34 +11,116 @@ Paths - Sets paths for executable programs
  
  =head1 DESCRIPTION
  
-This module gathers together all of the little pieces of information that would other wise be floating around in all of the other modules that run external programs. Namely, the path to the executable and nessecery environment variables. 
+This module gathers together all of the little pieces of information that would other wise be 
+floating around in all of the other modules that run external programs. Namely, the path to 
+the executable and nessecery environment variables. 
  
-Putting it all here should mean that this is the only file that needs updating when their location changes, or it's redeployed. Plus some degree of automagic can be used to try and detect changes.
+Putting it all here should mean that this is the only file that needs updating when their 
+location changes, or it's redeployed. Plus some degree of automagic can be used to try 
+and detect changes.
  
  =cut
  
-our @EXPORT_OK = qw($ff_bignet $analyze $batchman $sov $pairwise $oc $jnet $fastacmd $hmmbuild $hmmconvert $psiblastbin);
+our @EXPORT_OK = qw(
+  $ff_bignet
+  $analyze
+  $batchman
+  $sov
+  $pairwise
+  $oc
+  $jnet
+  $fastacmd
+  $hmmbuild
+  $hmmconvert
+  $psiblastbin
+  $alscript
+  $readseq
+  check_OS
+  setup_env
+);
  
  my $HOME = $ENV{HOME};
+#
  # main production path
-#my $BINDIR = '/homes/www-jpred/live/jpred/bin';
+#my $SOFTDIR = '/homes/www-jpred/live/jpred/bin';
+#my $platform_dir = "x86_64";
+#
  # development path
-my $BINDIR = '/homes/www-jpred/devel/jpred/bin';
-
-our $pairwise  = "$BINDIR/pairwise";  # CC modified for correct path
-our $oc        = "$BINDIR/oc";
-our $jnet      = "$BINDIR/jnet";
-our $fastacmd  = "$BINDIR/fastacmd";              # CC added to avoid failure on cluster
-our $hmmbuild  = "$BINDIR/hmmbuild";
-our $hmmconvert = "$BINDIR/hmmconvert";
-our $psiblastbin  = "$BINDIR/blastpgp";
+#my $SOFTDIR = '/homes/www-jpred/devel/jpred/bin';
+#my $platform_dir = "x86_64";
+#
+# my laptop test path
+my $SOFTDIR       = '/home/asherstnev/Projects/Jpred.project/jpred/branches/portable';
+my $platform_name = "x86_64";
+
+our $pairwise    = "$SOFTDIR/$platform_name/pairwise";
+our $oc          = "$SOFTDIR/$platform_name/oc";
+our $jnet        = "$SOFTDIR/$platform_name/jnet";
+our $fastacmd    = "$SOFTDIR/$platform_name/fastacmd";
+our $hmmbuild    = "$SOFTDIR/$platform_name/hmmbuild";
+our $hmmconvert  = "$SOFTDIR/$platform_name/hmmconvert";
+our $psiblastbin = "$SOFTDIR/$platform_name/blastpgp";
+our $alscript    = "$SOFTDIR/$platform_name/alscript";
+our $readseq     = "$SOFTDIR/$platform_name/readseq";
  
  # required for training with SNNS, but unused currently
-our $ff_bignet = "$HOME/projects/Jnet/bin/snns/ff_bignet";  # CC modified for new path (SNNS app)
-our $analyze   = "$HOME/projects/Jnet/bin/snns/analyze";    # CC modified for new path (SNNS app)
-our $batchman  = "$HOME/projects/Jnet/bin/snns/batchman";   # CC modified for new path (SNNS app)
+our $ff_bignet = "$HOME/projects/Jnet/bin/snns/ff_bignet";    # CC modified for new path (SNNS app)
+our $analyze   = "$HOME/projects/Jnet/bin/snns/analyze";      # CC modified for new path (SNNS app)
+our $batchman  = "$HOME/projects/Jnet/bin/snns/batchman";     # CC modified for new path (SNNS app)
  our $sov       = "$HOME/projects/Jnet/bin/sov";
  
+sub setup_env {
+  my $newsoftdir       = shift;
+  my $newplatform_name = shift;
+
+  if ( defined $newsoftdir ) {
+    if ( -d $newsoftdir ) {
+      $SOFTDIR = $newsoftdir;
+    } else {
+      warn "setup_env: directory with Jpred software $newsoftdir does not exist. The default directory is used...\n";
+    }
+  }
+  if ( defined $newplatform_name ) {
+    $platform_name = $newplatform_name;
+  }
+
+  $oc          = "$SOFTDIR/$platform_name/oc";
+  $jnet        = "$SOFTDIR/$platform_name/jnet";
+  $fastacmd    = "$SOFTDIR/$platform_name/fastacmd";
+  $pairwise    = "$SOFTDIR/$platform_name/pairwise";
+  $hmmbuild    = "$SOFTDIR/$platform_name/hmmbuild";
+  $psiblastbin = "$SOFTDIR/$platform_name/blastpgp";
+  $hmmconvert  = "$SOFTDIR/$platform_name/hmmconvert";
+  $alscript    = "$SOFTDIR/$platform_name/alscript";
+  $readseq     = "$SOFTDIR/$platform_name/readseq";
+}
+
+sub check_OS {
+  if ( "linux" eq $^O or "Linux" eq $^O ) {
+    my $status = system "uname -m > .platform";
+    open my $PLH, "<", ".platform" or die "can't check platform information";
+    my $plt = <$PLH>;
+    close $PLH;
+    chop $plt;
+    $platform_name = "i686" if ( $plt =~ /i[3-6]86/ );
+  } elsif ( "MSWin32" eq $^O ) {
+    $platform_name = "win";
+  } else {
+    warn "check_OS: unknown platform, I'll try to use x86_64 binaries....";
+  }
+
+  $oc          = "$SOFTDIR/$platform_name/oc";
+  $jnet        = "$SOFTDIR/$platform_name/jnet";
+  $fastacmd    = "$SOFTDIR/$platform_name/fastacmd";
+  $pairwise    = "$SOFTDIR/$platform_name/pairwise";
+  $hmmbuild    = "$SOFTDIR/$platform_name/hmmbuild";
+  $psiblastbin = "$SOFTDIR/$platform_name/blastpgp";
+  $hmmconvert  = "$SOFTDIR/$platform_name/hmmconvert";
+  $alscript    = "$SOFTDIR/$platform_name/alscript";
+  $readseq     = "$SOFTDIR/$platform_name/readseq";
+
+  return $platform_name;
+}
  
  =head1 AUTOMATED CHANGES
  
@@ -46,11 +128,4 @@ Currently the paths are altered on the basis of per host rules.
  
  =cut
  
-#my $host = Sys::Hostname::hostname();
-#if (grep { $host =~ $_ } qr/^(anshar|kinshar)/o, qr/^cluster-64-/o) {
-#      for my $temp (@EXPORT_OK) {
-#              eval "$temp =~ s#$HOME\/tmp#$HOME#g";
-#      }
-#}
-
  1;
diff --git a/jpred/lib/Profile/Jnet.pm b/jpred/lib/Profile/Jnet.pm

index bf91431..0feb34d 100644 (file)
--- a/jpred/lib/Profile/Jnet.pm
+++ b/jpred/lib/Profile/Jnet.pm
@@ -6,6 +6,7 @@ use Carp;
  use UNIVERSAL qw(isa);
  
  use base qw(Profile);
+use lib '..';
  use Utils qw(profile);
  
  sub read {
diff --git a/jpred/lib/Read.pm b/jpred/lib/Read.pm

index 72e333b..51f08e0 100644 (file)
--- a/jpred/lib/Read.pm
+++ b/jpred/lib/Read.pm
@@ -42,15 +42,15 @@ This method will cause a fatal error unless it's overidden by the class that inh
  =cut
  
  sub read {
-       confess "The inheriting package hasn't defined the read() method\n"
+  confess "The inheriting package hasn't defined the read() method\n";
  }
  
  sub read_file {
-       my ($self, $fn) = @_;
+  my ( $self, $fn ) = @_;
  
-       open my $fh, $fn or confess "Can't open file $fn: $!";
-       $self->path($fn);
-       $self->read($fh);
+  open my $fh, $fn or confess "Can't open file $fn: $!";
+  $self->path($fn);
+  $self->read($fh);
  }
  
  =head2 read_gzip_file($scalar);
@@ -60,20 +60,20 @@ Like read_file($scalar), but ungzip's the file first.
  =cut
  
  sub read_gzip_file {
-       my ($self, $fn) = @_;
+  my ( $self, $fn ) = @_;
  
-       my $gzipd_fn = File::Temp->new->filename;
+  my $gzipd_fn = File::Temp->new->filename;
  
-       system("gzip -dc $fn > $gzipd_fn");
+  system("gzip -dc $fn > $gzipd_fn");
  
-       $self->read_file($gzipd_fn);
+  $self->read_file($gzipd_fn);
  }
  
  sub read_string {
-       my ($self, $string) = @_;
+  my ( $self, $string ) = @_;
  
-       my $fh = IO::String->new($string);
-       $self->read($fh);
+  my $fh = IO::String->new($string);
+  $self->read($fh);
  }
  
  1;
diff --git a/jpred/lib/Sequence/File.pm b/jpred/lib/Sequence/File.pm

index 188966c..dd53509 100644 (file)
--- a/jpred/lib/Sequence/File.pm
+++ b/jpred/lib/Sequence/File.pm
@@ -4,7 +4,7 @@ use strict;
  use warnings;
  use Carp;
  
-use UNIVERSAL qw(isa);
+#use UNIVERSAL qw(isa);
  use base qw(Root Read Write);
  
  =head2 $file->get_entries
@@ -50,25 +50,11 @@ sub add_entries {
    return unless @entries;
  
    for (@entries) {
-    croak "Adding non Sequence object" unless isa $_, "Sequence";
+
+    #    croak "Adding non Sequence object" unless isa $_, "Sequence";
      $self->_ids( $_->id );
      push @{ $self->{ __PACKAGE__ . "entries" } }, $_;
    }
-
-  #    my $max = $self->get_max_entries;
-  #    if (defined $max) {
-  #            my $exist_size = @{ $self->{__PACKAGE__."entries"} };
-  #            if ($exist_size > $max) { return 0 }
-  #            elsif ($exist_size + @entries > $max) {
-  #                    return push @{ $self->{__PACKAGE__."entries"} }, @entries[0..$max - $exist_size];
-  #            }
-  #            else {
-  #                    return push @{ $self->{__PACKAGE__."entries"} }, @entries;
-  #            }
-  #    }
-  #    else {
-  #            return push @{ $self->{__PACKAGE__."entries"} }, @entries;
-  #    }
  }
  
  =head2 $file->get_entry_by_id(/regex/);
diff --git a/jpred/lib/Utils.pm b/jpred/lib/Utils.pm

index 76b8c57..937460e 100644 (file)
--- a/jpred/lib/Utils.pm
+++ b/jpred/lib/Utils.pm
@@ -8,7 +8,7 @@ use File::Find qw(find);
  
  use base qw(Exporter);
  
-our @EXPORT_OK = qw(xsystem profile reduce_dssp conf jury find_jury read_file_list concise_record seq2int int2seq abs_solv_acc rel_solv_acc array_shuffle array_shuffle_in_place array_split $split_resid sort_resid find_files);
+our @EXPORT_OK = qw(profile reduce_dssp conf jury find_jury read_file_list concise_record seq2int int2seq abs_solv_acc rel_solv_acc array_shuffle array_shuffle_in_place array_split $split_resid sort_resid find_files);
  push @EXPORT_OK, map { "reduce_dssp_$_" } qw(a b c jpred);
  
  # Reduce eight state DSSP definition to three states
@@ -274,28 +274,6 @@ Converts an array of integers into one letter amino acids codes produced by seq2
         }
  }
  
-=head2 xsystem($system)
-
-Wraps the perl system() function. Returns undef if the command in $system doesn't work, perhaps, look at the code.
-
-=cut
-
-sub xsystem ($) {
-       my $status = system(@_);
-       if ($status == -1) {
-               carp "Failed to run command '@_': $!";
-               return;
-       }
-       elsif ($? & 127) {
-               printf "child died with signal %d, %s coredump\n", ($? & 127),  ($? & 128) ? 'with' : 'without';
-               return;
-       }
-       else {
-               #printf "child exited with value %d\n", $? >> 8
-               return $? >> 8;
-       }
-}
-
  =head2 $concise = concise_record($title, @data)
  
  Simple function to give a line in a concise file. Pass the title of the concise file, and the data that you want in the record. Returns a string in the concise format with a newline.
diff --git a/jpred/lib/Write.pm b/jpred/lib/Write.pm

index af86eed..7a97faa 100644 (file)
--- a/jpred/lib/Write.pm
+++ b/jpred/lib/Write.pm
@@ -38,33 +38,33 @@ This method will cause a fatal error unless it's overidden by the class that inh
  =cut
  
  sub write {
-       confess "The inheriting package hasn't defined the write() method\n"
+  confess "The inheriting package hasn't defined the write() method\n";
  }
  
  sub write_file {
-       my ($self, $fn) = @_;
+  my ( $self, $fn ) = @_;
  
-       open my $fh, ">$fn" or confess "Can't open file $fn: $!";
-       $self->write($fh);
-       close $fh;
+  open my $fh, ">$fn" or confess "Can't open file $fn: $!";
+  $self->write($fh);
+  close $fh;
  }
  
  sub write_gzip_file {
-               my ($self, $fn) = @_;
+  my ( $self, $fn ) = @_;
  
-               my $gzipd_fn = File::Temp->new->filename;
+  my $gzipd_fn = File::Temp->new->filename;
  
-               $self->write_file($gzipd_fn);
+  $self->write_file($gzipd_fn);
  
-               system "gzip -c $gzipd_fn > $fn";
+  system "gzip -c $gzipd_fn > $fn";
  }
  
  sub write_string {
-       my ($self) = @_;
+  my ($self) = @_;
  
-       my $string;
-       $self->write(IO::String->new($string));
-       return $string;
+  my $string;
+  $self->write( IO::String->new($string) );
+  return $string;
  }
  
  1;
diff --git a/jpred/tests/SCOP175B_nr.fas b/jpred/tests/SCOP175B_nr.fas

new file mode 100644 (file)

index 0000000..bf4880c
--- /dev/null
+++ b/jpred/tests/SCOP175B_nr.fas
@@ -0,0 +1,3186 @@
+>d16vpa_ d.180.1.1 (A:) Conserved core of transcriptional regulatory protein vp16 {Herpes simplex virus type 1 [TaxId: 10298]}
+SRMPSPPMPVPPAALFNRLLDDLGFSAGPALCTMLDTWNEDLFSALPTNADLYRECKFLSTLPSDVVEWGDAYVPERTQIDIRAHGDVAFPTLPATRDGLGLYYEALSRFFHAELRAREESYRTVLANFCSALYRYLRASVRQLHRQAHMRGRDRDLGEMLRATIADRYYRETARLARVLFLHLYLFLTREILWAAYAEQMMRPDLFDCLCCDLESWRQLAGLFQPFMFVNGALTVRGVPIEARRLRELNHIREHLNLPLVRSAATEEPGAPLTTPPTLHGNQARASGYFMVLIRAKLDSYSSFTTSPSEAVMREHAYSRAPTKNNYGSTIEGLLDLPDDDAPEEAGLAAPRLSFL
+>d1a12a_ b.69.5.1 (A:) Regulator of chromosome condensation RCC1 {Human (Homo sapiens) [TaxId: 9606]}
+KKVKVSHRSHSTEPGLVLTLGQGDVGQLGLGENVMERKKPALVSIPEDVVQAEAGGMHTVCLSKSGQVYSFGCNDEGALGRDTSVEGSEMVPGKVELQEKVVQVSAGDSHTAALTDDGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLDVPVVKVASGNDHLVMLTADGDLYTLGCGEQGQLGRVPELFANRGGRQGLERLLVPKCVMLKSRGSRGHVRFQDAFCGAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTVCMDSEGKAYSLGRAEYGRLGLGEGAEEKSIPTLISRLPAVSSVACGASVGYAVTKDGRVFAWGMGTNYQLGTGQDEDAWSPVEMMGKQLENRVVLSVSSGGQHTVLLVKDKEQS
+>d1a1xa_ b.63.1.1 (A:) p13-MTCP1 {Human (Homo sapiens) [TaxId: 9606]}
+AGEDVGAPPDHLWVHQEGIYRDEYQRTWVAVVEEETSFLRARVQQIQVPLGDAARPSHLLTSQLPLMWQLYPEERYMDNNSRLWQIQHHLMVRGVQELLLKLLPDD
+>d1a26a1 a.41.1.1 (A:662-796) Domain of poly(ADP-ribose) polymerase {Chicken (Gallus gallus) [TaxId: 9031]}
+KSKLAKPIQDLIKMIFDVESMKKAMVEFEIDLQKMPLGKLSKRQIQSAYSILNEVQQAVSDGGSESQILDLSNRFYTLIPHDFGMKKPPLLSNLEYIQAKVQMLDNLLDIEVAYSLLRGGNEDGDKDPIDINYEK
+>d1a62a1 a.140.3.1 (A:1-47) Rho termination factor, N-terminal domain {Escherichia coli [TaxId: 562]}
+MNLTELKNTPVSELITLGENMGLENLARMRKQDIIFAILKQHAKSGE
+>d1a6qa1 a.159.1.1 (A:297-368) Protein serine/threonine phosphatase 2C, C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+VSPEAVKKEAELDKYLECRVEEIIKKQGEGVPDLVHVMRTLASENIPSLPPGGELASKRNVIEAVYNRLNPY
+>d1a8da2 b.42.4.2 (A:248-452) Tetanus neurotoxin {Clostridium tetani [TaxId: 1513]}
+ITFLRDFWGNPLRYDTEYYLIPVASSSKDVQLKNITDYMYLTNAPSYTNGKLNIYYRRLYNGLKFIIKRYTPNNEIDSFVKSGDFIKLYVSYNNNEHIVGYPKDGNAFNNLDRILRVGYNAPGIPLYKKMEAVKLRDLKTYSVQLKLYDDKNASLGLVGTHNGQIGNDPNRDILIASNWYFNHLKDKILGCDWYFVPTDEGWTND
+>d1a8oa_ a.28.3.1 (A:) HIV capsid protein, dimerisation domain {Human immunodeficiency virus type 1 [TaxId: 11676]}
+MDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPGATLEEMMTACQG
+>d1a9xa1 a.92.1.1 (A:403-555) Carbamoyl phosphate synthetase, large subunit connection domain {Escherichia coli [TaxId: 562]}
+EVGATGFDPKVSLDDPEALTKIRRELKDAGADRIWYIADAFRAGLSVDGVFNLTNIDRWFLVQIEELVRLEEKVAEVGITGLNADFLRQLKRKGFADARLAKLAGVREAEIRKLRDQYDLHPVYKRVDTCAAEFATDTAYMYSTYEEECEANP
+>d1a9xb1 c.8.3.1 (B:1502-1652) Carbamoyl phosphate synthetase, small subunit N-terminal domain {Escherichia coli [TaxId: 562]}
+IKSALLVLEDGTQFHGRAIGATGSAVGEVVFNTSMTGYQEILTDPSYSRQIVTLTYPHIGNVGTNDADEESSQVHAQGLVIRDLPLIASNFRNTEDLSSYLKRHNIVAIADIDTRKLTRLLREKGAQNGCIIAGDNPDAALALEKARAFPG
+>d1acoa1 c.8.2.1 (A:529-754) Aconitase A, C-terminal domain {Cow (Bos taurus) [TaxId: 9913]}
+VDVSPTSQRLQLLEPFDKWDGKDLEDLQILIKVKGKCTTDHISAAGPWLKFRGHLDNISNNLLIGAINSENRKANSVRNAVTQEFGPVPDTARYYKQHGIRWVVIGDENYGEGSSREHSALEPRFLGGRAIITKSFARIHETNLKKQGLLPLTFADPADYNKIHPVDKLTIQGLKDFAPGKPLTCIIKHPNGTQETILLNHTFNETQIEWFRAGSALNRMKELQQK
+>d1acoa2 c.83.1.1 (A:2-528) Aconitase A, N-terminal domain {Cow (Bos taurus) [TaxId: 9913]}
+RAKVAMSHFEPHEYIRYDLLEKNIDIVRKRLNRPLTLSEKIVYGHLDDPANQEIERGKTYLRLRPDRVAMQDATAQMAMLQFISSGLPKVAVPSTIHCDHLIEAQLGGEKDLRRAKDINQEVYNFLATAGAKYGVGFWRPGSGIIHQIILENYAYPGVLLIGTDSHTPNGGGLGGICIGVGGADAVDVMAGIPWELKCPKVIGVKLTGSLSGWTSPKDVILKVAGILTVKGGTGAIVEYHGPGVDSISCTGMATICNMGAEIGATTSVFPYNHRMKKYLSKTGRADIANLADEFKDHLVPDSGCHYDQLIEINLSELKPHINGPFTPDLAHPVAEVGSVAEKEGWPLDIRVGLIGSCTNSSYEDMGRSAAVAKQALAHGLKCKSQFTITPGSEQIRATIERDGYAQVLRDVGGIVLANACGPCIGQWDRKDIKKGEKNTIVTSYNRNFTGRNDANPETHAFVTSPEIVTALAIAGTLKFNPETDFLTGKDGKKFKLEAPDADELPRAEFDPGQDTYQHPPKDSSGQR
+>d1ae9a_ d.163.1.1 (A:) Integrase (Int) {Bacteriophage lambda [TaxId: 10710]}
+RSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCEMKWSDIVDGYLYVEQSKTGVKIAIPTALHIDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSDTMASQFRDDRGREWDKIEI
+>d1af7a1 a.58.1.1 (A:11-91) Chemotaxis receptor methyltransferase CheR, N-terminal domain {Salmonella typhimurium [TaxId: 90371]}
+SVLLQMTQRLALSDAHFRRICQLIYQRAGIVLADHKRDMVYNRLVRRLRALGLDDFGRYLSMLEANQNSAEWQAFINALTT
+>d1ah7a_ a.124.1.1 (A:) Bacterial phosholipase C {Bacillus cereus [TaxId: 1396]}
+WSAEDKHKEGVNSHLWIVNRAIDIMSRNTTLVKQDRVAQLNEWRTELENGIYAADYENPYYDNSTFASHFYDPDNGKTYIPFAKQAKETGAKYFKLAGESYKNKDMKQAFFYLGLSLHYLGDVNQPMHAANFTNLSYPQGFHSKYENFVDTIKDNYKVTDGNGYWNWKGTNPEEWIHGAAVVAKQDYSGIVNDNTKDWFVKAAVSQEYADKWRAEVTPMTGKRLMDAQRVTAGYIQLWFDTYGDR
+>d1aiea_ a.53.1.1 (A:) p53 tetramerization domain {Human (Homo sapiens) [TaxId: 9606]}
+EYFTLQIRGRERFEMFRELNEALELKDAQAG
+>d1aola_ b.20.1.1 (A:) F-MuLV receptor-binding domain {Friend murine leukemia virus [TaxId: 11795]}
+QVYNITWEVTNGDRETVWAISGNHPLWTWWPVLTPDLCMLALSGPPHWGLEYQAPYSSPPGPPCCSGSSGSSAGCSRDCDEPLTSLTPRCNTAWNRLKLDQVTHKSSEGFYVCPGSHRPREAKSCGGPDSFYCASWGCETTGRVYWKPSSSWDYITVDNNLTTSQAVQVCKDNKWCNPLAIQFTNAGKQVTSWTTGHYWGLRLYVSGRDPGLTFGIRLRYQNLGPRVP
+>d1aopa1 d.58.36.1 (A:81-145) Sulfite reductase, domains 1 and 3 {Escherichia coli [TaxId: 562]}
+LLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDAL
+>d1aopa3 d.134.1.1 (A:149-345) Sulfite reductase hemoprotein (SiRHP), domains 2 and 4 {Escherichia coli [TaxId: 562]}
+NDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDR
+>d1ayoa_ b.2.4.1 (A:) alpha-2-macroglobulin {Cow (Bos taurus) [TaxId: 9913]}
+EFPFALEVQTLPQTCDGPKAHTSFQISLSVSYIGSRPASNMAIVDVKMVSGFIPLKPTVKMLERSNVSRTEVSNNHVLIYLDKVTNETLTLTFTVLQDIPVRDLKPAIVKVYDYYETDEFAVAEYSAPCS
+>d1b0na1 a.34.1.1 (A:74-108) SinR repressor dimerisation domain {Bacillus subtilis [TaxId: 1423]}
+LDSEWEKLVRDAMTSGVSKKQFREFLDYQKWRKSQ
+>d1b25a1 a.110.1.1 (A:211-619) Formaldehyde ferredoxin oxidoreductase {Pyrococcus furiosus [TaxId: 2261]}
+DKEELKKLSQEAYNEILNSPGYPFWKRQGTMAAVEWCNTNYALPTRNFSDGYFEFARSIDGYTMEGMKVQQRGCPYCNMPCGNVVLDAEGQESELDYENVALLGSNLGIGKLNEVSVLNRIADEMGMDTISLGVSIAHVMEAVERGILKEGPTFGDFKGAKQLALDIAYRKGELGNLAAEGVKAMAEKLGTHDFAMHVKGLEVSGYNCYIYPAMALAYGTSAIGAHHKEAWVIAWEIGTAPIEGEKAEKVEYKISYDPIKAQKVVELQRLRGGLFEMLTACRLPWVEVGLSLDYYPKLLKAITGVTYTWDDLYKAADRVYSLIRAYWVREFNGKWDRKMDYPPKRWFTEGLKSGPHKGEHLDEKKYDELLSEYYRIRGWDERGIPKKETLKELDLDFVIPELEKVTNLE
+>d1b25a2 d.152.1.1 (A:1-210) Formaldehyde ferredoxin oxidoreductase {Pyrococcus furiosus [TaxId: 2261]}
+MYGWWGRILRVNLTTGEVKVQEYPEEVAKKFIGGRGLAAWILWNEARGVEPLSPENKLIFAAGPFNGLPTPSGGKLVVAAKSPLTGGYGDGNLGTMASVHLRRAGYDALVVEGKAKKPVYIYIEDDNVSILSAEGLWGKTTFETERELKEIHGKNVGVLTIGPAGENLVKYAVVISQEGRAAGRPGMGAVMGSKKLKAVVIRGTKEIPVA
+>d1b33n_ d.30.1.1 (N:) Allophycocyanin linker chain (domain) {Mastigocladus laminosus [TaxId: 83541]}
+GRLFKITACVPSQTRIRTQRELQNTYFTKLVPYENWFREQQRIQKMGGKIVKVELATGKQGINTGLA
+>d1b3aa_ d.9.1.1 (A:) RANTES (regulated upon activation, normal T-cell expressed and secreted) {Human (Homo sapiens) [TaxId: 9606]}
+PYSSDTTPCCFAYIARPLPRAHIKEYFYTSGKCSNPAVVFVTRKNRQVCANPEKKWVREYINSLEMS
+>d1b79a_ a.81.1.1 (A:) N-terminal domain of DnaB helicase {Escherichia coli [TaxId: 562]}
+PPHSIEAEQSVLGGLMLDNERWDDVAERVVADDFYTRPHRHIFTEMARLQESGSPIDLITLAESLERQGQLDSVGGFAYLAELSKNTPSAANISAYADIVRE
+>d1bcoa1 b.48.1.1 (A:481-560) mu transposase, C-terminal domain {Bacteriophage Mu [TaxId: 10677]}
+TEEQKRMLLLPAEAVNVSRKGEFTLKVGGSLKGAKNVYYNMALMNAGVKKVVVRFDPQQLHSTVYCYTLDGRFICEAECL
+>d1bg1a1 a.47.1.1 (A:136-321) STAT3b {Mouse (Mus musculus) [TaxId: 10090]}
+VVTEKQQMLEQHLQDVRKRVQDLEQKMKVVENLQDDFDFNYKTLKSQGDMQDLNGNNQSVTRQKMQQLEQMLTALDQMRRSIVSELAGLLSAMEYVQKTLTDEELADWKRRQQIACIGGPPNICLDRLENWITSLAESQLQTRQQIKKLEELQQKVSYKGDPIVQHRPMLEERIVELFRNLMKSAF
+>d1bgfa_ a.90.1.1 (A:) Transcription factor STAT-4 N-domain {Mouse (Mus musculus) [TaxId: 10090]}
+GGSQWNQVQQLEIKFLEQVDQFYDDNFPMEIRHLLAQWIETQDWEVASNNETMATILLQNLLIQLDEQLGRVSKEKNLLLIHNLKRIRKVLQGKFHGNPMHVAVVISNCLREERRILAAANMPI
+>d1bkra_ a.40.1.1 (A:) beta-spectrin {Human (Homo sapiens) [TaxId: 9606]}
+KSAKDALLLWCQMKTAGYPNVNIHNFTTSWRDGMAFNALIHKHRPDLIDFDKLKKSNAHYNLQNAFNLAEQHLGLTKLLDPEDISVDHPDEKSIITYVVTYYHYFSKM
+>d1bm8a_ d.34.1.1 (A:) DNA-binding domain of Mlu1-box binding protein MBP1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+QIYSARYSGVDVYEFIHSTGSIMKRKKDDWVNATHILKAANFAKAKRTRILEKEVLKETHEKVQGGFGKYQGTWVPLNIAKQLAEKFSVYDQLKPLFDF
+>d1boua_ a.88.1.1 (A:) LigA subunit of an aromatic-ring-opening dioxygenase LigAB {Sphingomonas paucimobilis, formerly Pseudomonas paucimobilis [TaxId: 13689]}
+IDVHAYLAEFDDIPGTRVFTAQRARKGYNLNQFAMSLMKAENRERFKADESAYLDEWNLTPAAKAAVLARDYNAMIDEGGNVYFLSKLFSTDGKSFQFAAGSMTGMTQEEYAQMMIDGGRSPAGVRSIKGGY
+>d1boub_ c.56.6.1 (B:) LigB subunit of an aromatic-ring-opening dioxygenase LigAB {Pseudomonas paucimobilis [TaxId: 13689]}
+ARVTTGITSSHIPALGAAIQTGTSDNDYWGPVFKGYQPIRDWIKQPGNMPDVVILVYNDHASAFDMNIIPTFAIGCAETFKPADEGWGPRPVPDVKGHPDLAWHIAQSLILDEFDMTIMNQMDVDHGCTVPLSMIFGEPEEWPCKVIPFPVNVVTYPPPSGKRCFALGDSIRAAVESFPEDLNVHVWGTGGMSHQLQGPRAGLINKEFDLNFIDKLISDPEELSKMPHIQYLRESGSEGVELVMWLIMRGALPEKVRDLYTFYHIPASNTALGAMILQPEETAGTPLEPRKVMSGHSL
+>d1bx7a_ g.3.15.1 (A:) Hirustasin {Medicinal leech (Hirudo medicinalis) [TaxId: 6421]}
+GNTCGGETCSAAQVCLKGKCVCNEVHCRIRCKYGLKKDENGCEYPCSCAKA
+>d1bxya_ d.59.1.1 (A:) Prokaryotic ribosomal protein L30 {Thermus thermophilus [TaxId: 274]}
+MPRLKVKLVKSPIGYPKDQKAALKALGLRRLQQERVLEDTPAIRGNVEKVAHLVRVEVVE
+>d1byia_ c.37.1.10 (A:) Dethiobiotin synthetase {Escherichia coli [TaxId: 562]}
+SKRYFVTGTDTEVGKTVASCALLQAAKAAGYRTAGYKPVASGSEKTPEGLRNSDALALQRNSSLQLDYATVNPYTFAEPTSPHIISAQEGRPIESLVMSAGLRALEQQADWVLVEGAGGWFTPLSDTFTFADWVTQEQLPVILVVGVKLGCINHAMLTAQVIQHAGLTLAGWVANDVTPPGKRHAEYMTTLTRMIPAPLLGEIPWLAENPENAATGKYINLALL
+>d1c1da2 c.58.1.1 (A:1-148) Phenylalanine dehydrogenase {Rhodococcus sp., M4 [TaxId: 1831]}
+SIDSALNWDGEMTVTRFDAMTGAHFVIRLDSTQLGPAAGGTRAAQYSNLADALTDAGKLAGAMTLKMAVSNLPMGGGKSVIALPAPRHSIDPSTWARILRIHAENIDKLSGNYWTGPDVNTNSADMDTLNDTTEFVFGRSLERGGAGS
+>d1c1ka_ a.120.1.1 (A:) gene 59 helicase assembly protein {Bacteriophage T4 [TaxId: 10665]}
+MIKLRMPAGGERYIDGKSVYKLYLMIKQHMNGKYDVIKYNWCMRVSDAAYQKRRDKYFFQKLSEKYKLKELALIFISNLVANQDAWIGDISDADALVFYREYIGRLKQIKFKFEEDIRNIYYFSKKVEVSAFKEIFEYNPKVQSSYIFKLLQSNIISFETFILLDSFLNIIDKHDEQTDNLVWNNYSIKLKAYRKILNIDSQKAKNVFIETVKSCKY
+>d1c5ea_ b.85.2.1 (A:) Head decoration protein D (gpD, major capsid protein D) {Bacteriophage lambda [TaxId: 10710]}
+SDPAHTATAPGGLSAKAPAMTPLMLDTSSRKLVAWDGTTDGAAVGILAVAADQTSTTLTFYKSGTFRYEDVLWPEAASDETKKRTAFAGTAISIV
+>d1c75a_ a.3.1.1 (A:) Cytochrome c6 (synonym: cytochrome c553) {Bacillus pasteurii [TaxId: 1474]}
+VDAEAVVQQKCISCHGGDLTGASAPAIDKAGANYSEEEILDIILNGQGGMPGGIAKGAEAEAVAAWLAEKK
+>d1c9oa_ b.40.4.5 (A:) Major cold shock protein {Bacillus caldolyticus [TaxId: 1394]}
+MQRGKVKWFNNEKGYGFIEVEGGSDVFVHFTAIQGEGFKTLEEGQEVSFEIVQGNRGPQAANVVKL
+>d1cc8a_ d.58.17.1 (A:) ATX1 metallochaperone protein (ATOX1) {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+AEIKHYQFNVVMTCSGCSGAVNKVLTKLEPDVSKIDISLEKQLVDVYTTLPYDFILEKIKKTGKEVRSGKQL
+>d1ccwa_ c.23.6.1 (A:) Glutamate mutase, small subunit {Clostridium cochlearium [TaxId: 1494]}
+MEKKTIVLGVIGSDCHAVGNKILDHAFTNAGFNVVNIGVLSPQELFIKAAIETKADAILVSSLYGQGEIDCKGLRQKCDEAGLEGILLYVGGNIVVGKQHWPDVEKRFKDMGYDRVYAPGTPPEVGIADLKKDLNIE
+>d1ccwb_ c.1.19.2 (B:) Glutamate mutase, large subunit {Clostridium cochlearium [TaxId: 1494]}
+MELKNKKWTDEEFHKQREEVLQQWPTGKEVDLQEAVDYLKKIPAEKNFAEKLVLAKKKGITMAQPRAGVALLDEHIELLRYLQDEGGADFLPSTIDAYTRQNRYDECENGIKESEKAGRSLLNGFPGVNFGVKGCRKVLEAVNLPLQARHGTPDSRLLAEIIHAGGWTSNEGGGISYNVPYAKNVTIEKSLLDWQYCDRLVGFYEEQGVHINREPFGPLTGTLVPPSMSNAVGITEALLAAEQGVKNITVGYGECGNMIQDIAALRCLEEQTNEYLKAYGYNDVFVTTVFHQWMGGFPQDESKAFGVIVTATTIAALAGATKVIVKTPHEAIGIPTKEANAAGIKATKMALNMLEGQRMPMSKELETEMAVIKAETKCILDKMFELGKGDLAIGTVKAFETGVMDIPFGPSKYNAGKMMPVRDNLGCVRYLEFGNVPFTEEIKNYNRERLQERAKFEGRDVSFQMVIDDIFAVGKGRLIGRPE
+>d1cfza_ c.56.1.1 (A:) Hydrogenase maturating endopeptidase HybD {Escherichia coli [TaxId: 562]}
+MRILVLGVGNILLTDEAIGVRIVEALEQRYILPDYVEILDGGTAGMELLGDMANRDHLIIADAIVSKKNAPGTMMILRDEEVPALFTNKISPHQLGLADVLSALRFTGEFPKKLTLVGVIPESLEPHIGLTPTVEAMIEPALEQVLAALRESGVEAIPRSDS
+>d1chda_ c.40.1.1 (A:) Methylesterase CheB, C-terminal domain {Salmonella typhimurium [TaxId: 90371]}
+LLSSEKLIAIGASTGGTEAIRHVLQPLPLSSPAVIITQHMPPGFTRSFAERLNKLCQISVKEAEDGERVLPGHAYIAPGDKHMELARSGANYQIKIHDGPPVNRHRPSVDVLFHSVAKHAGRNAVGVILTGMGNDGAAGMLAMYQAGAWTIAQNEASCVVFGMPREAINMGGVSEVVDLSQVSQQMLAKISAGQAIRI
+>d1ci4a_ a.60.5.1 (A:) Barrier-to-autointegration factor, BAF {Human (Homo sapiens) [TaxId: 9606]}
+MTTSQKHRDFVAEPMGEKPVGSLAGIGEVLGKKLEERGFDKAYVVLGQFLVLKKDEDLFREWLKDTCGANAKQSRDCFGCLREWCDAFL
+>d1cipa1 a.66.1.1 (A:61-181) Transducin (alpha subunit), insertion domain {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+YSEEECKQYKAVVYSNTIQSIIAIIRAMGRLKIDFGDAARADDARQLFVLAGAAEEGFMTAELAGVIKRLWKDSGVQACFNRSREYQLNDSAAYYLNDLDRIAQPNYIPTQQDVLRTRVKT
+>d1ciya2 b.77.2.1 (A:256-461) delta-Endotoxin (insectocide), middle domain {Bacillus thuringiensis, CRYIA (A) [TaxId: 1428]}
+PIRTVSQLTREIYTNPVLENFDGSFRGMAQRIEQNIRQPHLMDILNSITIYTDVHRGFNYWSGHQITASPVGFSGPEFAFPLFGNAGNAAPPVLVSLTGLGIFRTLSSPLYRRIILGSGPNNQELFVLDGTEFSFASLTTNLPSTIYRQRGTVDSLDVIPPQDNSVPPRAGFSHRLSHVTMLSQAAGAVYTLRAPTFSWQHRSAEF
+>d1ciya3 f.1.3.1 (A:33-255) delta-Endotoxin (insectocide), N-terminal domain {Bacillus thuringiensis, CRYIA (A) [TaxId: 1428]}
+YTPIDISLSLTQFLLSEFVPGAGFVLGLVDIIWGIFGPSQWDAFLVQIEQLINQRIEEFARNQAISRLEGLSNLYQIYAESFREWEADPTNPALREEMRIQFNDMNSALTTAIPLLAVQNYQVPLLSVYVQAANLHLSVLRDVSVFGQRWGFDAATINSRYNDLTRLIGNYTDYAVRWYNTGLERVWGPDSRDWVRYNQFRRELTLTVLDIVALFSNYDSRRY
+>d1cola_ f.1.1.1 (A:) Colicin A {Escherichia coli [TaxId: 562]}
+AKDERELLEKTSELIAGMGDKIGEHLGDKYKAIAKDIADNIKNFQGKTIRSFDDAMASLNKITANPAMKINKADRDALVNAWKHVDAQDMANKLGNLSKAFKVADVVMKVEKVREKSIEGYETGNWGPLMLEVESWVLSGIASSVALGIFSATLGAYALSLGVPAIAVGIAGILLAAVVGALIDDKFADALNNEIIR
+>d1cq3a_ b.27.1.1 (A:) Soluble secreted chemokine inhibitor, VCCI {Cowpox virus [TaxId: 10243]}
+SFSSSSSCTEEENKHHMGIDVIIKVTKQDQTPTNDKICQSVTEVTESEDESEEVVKGDPTTYYTVVGGGLTMDFGFTKCPKISSISEYSDGNTVNARLSSVSPGQGKDSPAITREEALSMIKDCEMSINIKCSEEEKDSNIKTHPVLGSNISHKKVSYEDIIGSTIVDTKCVKNLEISVRIGDMCKESSELEVKDGFKYVDGSASEDAADDTSLINSAKLIACV
+>d1crua_ b.68.2.1 (A:) Soluble quinoprotein glucose dehydrogenase {Acinetobacter calcoaceticus [TaxId: 471]}
+DVPLTPSQFAKAKSENFDKKVILSNLNKPHALLWGPDNQIWLTERATGKILRVNPESGSVKTVFQVPEIVNDADGQNGLLGFAFHPDFKNNPYIYISGTFKNPKSTDKELPNQTIIRRYTYNKSTDTLEKPVDLLAGLPSSKDHQSGRLVIGPDQKIYYTIGDQGRNQLAYLFLPNQAQHTPTQQELNGKDYHTYMGKVLRLNLDGSIPKDNPSFNGVVSHIYTLGHRNPQGLAFTPNGKLLQSEQGPNSDDEINLIVKGGNYGWPNVAGYKDDSGYAYANYSAAANKSIKDLAQNGVKVAAGVPVTKESEWTGKNFVPPLKTLYTVQDTYNYNDPTCGEMTYICWPTVAPSSAYVYKGGKKAITGWENTLLVPSLKRGVIFRIKLDPTYSTTYDDAVPMFKSNNRYRDVIASPDGNVLYVLTDTAGNVQKDDGSVTNTLENPGSLIKFT
+>d1cuka1 a.5.1.1 (A:156-203) DNA helicase RuvA subunit, C-terminal domain {Escherichia coli [TaxId: 562]}
+TDDAEQEAVARLVALGYKPQEASRMVSKIARPDASSETLIREALRAAL
+>d1cxqa_ c.55.3.2 (A:) Retroviral integrase, catalytic domain {Rous sarcoma virus RSV [TaxId: 11886]}
+GRGLGPLQIWQTDFTLEPRMAPRSWLAVTVDTASSAIVVTQHGRVTSVAAQHHWATAIAVLGRPKAIKTDNGSCFTSKSTREWLARWGIAHTTGIPGNSQGQAMVERANRLLKDKIRVLAEGDGFMKRIPTSKQGELLAKAMYALNH
+>d1cxzb_ a.2.6.1 (B:) Protein kinase c-like 1, pkn/prk1 {Human (Homo sapiens) [TaxId: 9606]}
+WSLLEQLGLAGADLAAPGVQQQLELERERLRREIRKELKLKEGAENLRRATTDLGRSLGPVELLLRGSSRRLDLLHQQLQELHAHV
+>d1cy5a_ a.77.1.3 (A:) Apoptotic protease activating factor 1, APAF-1 {Human (Homo sapiens) [TaxId: 9606]}
+MDAKARNCLLQHREALEKDIKTSYIMDHMISDGFLTISEEEKVRNEPTQQQRAAMLIKMILKKDNDSYVSFYNALLHEGYKDLAALLHDGIPV
+>d1d0qa_ g.41.3.2 (A:) Zinc-binding domain of DNA primase {Bacillus stearothermophilus [TaxId: 1422]}
+GHRIPEETIEAIRRGVDIVDVIGEYVQLKRQGRNYFGLCPFHGEKTPSFSVSPEKQIFHCFGCGAGGNAFTFLMDIEGIPFVEAAKRLAAKAGVDLSVYELD
+>d1d3ya_ e.12.1.1 (A:) DNA topoisomerase IV, alpha subunit {Methanococcus jannaschii [TaxId: 2190]}
+QAKIFAQTTKMLEFAKQLLETDDFSTLREAYYVSKNWGEARFDDQQASNNVIEDLEAALGVLREHLGFIPEEDGSSVVGPLKIIEETPEGELVVDCTKLGTGAYNIPNDVTKLNLETDADFILAIETSGMFARLNAERFWDKHNCILVSLKGVPARATRRFIKRLHEEHDLPVLVFTDGDPYGYLNIYRTLKVGSGKAIHLADKLSIPAARLIGVTPQDIIDYDLPTHPLKEQDIKRIKDGLKNDDFVRSFPEWQKALKQMLDMGVRAEQQSLAKYGLKYVVNTYLPEKIKDESTWLP
+>d1d8ca_ c.1.13.1 (A:) Malate synthase G {Escherichia coli [TaxId: 562]}
+QTITQSRLRIDANFKRFVDEEVLPGTGLDAAAFWRNFDEIVHDLAPENRQLLAERDRIQAALDEWHRSNPGPVKDKAAYKSFLRELGYLVPQPERVTVETTGIDSEITSQAGPQLVVPAMNARYALNAANARWGSLYDALYGSDIIPQEGAMVSGYDPQRGEQVIAWVRRFLDESLPLENGSYQDVVAFKVVDKQLRIQLKNGKETTLRTPAQFVGYRGDAAAPTCILLKNNGLHIELQIDANGRIGKDDPAHINDVIVEAAISTILDCEDSVAAVDAEDKILLYRNLLGLMQGTLQEKMEKNGRQIVRKLNDDRHYTAADGSEISLHGRSLLFIRNVGHLMTIPVIWDSEGNEIPEGILDGVMTGAIALYDLKVQKNSRTGSVYIVKPKMHGPQEVAFANKLFTRIETMLGMAPNTLKMGIMDEERRTSLNLRSCIAQARNRVAFINTGFLDRTGDEMHSVMEAGPMLRKNQMKSTPWIKAYERNNVLSGLFCGLRGKAQIGKGMWAMPDLMADMYSQKGDQLRAGANTAWVPSPTAATLHALHYHQTNVQSVQANIAQTEFNAEFEPLLDDLLTIPVAENANWSAQEIQQELDNNVQGILGYVVRWVEQGIGCSKVPDIHNVALMEDRATLRISSQHIANWLRHGILTKEQVQASLENMAKVVDQQNAGDPAYRPMAGNFANSCAFKAASDLIFLGVKQPNGYTEPLLHAWRLREKES
+>d1dcea2 b.7.4.1 (A:242-350) Rab geranylgeranyltransferase alpha-subunit, insert domain {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+HDVLCCVHVSREEACLSVCFSRPLTVGSRMGTLLLMVDEAPLSVEWRTPDGRNRPSHVWLCDLPAASLNDQLPQHTFRVIWTGSDSQKECVLLKDRPECWCRDSATDEQ
+>d1dd9a_ e.13.1.1 (A:) DNA primase DnaG catalytic core {Escherichia coli [TaxId: 562]}
+TLYQLMDGLNTFYQQSLQQPVATSARQYLEKRGLSHEVIARFAIGFAPPGWDNVLKRFGGNPENRQSLIDAGMLVTNDQGRSYDRFRERVMFPIRDKRGRVIGFGGRVLGNDTPKYLNSPETDIFHKGRQLYGLYEAQQDNAEPNRLLVVEGYMDVVALAQYGINYAVASLGTSTTADHIQLLFRATNNVICCYDGDRAGRDAAWRALETALPYMTDGRQLRFMFLPDGEDPDTLVRKEGKEAFEARMEQAMPLSAFLFNSLMPQVDLSTPDGRARLSTLALPLISQVPGETLRIYLRQELGNKLGILDDSQLE
+>d1dfup_ b.53.1.1 (P:) Ribosomal protein L25 {Escherichia coli [TaxId: 562]}
+MFTINAEVRKEQGKGASRRLRAANKFPAIIYGGKEAPLAIELDHDKVMNMQAKAEFYSEVLTIVVDGKEIKVKAQDVQRHPYKPKLQHIDFVRA
+>d1dj0a_ d.265.1.1 (A:) Pseudouridine synthase I TruA {Escherichia coli [TaxId: 562]}
+PPVYKIALGIEYDGSKYYGWQRQNEVRSVQEKLEKALSQVANEPITVFCAGRTDAGVHGTGQVVHFETTALRKDAAWTLGVNANLPGDIAVRWVKTVPDDFHARFSATARRYRYIIYNHRLRPAVLSKGVTHFYEPLDAERMHRAAQCLLGENDFTSFRAVQCQSRTPWRNVMHINVTRHGPYVVVDIKANAFVHHMVRNIVGSLMEVGAHNQPESWIAELLAAKDRTLAAATAKAEGLYLVAVDYPDRYDLPKPPMGPLFLAD
+>d1dj8a_ a.57.1.1 (A:) Protein HNS-dependent expression A; HdeA {Escherichia coli [TaxId: 562]}
+NKKPVNSWTCEDFLAVDESFQPTAVGFAEALNNKDKPEDAVLDVQGIATVTPAIVQACTQDKQANFKDKVKGEWDKIKK
+>d1dk0a_ d.35.1.1 (A:) Heme-binding protein A (HasA) {Serratia marcescens [TaxId: 615]}
+AFSVNYDSSFGGYSIHDYLGQWASTFGDVNHTNGNVTDANSGGFYGGSLSGSQYAISSTANQVTAFVAGGNLTYTLFNEPAHTLYGQLDSLSFGDGLSGGDTSPYSIQVPDVSFGGLNLSSLQAQGHDGVVHQVVYGLMSGDTGALETALNGILDDYGLSVNSTFDQVAAATA
+>d1dk8a_ a.91.1.1 (A:) Axin RGS-homologous domain {Human (Homo sapiens) [TaxId: 9606]}
+GSASPTPPYLKWAESLHSLLDDQDGISLFRTFLKQEGCADLLDFWFACTGFRKLEPCDSNEEKRLKLARAIYRKYILDNNGIVSRQTKPATKSFIKGCIMKQLIDPAMFDQAQTEIQATMEENTYPSFLKSDIYLEYTRTGSESPKV
+>d1dkza1 a.8.4.1 (A:507-603) DnaK {Escherichia coli [TaxId: 562]}
+LNEDEIQKMVRDAEANAEADRKFEELVQTRNQGDHLLHSTRKQVEEAGDKLPADDKTAIESALTALETALKGEDKAAIEAKMQELAQVSQKLMEIAQ
+>d1dkza2 b.130.1.1 (A:389-506) DnaK {Escherichia coli [TaxId: 562]}
+VLLLDVTPLSLGIETMGGVMTTLIAKNTTIPTKHSQVFSTAEDNQSAVSIHVLQGERKRAADNKSLGQFNLDGINPAPRGMPQIEVTFDIDADGILHVSAKDKNSGKEQKITIKASSG
+>d1dl5a2 d.197.1.1 (A:214-317) Protein-L-isoaspartyl O-methyltransferase, C-terminal domain {Thermotoga maritima [TaxId: 2336]}
+NLLERNRKLLREFPFNREILLVRSHIFVELVDLLTRRLTEIDGTFYYAGPNGVVEFLDDRMRIYGDAPEIENLLTQWESCGYRSFEYLMLHVGYNAFSHISCSI
+>d1dmga_ c.22.1.1 (A:) Ribosomal protein L4 {Thermotoga maritima [TaxId: 2336]}
+AQVDLLNVKGEKVGTLEISDFVFNIDPNYDVMWRYVDMQLSNRRAGTASTKTRGEVSGGGRKPWPQKHTGRARHGSIRSPIWRHGGVVHGPKPRDWSKKLNKKMKKLALRSALSVKYRENKLLVLDDLKLERPKTKSLKEILQNLQLSDKKTLIVLPWKEEGYMNVKLSGRNLPDVKVIIADNPNNSKNGEKAVRIDGLNVFDMLKYDYLVLTRDMVSKIEEVLG
+>d1dqaa1 d.58.20.1 (A:587-703) NAD-binding domain of HMG-CoA reductase {Human (Homo sapiens) [TaxId: 9606]}
+GMTRGPVVRLPRACDSAEVKAWLETSEGFAVIKEAFDSTSRFARLQKLHTSIAGRNLYIRFQSRSGDAMGMNMISKGTEKALSKLHEYFPEMQILAVSGNYCTDKKPAAINWIEGRG
+>d1ds1a_ b.82.2.2 (A:) Clavaminate synthase {Streptomyces clavuligerus [TaxId: 1901]}
+TSVDCTAYGPELRALAARLPRTPRADLYAFLDAAHTAAASLPGALATALDTFNAEGSEDGHLLLRGLPVEADADLPTTPSSTPAPEDRSLLTMEAMLGLVGRRLGLHTGYRELRSGTVYHDVYPSPGAHHLSSETSETLLEFHTEMAYHRLQPNYVMLACSRADHERTAATLVASVRKALPLLDERTRARLLDRRMPCCVDVAFRGGVDDPGAIAQVKPLYGDADDPFLGYDRELLAPEDPADKEAVAALSKALDEVTEAVYLEPGDLLIVDNFRTTHARTPFSPRWDGKDRWLHRVYIRTDRNGQLSGGERAGDVVAFTPRG
+>d1dtdb_ g.30.1.1 (B:) Carboxypeptidase inhibitor {Medicinal leech (Hirudo medicinalis) [TaxId: 6421]}
+DESFLCYQPDQVCCFICRGAAPLPSEGECNPHPTAPWCREGAVEWVPYSTGQCRTTCIPYV
+>d1duvg1 c.78.1.1 (G:1-150) Ornithine transcarbamoylase {Escherichia coli [TaxId: 562]}
+SGFYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFEKDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDGIQYRGYGQEIVETLAEYASVPVWNGLTNEFHPTQLLADLLTMQEHLPG
+>d1dvka_ a.72.1.1 (A:) Functional domain of the splicing factor Prp18 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MRIQEAIAQDKTISVIIDPSQIGSTEGKPLLSMKCNLYIHEILSRWKASLEAYHPELFLDTKKALFPLLLQLRRNQLAPDLLISLATVLYHLQQPKEINLAVQSYMKLSIGNVAWPIGVTSVGIHARSAHSKIQGGRNAANIMIDERTRLWITSIKRLITFEEWYTSNH
+>d1dvoa_ a.136.1.1 (A:) Repressor of bacterial conjugation FinO {Escherichia coli [TaxId: 562]}
+PPKWKVKKQKLAEKAAREAELTAKKAQARQALSIYLNLPTLDEAVNTLKPWWPGLFDGDTPRLLACGIRDVLLEDVAQRNIPLSHKKLRRAMKAITRSESYLCAMKAGACRYDTEGYVTEHISQEEEVYAAERLDKIRRQNRIKAELQAVLD
+>d1dwka2 d.72.1.1 (A:87-156) Cyanase C-terminal domain {Escherichia coli [TaxId: 562]}
+RIPTDPTMYRFYEMLQVYGTTLKALVHEKFGDGIISAINFKLDVKKVADPEGGERAVITLDGKYLPTKPF
+>d1dy5a_ d.5.1.1 (A:) Ribonuclease A (also ribonuclease B, S) {Cow (Bos taurus) [TaxId: 9913]}
+KETAAAKFERQHMDSSTSAASSSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKDGQTNCYQSYSTMSITDCRETGSSKYPNCAYKTTQANKHIIVACEGNPYVPVHFDASV
+>d1dzfa1 c.52.3.1 (A:5-143) Eukaryotic RPB5 N-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+NERNISRLWRAFRTVKEMVKDRGYFITQEEVELPLEDFKAKYCDSMGRPQRKMMSFQANPTEESISKFPDMGSLWVEFCDEPSVGVKTMKTFVIHIQEKNFQTGIFVYQNNITPSAMKLVPSIPPATIETFNEAALVVN
+>d1dzfa2 d.78.1.1 (A:144-215) Eukaryotic RPB5 C-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+ITHHELVPKHIRLSSDEKRELLKRYRLKESQLPRIQRADPVALYLGLKRGEVVKIIRKSETSGRYASYRICM
+>d1e44b_ b.101.1.1 (B:) Ribonuclease domain of colicin E3 {Escherichia coli [TaxId: 562]}
+GFKDYGHDYHPAPKTENIKGLGDLKPGIPKTPKQNGGGKRKRWTGDKGRKIYEWDSQHGELEGYRASDGQHLGSFDPKTGNQLKGPDPKRNIKKYL
+>d1e58a_ c.60.1.1 (A:) Phosphoglycerate mutase {Escherichia coli [TaxId: 562]}
+AVTKLVLVRHGESQWNKENRFTGWYDVDLSEKGVSEAKAAGKLLKEEGYSFDFAYTSVLKRAIHTLWNVLDELDQAWLPVEKSWKLNERHYGALQGLNKAETAEKYGDEQVKQWRRGFAVTPPELTKDDERYPGHDPRYAKLSEKELPLTESLALTIDRVIPYWNETILPRMKSGERVIIAAHGNSLRALVKYLDNMSEEEILELNIPTGVPLVYEFDENFKPLKRYYLGNADEIAAKAAAVANQGK
+>d1e7la1 a.140.4.1 (A:104-157) Recombination endonuclease VII, C-terminal and dimerization domains {Bacteriophage T4 [TaxId: 10665]}
+IHPNFVGDKSKEFSRLGKEEMMAEMLQRGFEYNESDTKTQLIASFKKQLRKSLK
+>d1e8ca1 c.98.1.1 (A:3-103) UDP-N-acetylmuramyl tripeptide synthetase MurE {Escherichia coli [TaxId: 562]}
+RNLRDLLAPWVPDAPSRALREMTLDSRVAAAGDLFVAVVGHQADGRRYIPQAIAQGVAAIIAEAKDEATDGEIREMHGVPVIYLSQLNERLSALAGRFYHE
+>d1eb6a_ d.92.1.12 (A:) Fungal zinc peptidase {Aspergillus oryzae, deuterolysin [TaxId: 5062]}
+TEVTDCKGDAESSLTTALSNAAKLANQAAEAAESGDESKFEEYFKTTDQQTRTTVAERLRAVAKEAGSTSGGSTTYHCNDPYGYCEPNVLAYTLPSKNEIANCDIYYSELPPLAQKCHAQDQATTTLHEFTHAPGVYQPGTEDLGYGYDAATQLSAQDALNNADSYALYANAIELKC
+>d1ecwa_ a.61.1.1 (A:) SIV matrix antigen {Simian immunodeficiency virus [TaxId: 11723]}
+SVLSGKKADELEKIRLRPGGKKKYMLKHVVWAANELDRFGLAESLLENKEGCQKILSVLAPLVPTGSENLKSLYNTVCVIWCIHAEEKVKHTEEAKQIVQRHLVVETGTAETMP
+>d1eexb_ c.51.3.1 (B:) Diol dehydratase, beta subunit {Klebsiella oxytoca [TaxId: 571]}
+GFLTEVGEARQGTQQDEVIIAVGPAFGLAQTVNIVGIPHKSILREVIAGIEEEGIKARVIRCFKSSDVAFVAVEGNRLSGSGISIGIQSKGTTVIHQQGLPPLSNLELFPQAPLLTLETYRQIGKNAARYAKRESPQPVPTLNDQMARPKYQAKSAILHIKETKYVVTGKNPQELRVA
+>d1eexg_ a.23.2.1 (G:) Diol dehydratase, gamma subunit {Klebsiella oxytoca [TaxId: 571]}
+SARVSDYPLANKHPEWVKTATNKTLDDFTLENVLSNKVTAQDMRITPETLRLQASIAKDAGRDRLAMNFERAAELTAVPDDRILEIYNALRPYRSTKEELLAIADDLESRYQAKICAAFVREAATLYVERKKLKGDD
+>d1ef1c_ a.137.5.1 (C:) Moesin tail domain {Human (Homo sapiens) [TaxId: 9606]}
+AEASADLRADAMAKDRSEEERTTEAEKNERVQKHLKALTSELANARDESKKTANDMIHAENMRLGRDKYKTLRQIRQGNTKQRIDEFESM
+>d1egwa_ d.88.1.1 (A:) Myocyte enhancer factor Mef2a core {Human (Homo sapiens) [TaxId: 9606]}
+GRKKIQITRIMDERNRQVTFTKRKFGLMKKAYELSVLCDCEIALIIFNSSNKLFQYASTDMDKVLLKYTEY
+>d1ei5a1 b.61.3.1 (A:336-417) D-aminopeptidase, middle and C-terminal domains {Ochrobactrum anthropi [TaxId: 529]}
+EVSRVEADSAWFGSWLDDETGLVLSLEDAGHGRMKARFGTSPEMMDVVSANEARSAVTTIRRDGETIELVRASENLRLSMKR
+>d1ei7a_ a.24.5.1 (A:) Tobacco mosaic virus coat protein {Tobacco mosaic virus, vulgare strain [TaxId: 12242]}
+SYSITTPSQFVFLSSAWADPIELINLCTNALGNQFQTQQARTVVQRQFSEVWKPSPQVTVRFPDSDFKVYRYNAVLDPLVTALLGAFDTRNRIIEVENQANPTTAETLDATRRVDDATVAIRSAINNLIVELIRGTGSYNRSSFESSSGLVWTSGPAT
+>d1ek9a_ f.5.1.1 (A:) Integral outer membrane protein TolC, efflux pump component {Escherichia coli [TaxId: 562]}
+ENLMQVYQQARLSNPELRKSAADRDAAFEKINEARSPLLPQLGLGADYTYSNGYRDANGINSNATSASLQLTQSIFDMSKWRALTLQEKAAGIQDVTYQTDQQTLILNTATAYFNVLNAIDVLSYTQAQKEAIYRQLDQTTQRFNVGLVAITDVQNARAQYDTVLANELTARNNLDNAVEQLRQITGNYYPELAALNVENFKTDKPQPVNALLKEAEKRNLSLLQARLSQDLAREQIRQAQDGHLPTLDLTASTGISDTSYSGSKTRGAAGTQYDDSNMGQNKVGLSFSLPIYQGGMVNSQVKQAQYNFVGASEQLESAHRSVVQTVRSSFNNINASISSINAYKQAVVSAQSSLDAMEAGYSVGTRTIVDVLDATTTLYNAKQELANARYNYLINQLNIKSALGTLNEQDLLALNNALSKPVSTNPE
+>d1el6a_ d.182.1.1 (A:) Baseplate structural protein gp11 {Bacteriophage T4 [TaxId: 10665]}
+SRLADFLGFRPKTGDIDVMNRQSVGSVTISQLAKGFYEPNIESAINDVHNFSIKDVGTIITNKTGVSPEGVSQTDYWAFSGTVTDDSLPPGSPITVLVFGLPVSATTGMTAIEFVAKVRVALQEAIASFTAINSYKDHPTDGSKLEVTYLDNQKHVLSTYSTYGITISQEIISESKPGYGTWNLLGAQTVTLDNQQTPTVFYHFERTA
+>d1elka_ a.118.9.2 (A:) Tom1 protein {Human (Homo sapiens) [TaxId: 9606]}
+SDFLLGNPFSSPVGQRIEKATDGSLQSEDWALNMEICDIINETEEGPKDALRAVKKRIVGNKNFHEVMLALTVLETCVKNCGHRFHVLVASQDFVESVLVRTILPKNNPPTIVHDKVLNLIQSWADAFRSSPDLTGVVTIYEDLRRKGLEFPM
+>d1elva2 g.18.1.1 (A:342-409) Complement C1S protease domain {Human (Homo sapiens) [TaxId: 9606]}
+LDCGIPESIENGKVEDPESTLFGSVIRYTCEEPYYYMENGGGGEYHCAGNGSWVNEVLGPELPKCVPV
+>d1em8b_ c.126.1.1 (B:) DNA polymerase III psi subunit {Escherichia coli [TaxId: 562]}
+GEIAIAIPAHVRLVMVANDLPALTDPLVSDVLRALTVSPDQVLQLTPEKIAMLPQGSHCNSWRLGTDEPLSLEGAQVASPALTDLRANPTARAALWQQICTYEHDFFPRN
+>d1eu1a1 b.52.2.2 (A:626-780) Dimethylsulfoxide reductase (DMSO reductase) {Rhodobacter sphaeroides [TaxId: 1063]}
+ERLGGAGAKYPLHVVASHPKSRLHSQLNGTSLRDLYAVAGHEPCLINPADAAARGIADGDVLRVFNDRGQILVGAKVSDAVMPGAIQIYEGGWYDPLDPSEEGTLDKYGDVNVLSLDVGTSKLAQGNCGQTILADVEKYAGAPVTVTVFDTPKGA
+>d1eu1a2 c.81.1.1 (A:4-625) Dimethylsulfoxide reductase (DMSO reductase) {Rhodobacter sphaeroides [TaxId: 1063]}
+ANGEVMSGCHWGVFKARVENGRAVAFEPWDKDPAPSHQLPGVLDSIYSPTRIKYPMVRREFLEKGVNADRSTRGNGDFVRVTWDEALDLVARELKRVQESYGPTGTFGGSYGWKSPGRLHNCQVLMRRALNLAGGFVNSSGDYSTAAAQIIMPHVMGTLEVYEQQTAWPVVVENTDLMVFWAADPMKTNEIGWVIPDHGAYAGMKALKEKGTRVICINPVRTETADYFGADVVSPRPQTDVALMLGMAHTLYSEDLHDKDFLENCTTGFDLFAAYLTGESDGTPKTAEWAAEICGLPAEQIRELARSFVAGRTMLAAGWSIQRMHHGEQAHWMLVTLASMIGQIGLPGGGFGLSYHYSNGGSPTSDGPALGGISDGGKAVEGAAWLSESGATSIPCARVVDMLLNPGGEFQFNGATATYPDVKLAYWAGGNPFAHHQDRNRMLKAWEKLETFIVQDFQWTATARHADIVLPATTSYERNDIESVGDYSNRAILAMKKVVDPLYEARSDYDIFAALAERLGKGAEFTEGRDEMGWISSFYEAAVKQAEFKNVAMPSFEDFWSEGIVEFPITEGANFVRYADFREDPLFNPLGTPSGLIEIYSKNIEKMGYDDCPAHPTWMEPA
+>d1euwa_ b.85.4.1 (A:) Deoxyuridine 5'-triphosphate nucleotidohydrolase (dUTPase) {Escherichia coli [TaxId: 562]}
+MMKKIDVKILDPRVGKEFPLPTYATSGSAGLDLRACLNDAVELAPGDTTLVPTGLAIHIADPSLAAMMLPRSGLGHKHGIVLGNLVGLIDSDYQGQLMISVWNRGQDSFTIQPGERIAQMIFVPVVQAEFNLVEDF
+>d1ewfa1 d.83.1.1 (A:1-217) Bactericidal permeability-increasing protein, BPI {Human (Homo sapiens) [TaxId: 9606]}
+VNPGVVVRISQKGLDYASQQGTAALQKELKRIKIPDYSDSFKIKHLGKGHYSFYSMDIREFQLPSSQISMVPNVGLKFSISNANIKISGKWKAQKRFLKMSGNFDLSIEGMSISADLKLGSNPTSGKPTITCSSCSSHINSVHVHISKSKVGWLIQLFHKKIESALRNKMNSQVCEKVTNSVSSELQPYFQTLPVMTKIDSVAGINYGLVAPPATTA
+>d1ex0a2 b.1.5.1 (A:516-627) Transglutaminase, two C-terminal domains {Human (Homo sapiens), blood isozyme [TaxId: 9606]}
+SNVDMDFEVENAVLGKDFKLSITFRNNSHNRYTITAYLSANITFYTGVPKAEFKKETFDVTLEPLSFKKEAVLIQAGEYMGQLLEQASLHFFVTARINETRDVLAKQKSTVL
+>d1eyea_ c.1.21.1 (A:) Dihydropteroate synthetase {Mycobacterium tuberculosis [TaxId: 1773]}
+PVQVMGVLNVTDDSFSDGGCYLDLDDAVKHGLAMAAAGAGIVDVGGESSRPGATRVDPAVETSRVIPVVKELAAQGITVSIDTMRADVARAALQNGAQMVNDVSGGRADPAMGPLLAEADVPWVLMHWRAVSADTPHVPVRYGNVVAEVRADLLASVADAVAAGVDPARLVLDPGLGFAKTAQHNWAILHALPELVATGIPVLVGASRKRFLGALLAGPDGVMRPTDGRDTATAVISALAALHGAWGVRVHDVRASVDAIKVVEAWMGAE
+>d1eyqa_ d.36.1.1 (A:) Chalcone isomerase {Alfalfa (Medicago sativa) [TaxId: 3879]}
+SITAITVENLEYPAVVTSPVTGKSYFLGGAGERGLTIEGNFIKFTAIGVYLEDIAVASLAAKWKGKSSEELLETLDFYRDIISGPFEKLIRGSKIRELSGPEYSRKVMENCVAHLKSVGTYGDAEAEAMQKFAEAFKPVNFPPGASVFYRQSPDGILGLSFSPDTSIPEKEAALIENKAVSSAVLETMIGEHAVSPDLKRCLAARLPALLNE
+>d1ez3a_ a.47.2.1 (A:) Syntaxin 1A N-terminal domain {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+RDRFMDEFFEQVEEIRGFIDKIAENVEEVKRKHSAILASPNPDEKTKEELEELMSDIKKTANKVRSKLKSIEQSIEQEEGLNRSSADLRIRKTQHSTLSRKFVEVMSEYNATQSDYRERCKGRI
+>d1ezga_ b.80.2.1 (A:) Insect cysteine-rich antifreeze protein {Yellow mealworm (Tenebrio molitor) [TaxId: 7067]}
+QCTGGADCTSCTGACTGCGNCPNAVTCTNSQHCVKANTCTGSTDCNTAQTCTNSKDCFEANTCTDSTNCYKATACTNSSGCP
+>d1f00i1 b.1.14.1 (I:658-752) Intimin {Escherichia coli [TaxId: 562]}
+ASITEIKADKTTAVANGQDAITYTVKVMKGDKPVSNQEVTFTTTLGKLSNSTEKTDTNGYAKVTLTSTTPGKSLVSARVSDVAVDVKAPEVEFFT
+>d1f0la1 b.2.1.1 (A:381-535) Diphtheria toxin, C-terminal domain {Corynebacterium diphtheriae [TaxId: 1717]}
+SPGHKTQPFLHDGYAVSWNTVEDSIIRTGFQGESGHDIKITAENTPLPIAGVLLPTIPGKLDVNKSKTHISVNGRKIRMRCRAIDGDVTFCRPKSPVYVGNGVHANLHVAFHRSSSEKIHSNEISSDSIGVLGYQKTVDHTKVNSKLSLFFEIKS
+>d1f0la3 f.1.2.1 (A:201-380) Diphtheria toxin, middle domain {Corynebacterium diphtheriae [TaxId: 1717]}
+CINLDWDVIRDKTKTKIESLKEHGPIKNKMSESPNKTVSEEKAKQYLEEFHQTALEHPELSELKTVTGTNPVFAGANYAAWAVNVAQVIDSETADNLEKTTAALSILPGIGSVMGIADGAVHHNTEEIVAQSIALSSLMVAQAIPLVGELVDIGFAAYNFVESIINLFQVVHNSYNRPAY
+>d1f1ea_ a.22.1.2 (A:) Archaeal histone {Methanopyrus kandleri [TaxId: 2320]}
+ELPKAAIERIFRQGIGERRLSQDAKDTIYDFVPTMAEYVANAAKSVLDASGKKTLMEEHLKALADVLMVEGVEDYDGELFGRATVRRILKRAGIERASSDAVDLYNKLICRATEELGEKAAEYADEDGRKTVQGEDVEKAITYSMPKGGEL
+>d1f1ma_ a.24.12.1 (A:) Outer surface protein C (OspC) {Lyme disease spirochete (Borrelia burgdorferi), different strains [TaxId: 139]}
+PNLTEISKKITESNAVVLAVKEVETLLTSIDELAKAIGKKIKSDVSLDNEADHNGSLMSGAYLISTLITKKISAIKDSGELKAEIEKAKKCSEEFTAKLKGEHTDLGKEGVTDDNAKKAILKTNNDKTKGADELEKLFESVKNLSKAAKEMLTNSVKELTSP
+>d1f32a_ d.62.1.1 (A:) Pepsin inhibitor-3 {Pig roundworm (Ascaris suum) [TaxId: 6253]}
+FLFSMSTGPFICTVKDNQVFVANLPWTMLEGDDIQVGKEFAARVEDCTNVKHDMAPTCTKPPPFCGPQDMKMFNFVGCSVLGNKLFIDQKYVRDLTAKDHAEVQTFREKIAAFEEQQENQPPSSGMPHGAVPAGGLSPPPPPSFCTV
+>d1f35a_ b.94.1.1 (A:) Olfactory marker protein {Mouse (Mus musculus) [TaxId: 10090]}
+AEDGPQKQQLEMPLVLDQDLTQQMRLRVESLKQRGEKKQDGEKLIRPAESVYRLDFIQQQKLQFDHWNVVLDKPGKVTITGTSQNWTPDLTNLMTRQLLDPAAIFWRKEDSDAMDWNEADALEFGERLSDLAKIRKVMYFLITFGEGVEPANLKASVVFNQL
+>d1f3ua_ b.65.1.1 (A:) TFIIF beta subunit, Rap30 {Human (Homo sapiens) [TaxId: 9606]}
+AERGELDLTGAKQNTGVWLVKVPKYLSQQWAKASGRGEVGKLRIAKTQGRTEVSFTLNEDLANIHDIGGKPASVSAPREHPFVLQSVGGQTLTVFTESSSDKLSLEGIVVQRAECRPA
+>d1f3va_ d.58.22.1 (A:) TRADD, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+HEEWVGSAYLFVESSLDKVVLSDAYAHPQQKVAVYRALQAALAESGGSPDVLQMLKIHRSDPQLIVQLRFCGRQPCGRFLRAYREGALRAALQRSLAAALAQHSVPLQLELRAGAERLDALLADEERCLSCILAQQPDRLRDEELAELEDALRNLKCG
+>d1f44a1 a.60.9.1 (A:20-129) Cre recombinase {Bacteriophage P1 [TaxId: 10678]}
+SDEVRKNLMDMFRDRQAFSEHTWKMLLSVCRSWAAWCKLNNRKWFPAEPEDVRDYLLYLQARGLAVKTIQQHLGQLNMLHRRSGLPRPSDSNAVSLVMRRIRKENVDAGE
+>d1f46a_ d.129.4.1 (A:) Cell-division protein ZipA, C-terminal domain {Escherichia coli [TaxId: 562]}
+RKEAVIIMNVAAHHGSELNGELLLNSIQQAGFIFGDMNIYHRHLSPDGSGPALFSLANMVKPGTFDPEMKDFTTPGVTIFMQVPSYGDELQLFKLMLQSAQHIADEVGGVVLDDQRRMMTPQKLREYQDIIREVKDANA
+>d1f4pa_ c.23.5.1 (A:) Flavodoxin {Desulfovibrio vulgaris [TaxId: 881]}
+PKALIVYGSTTGNTEYTAETIARELADAGYEVDSRDAASVEAGGLFEGFDLVLLGCSTWGDDSIELQDDFIPLFDSLEETGAQGRKVACFGCGDSSWEYFCGAVDAIEEKLKNLGAEIVQDGLRIDGDPRAARDDIVGWAHDVRGAI
+>d1f5na1 a.114.1.1 (A:284-583) Interferon-induced guanylate-binding protein 1 (GBP1), C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+GGIQVNGPRLESLVLTYVNAISSGDLPCMENAVLALAQIENSAAVQKAIAHYEQQMGQKVQLPTESLQELLDLHRDSEREAIEVFIRSSFKDVDHLFQKELAAQLEKKRDDFCKQNQEASSDRCSGLLQVIFSPLEEEVKAGIYSKPGGYRLFVQKLQDLKKKYYEEPRKGIQAEEILQTYLKSKESMTDAILQTDQTLTEKEKEIEVERVKAESAQASAKMLHEMQRKNEQMMEQKERSYQEHLKQLTEKMENDRVQLLKEQERTLALKLQEQEQLLKEGFQKESRIMKNEIQDLQTKM
+>d1f60b_ d.58.12.1 (B:) Guanine nucleotide exchange factor (GEF) domain from elongation factor-1 beta {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+PAAKSIVTLDVKPWDDETNLEEMVANVKAIEMEGLTWGAHQFIPIGFGIKKLQINCVVEDDKVSLDDLQQSIEEDEDHVQSTDIAAMQKL
+>d1f7la_ d.150.1.2 (A:) Holo-(acyl carrier protein) synthase ACPS {Bacillus subtilis [TaxId: 1423]}
+GIYGIGLDITELKRIASMAGRQKRFAERILTRSELDQYYELSEKRKNEFLAGRFAAKEAFSKAFGTGIGRQLSFQDIEIRKDQNGKPYIICTKLSPAAVHVSITHTKEYAAAQVVIER
+>d1f7ua3 d.67.2.1 (A:2-135) Arginyl-tRNA synthetase (ArgRS), N-terminal 'additional' domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+ASTANMISQLKKLSIAEPAVAKDSHPDVNIVDLMRNYISQELSKISGVDSSLIFPALEWTNTMERGDLLIPIPRLRIKGANPKDLAVQWAEKFPCGDFLEKVEANGPFIQFFFNPQFLAKLVIPDILTRKEDYG
+>d1f86a_ b.3.4.1 (A:) Transthyretin (synonym: prealbumin) {Human (Homo sapiens) [TaxId: 9606]}
+CPLMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYSTMAVVTN
+>d1fcya_ a.123.1.1 (A:) Retinoic acid receptor gamma (RAR-gamma) {Human (Homo sapiens) [TaxId: 9606]}
+ASPQLEELITKVSKAHQETFPSLCQLGKYTTNSSADHRVQLDLGLWDKFSELATKCIIKIVEFAKRLPGFTGLSIADQITLLKAACLDILMLRICTRYTPEQDTMTFSDGLTLNRTQMHNAGFGPLTDLVFAFAGQLLPLEMDDTETGLLSAICLICGDRMDLEEPEKVDKLQEPLLEALRLYARRRRPSQPYMFPRMLMKITDLRGISTKGAERAITLKMEIPGPMPPLIREMLE
+>d1fjra_ b.102.1.1 (A:) Methuselah ectodomain {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+DILECDYFDTVDISAAQKLQNGSYLFEGLLVPAILTGEYDFRILPDDSKQKVARHIRGCVCKLKPCVRFCCPHDHIMDNGVCYDNMSDEELAELDPFLNVTLDDGSVSRRHFKNELIVQWDLPMPCDGMFYLDNREEQDKYTLFENGTFFRHFDRVTLRKREYCLQHLTFADGNATSIRIAPHNCLIV
+>d1fkma1 a.69.2.1 (A:249-442) Ypt/Rab-GAP domain of gyp1p {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+NSIIQRISKFDNILKDKTIINQQDLRQISWNGIPKIHRPVVWKLLIGYLPVNTKRQEGFLQRKRKEYRDSLKHTFSDQHSRDIPTWHQIEIDIPRTNPHIPLYQFKSVQNSLQRILYLWAIRHPASGYVQGINDLVTPFFETFLTEYLPPSQIDDVEIKDPSTYMVDEQITDLEADTFWCLTKLLEQITDNYIH
+>d1flei_ g.3.14.1 (I:) Elafin, elastase-specific inhibitor {Human (Homo sapiens) [TaxId: 9606]}
+TKPGSCPIILIRCAMLNPPNRCLKDTDCPGIKKCCEGSCGMACFVPQ
+>d1fltv_ g.17.1.1 (V:) Vascular endothelial growth factor, VEGF {Human (Homo sapiens) [TaxId: 9606]}
+EVVKFMDVYQRSYCHPIETLVDIFQEYPDEIEYIFKPSCVPLMRCGGCCNDEGLECVPTEESNITMQIMRIKPHQGQHIGEMSFLQHNKCECRPK
+>d1fm0d_ d.15.3.1 (D:) Molybdopterin synthase subunit MoaD {Escherichia coli [TaxId: 562]}
+MIKVLFFAQVRELVGTDATEVAADFPTVEALRQHMAAQSDRWALALEDGKLLAAVNQTLVSFDHPLTDGDEVAFFPPVTGG
+>d1fm0e_ d.41.5.1 (E:) Molybdopterin synthase subunit MoaE {Escherichia coli [TaxId: 562]}
+AETKIVVGPQPFSVGEEYPWLAERDEDGAVVTFTGKVRNHNLGDSVNALTLEHYPGMTEKALAEIVDEARNRWPLGRVTVIHRIGELWPGDEIVFVGVTSAHRSSAFEAGQFIMDYLKTRAPFWKREATPEGDRWVEARESDQQAAKRW
+>d1fn9a_ d.196.1.1 (A:) Outer capsid protein sigma 3 {Reovirus [TaxId: 10891]}
+MEVCLPNGHQVVDLINNAFEGRVSIYSAQEGWDKTISAQPDMMVCGGAVVCMHCLGVVGSLQRKLKHLPHHRCNQQIRHQDYVDVQFADRVTAHWKRGMLSFVAQMHEMMNDVSPDDLDRVRTEGGSLVELNWLQVDPNSMFRSIHSSWTDPLQVVDDLDTKLDQYWTALNLMIDSSDLIPNFMMRDPSHAFNGVKLGGDARQTQFSRTFDSRSSLEWGVMVYDYSELEHDPSKGRAYRKELVTPARDFGHFGLSHYSRATTPILGKMPAVFSGMLTGNCKMYPFIKGTAKLKTVRKLVEAVNHAWGVEKIRYALGPGGMTGWYNRTMQQAPIVLTPAALTMFPDTIKFGDLNYPVMIGDPMILG
+>d1fpoa2 a.23.1.1 (A:77-171) HSC20 (HSCB), C-terminal oligomerisation domain {Escherichia coli [TaxId: 562]}
+FDLASEQHTVRDTAFLMEQLELREELDEIEQAKDEARLESFIKRVKKMFDTRHQLMVEQLDNETWDAAADTCRKLRFLDKLRSSAEQLEEKLLDF
+>d1fs1a1 a.158.1.1 (A:109-149) Skp2 {Human (Homo sapiens) [TaxId: 9606]}
+WDSLPDELLLGIFSCLCLPELLKVSGVCKRWYRLASDESLW
+>d1fs1b1 a.157.1.1 (B:86-140) Cyclin A/CDK2-associated p45, Skp1 {Human (Homo sapiens) [TaxId: 9606]}
+PVWDQEFLKVDQGTLFELILAANYLDIKGLLDVTCKTVANMIKGKTPEEIRKTFN
+>d1fsga_ c.61.1.1 (A:) Hypoxanthine-guanine-xanthine PRTase {Toxoplasma gondii [TaxId: 5811]}
+GSHMASKPIEDYGKGKGRIEPMYIPDNTFYNADDFLVPPHCKPYIDKILLPGGLVKDRVEKLAYDIHRTYFGEELHIICILKGSRGFFNLLIDYLATIQKYSGRESSVPPFFEHYVRLKSYQNDNSTGQLTVLSDDLSIFRDKHVLIVEDIVDTGFTLTEFGERLKAVGPKSMRIATLVEKRTDRSNSLKGDFVGFSIEDVWIVGCCYDFNEMFRDFDHVAVLSDAARKKFEK
+>d1ftra1 d.58.33.1 (A:1-148) Formylmethanofuran:tetrahydromethanopterin formyltransferase {Methanopyrus kandleri [TaxId: 2320]}
+MEINGVEIEDTFAEAFEAKMARVLITAASHKWAMIAVKEATGFGTSVIMCPAEAGIDCGYVPPEETPDGRPGVTIMIGHNDEDELKEQLLDRIGQCVMTAPTASAFDAMPEAEKEDEDRVGYKLSFFGDGYQEEDELDGRKVWKIPVV
+>d1fuia1 b.43.2.1 (A:356-591) L-fucose isomerase, C-terminal domain {Escherichia coli [TaxId: 562]}
+AQVFADVRTYWSPEAIERVTGHKLDGLAEHGIIHLINSGSAALDGSCKQRDSEGNPTMKPHWEISQQEADACLAATEWCPAIHEYFRGGGYSSRFLTEGGVPFTMTRVNIIKGLGPVLQIAEGWSVELPKDVHDILNKRTNSTWPTTWFAPRLTGKGPFTDVYSVMANWGANHGVLTIGHVGADFITLASMLRIPVCMHNVEETKVYRPSAWAAHGMDIEGQDYRACQNYGPLYKR
+>d1fuia2 c.85.1.1 (A:1-355) L-fucose isomerase, N-terminal and second domains {Escherichia coli [TaxId: 562]}
+MKKISLPKIGIRPVIDGRRMGVRESLEEQTMNMAKATAALLTEKLRHACGAAVECVISDTCIAGMAEAAACEEKFSSQNVGLTITVTPCWCYGSETIDMDPTRPKAIWGFNGTERPGAVYLAAALAAHSQKGIPAFSIYGHDVQDADDTSIPADVEEKLLRFARAGLAVASMKGKSYLSLGGVSMGIAGSIVDHNFFESWLGMKVQAVDMTELRRRIDQKIYDEAELEMALAWADKNFRYGEDENNKQYQRNAEQSRAVLRESLLMAMCIRDMMQGNSKLADIGRVEESLGYNAIAAGFQGQRHWTDQYPNGDTAEAILNSSFDWNGVREPFVVATENDSLNGVAMLMGHQLTGT
+>d1fwxa2 b.69.3.1 (A:8-451) Nitrous oxide reductase, N-terminal domain {Paracoccus denitrificans [TaxId: 266]}
+ADGSVAPGQLDDYYGFWSSGQSGEMRILGIPSMRELMRVPVFNRCSATGWGQTNESVRIHERTMSERTKKFLAANGKRIHDNGDLHHVHMSFTEGKYDGRFLFMNDKANTRVARVRCDVMKCDAILEIPNAKGIHGLRPQKWPRSNYVFCNGEDETPLVNDGTNMEDVANYVNVFTAVDADKWEVAWQVLVSGNLDNCDADYEGKWAFSTSYNSEKGMTLPEMTAAEMDHIVVFNIAEIEKAIAAGDYQELNGVKVVDGRKEASSLFTRYIPIANNPHGCNMAPDKKHLCVAGKLSPTVTVLDVTRFDAVFYENADPRSAVVAEPELGLGPLHTAFDGRGNAYTSLFLDSQVVKWNIEDAIRAYAGEKVDPIKDKLDVHYQPGHLKTVMGETLDATNDWLVCLSKFSKDRFLNVGPLKPENDQLIDISGDKMVLVHDGPTFAEPHDAIAVHPSILSDIK
+>d1fx2a_ d.58.29.1 (A:) Receptor-type monomeric adenylyl cyclase {Trypanosome (Trypanosoma brucei), different isoform [TaxId: 5691]}
+NNNRAPKEPTDPVTLIFTDIESSTALWAAHPDLMPDAVAAHHRMVRSLIGRYKCYEVKTVGDSFMIASKSPFAAVQLAQELQLCFLHHDWGTNALDDSYREFEEQRAEGECEYTPPTAHMDPEVYSRLWNGLRVRVGIHTGLCDIRHDEVTKGYDYYGRTPNMAARTESVANGGQVLMTHAAYMSLSAEDRKQIDVTALGDVALRGVSDPVKMYQLNTVPSRNFAALRLDREYFD
+>d1fxka_ a.2.5.1 (A:) Prefoldin beta subunit {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+QNVQHQLAQFQQLQQQAQAISVQKQTVEMQINETQKALEELSRAADDAEVYKSSGNILIRVAKDELTEELQEKLETLQLREKTIERQEERVMKKLQEMQVNIQEAMK
+>d1g2ra_ d.192.1.1 (A:) Hypothetical cytosolic protein SP0554 {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+RKIPLRKSVVSNEVIDKRDLLRIVKNKEGQVFIDPTGKANGRGAYIKLDNAEALEAKKKKVFNRSFSMEVEESFYDELIAYVDHKVKRRELGLE
+>d1g2ya_ a.34.2.1 (A:) Hepatocyte nuclear factor 1 (HNF-1), N-terminal domain {Mouse (Mus musculus) [TaxId: 10090]}
+MVSKLSQLQTEMLAALLESGLSKEALIQALG
+>d1g3pa1 b.37.1.1 (A:1-65) N-terminal domains of the minor coat protein g3p {Bacteriophage M13 [TaxId: 10870]}
+AETVESCLAKSHTENSFTNVWKDDKTLDRYANYEGCLWNATGVVVCTGDETQCYGTWVPIGLAIP
+>d1g4yb_ f.15.1.1 (B:) Small-conductance potassium channel {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+DTQLTKRVKNAAANVLRETWLIYKNTKLVKKIDHAKVRKHQRKFLQAIHQLRSVKMEQRKLNDQANTLVDLAKTQLEHHHHH
+>d1g66a_ c.69.1.30 (A:) Acetylxylan esterase {Penicillium purpurogenum [TaxId: 28575]}
+SCPAIHVFGARETTASPGYGSSSTVVNGVLSAYPGSTAEAINYPACGGQSSCGGASYSSSVAQGIAAVASAVNSFNSQCPSTKIVLVGYSQGGEIMDVALCGGGDPNQGYTNTAVQLSSSAVNMVKAAIFMGDPMFRAGLSYEVGTCAAGGFDQRPAGFSCPSAAKIKSYCDASDPYCCNGSNAATHQGYGSEYGSQALAFVKSKLG
+>d1g6sa_ d.68.2.2 (A:) 5-enol-pyruvyl shikimate-3-phosphate (EPSP) synthase {Escherichia coli [TaxId: 562]}
+MESLTLQPIARVDGTINLPGSKSVSNRALLLAALAHGKTVLTNLLDSDDVRHMLNALTALGVSYTLSADRTRCEIIGNGGPLHAEGALELFLGNAGTAMRPLAAALCLGSNDIVLTGEPRMKERPIGHLVDALRLGGAKITYLEQENYPPLRLQGGFTGGNVDVDGSVSSQFLTALLMTAPLAPEDTVIRIKGDLVSKPYIDITLNLMKTFGVEIENQHYQQFVVKGGQSYQSPGTYLVEGDASSASYFLAAAAIKGGTVKVTGIGRNSMQGDIRFADVLEKMGATICWGDDYISCTRGELNAIDMDMNHIPDAAMTIATAALFAKGTTTLRNIYNWRVKETDRLFAMATELRKVGAEVEEGHDYIRITPPEKLNFAEIATYNDHRMAMCFSLVALSDTPVTILDPKCTAKTFPDYFEQLARISQAA
+>d1g6xa_ g.8.1.1 (A:) Pancreatic trypsin inhibitor, BPTI {Cow (Bos taurus) [TaxId: 9913]}
+RPDFCLEPPYAGACRARIIRYFYNAKAGLCQTFVYGGCRAKRNNFKSAEDCLRTCGGA
+>d1g73a_ a.7.4.1 (A:) Smac/diablo {Human (Homo sapiens) [TaxId: 9606]}
+AVPIAQKSEPHSLSSEALMRRAVSLVTDSTSTDLSQTTYALIEAITEYTKAVYTLTSLYRQYTSLLGKMNSEEEDEVWQVIIGARAEMTSKHQEYLKLETTWMTAVGLSEMAAEAAYQTGADQASITARNHIQLVKLQVEEVHQLSRKAETKLAEAQ
+>d1g7sa3 c.20.1.1 (A:329-459) Initiation factor IF2/eIF5b, domain 3 {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+DPEKVREEILSEIEDIKIDTDEAGVVVKADTLGSLEAVVKILRDMYVPIKVADIGDVSRRDVVNAGIALQEDRVYGAIIAFNVKVIPSAAQELKNSDIKLFQGNVIYRLMEEYEEWVRGIEEEKKKKWMEA
+>d1g8ea_ a.145.1.1 (A:) Flagellar transcriptional activator FlhD {Escherichia coli [TaxId: 562]}
+MHTSELLKHIYDINLSYLLLAQRLIVQDKASAMFRLGINEEMATTLAALTLPQMVKLAETNQLVCHFRFDSHQTITQLTQDSRVDDLQQIHTGIMLST
+>d1g8qa_ a.135.1.1 (A:) CD81 extracellular domain {Human (Homo sapiens) [TaxId: 9606]}
+FVNKDQIAKDVKQFYDQALQQAVVDDDANNAKAVVKTFHETLDCCGSSTLTALTTSVLKNNLCPSGSNIISNLFKEDCHQKIDDLFSGKH
+>d1g8ta_ d.4.1.2 (A:) Sm endonuclease {Serratia marcescens [TaxId: 615]}
+SIDNCAVGCPTGGSSNVSIVRHAYTLNNNSTTKFANWVAYHITKDTPASGKTRNWKTDPALNPADTLAPADYTGANAALKVDRGHQAPLASLAGVSDWESLNYLSNITPQKSDLNQGAWARLEDQERKLIDRADISSVYTVTGPLYERDMGKLPGTQKAHTIPSAYWKVIFINNSPAVNHYAAFLFDQNTPKGADFCQFRVTVDEIEKRTGLIIWAGLPDDVQASLKSKPGVLPELMGCKN
+>d1gcia_ c.41.1.1 (A:) Subtilisin {Bacillus lentus [TaxId: 1467]}
+AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
+>d1gd8a_ d.188.1.1 (A:) Prokaryotic ribosomal protein L17 {Thermus thermophilus [TaxId: 274]}
+SSHRLALYRNQAKSLLTHGRITTTVPKAKELRGFVDHLIHLAKRGDLHARRLVLRDLQDVKLVRKLFDEIAPRYRDRQGGYTRVLKLAERRRGDGAPLALVELVE
+>d1gdna_ b.47.1.2 (A:) Trypsin(ogen) {Fungus (Fusarium oxysporum) [TaxId: 5507]}
+IVGGTSASAGDFPFIVSISRNGGPWCGGSLLNANTVLTAAHCVSGYAQSGFQIRAGSLSRTSGGITSSLSSVRVHPSYSGNNNDLAILKLSTSIPSGGNIGYARLAASGSDPVAGSSATVAGWGATSEGGSSTPVNLLKVTVPIVSRATCRAQYGTSAITNQMFCAGVSSGGKDSCQGDSGGPIVDSSNTLIGAVSWGNGCARPNYSGVYASVGALRSFIDTYA
+>d1gkma_ a.127.1.2 (A:) Histidine ammonia-lyase (HAL) {Pseudomonas putida [TaxId: 303]}
+TELTLKPGTLTLAQLRAIHAAPVRLQLDASAAPAIDASVACVEQIIAEDRTAYGINTGFGLLASTRIASHDLENLQRSLVLSHAAGIGAPLDDDLVRLIMVLKINSLSRGFSGIRRKVIDALIALVNAEVYPHIPLKGSVGASGDLAPLAHMSLVLLGEGKARYKGQWLSATEALAVAGLEPLTLAAKEGLALLNGTQASTAYALRGLFYAEDLYAAAIACGGLSVEAVLGSRSPFDARIHEARGQRGQIDTAACFRDLLGDSSEVSLSHKNADKVQDPYSLRCQPQVMGACLTQLRQAAEVLGIEANAVSDNPLVFAAEGDVISGGNFHAEPVAMAADNLALAIAEIGSLSERRISLMMDKHMSQLPPFLVENGGVNSGFMIAQVTAAALASENKALSHPHSVDSLPTSANQEDHVSMAPAAGKRLWEMAENTRGVLAIEWLGACQGLDLRKGLKTSAKLEKARQALRSEVAHYDRDRFFAPDIEKAVELLAKGSLTGLLPAGVLPSL
+>d1gkza1 a.29.5.1 (A:38-185) Branched-chain alpha-ketoacid dehydrogenase kinase (BCK) {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+VRLTPTMMLYSGRSQDGSHLLKSGRYLQQELPVRIAHRIKGFRSLPFIIGCNPTILHVHELYIRAFQKLTDFPPIKDQADEAQYCQLVRQLLDDHKDVVTLLAEGLRESRKHIEDEKLVRYFLDKTLTSRLGIRMLATHHLALHEDKP
+>d1gl1i_ g.4.1.1 (I:) Protease inhibitor PMP-C {Migratory locust (Locusta migratoria) [TaxId: 7004]}
+ISCEPGKTFKDKCNTCRCGADGKSAACTLKACPN
+>d1gmua1 b.107.1.1 (A:1-70) Urease metallochaperone UreE, N-terminal domain {Klebsiella aerogenes [TaxId: 28451]}
+MLYLTQRLEIPAAATASVTLPIDVRVKSRVKVTLNDGRDAGLLLPRGLLLRGGDVLSNEEGTEFVQVIAA
+>d1gmua2 d.58.38.1 (A:71-138) Urease metallochaperone UreE, C-terminal domain {Klebsiella aerogenes [TaxId: 28451]}
+DEEVSVVRCDDPFMLAKACYALGNRHVPLQIMPGELRYHHDHVLDDMLRQFGLTVTFGQLPFEPEAGA
+>d1gmxa_ c.46.1.3 (A:) Sulfurtransferase GlpE {Escherichia coli [TaxId: 562]}
+MDQFECINVADAHQKLQEKEAVLVDIRDPQSFAMGHAVQAFHLTNDTLGAFMRDNDFDTPVMVMCYHGNSSKGAAQYLLQQGYDVVYSIDGGFEAWQRQFPAEVAYGA
+>d1go3e2 d.230.1.1 (E:1-78) N-terminal, heterodimerisation domain of RBP7 (RpoE) {Methanococcus jannaschii [TaxId: 2190]}
+MYKILEIADVVKVPPEEFGKDLKETVKKILMEKYEGRLDKDVGFVLSIVDVKDIGEGKVVHGDGSAYHPVVFETLVYI
+>d1goia1 b.72.2.1 (A:447-498) Chitinase B, C-terminal domain {Serratia marcescens [TaxId: 615]}
+NLPIMTAPAYVPGTTYAQGALVSYQGYVWQTKWGYITSAPGSDSAWLKVGRV
+>d1gp0a_ b.64.1.1 (A:) Cation-independent mannose-6-phosphate receptor (MIR-receptor) {Human (Homo sapiens) [TaxId: 9606]}
+DCQVTNPSTGHLFDLSSLSGRAGFTAAYSEKGLVYMSICGENENCPPGVGACFGQTRISVGKANKRLRYVDQVLQLVYKDGSPCPSKSGLSYKSVISFVCRPEAGPTNRPMLISLDKQTCTLFFSWHTPLACE
+>d1gpja1 a.151.1.1 (A:303-404) Glutamyl tRNA-reductase dimerization domain {Methanopyrus kandleri [TaxId: 2320]}
+EIPKVEKLIEEELSTVEEELEKLKERRLVADVAKSLHEIKDRELERALRRLKTGDPENVLQDFAEAYTKRLINVLTSAIMELPDEYRRAASRALRRASELNG
+>d1gpja3 d.58.39.1 (A:1-143) Glutamyl tRNA-reductase catalytic, N-terminal domain {Methanopyrus kandleri [TaxId: 2320]}
+MEDLVSVGITHKEAEVEELEKARFESDEAVRDIVESFGLSGSVLLQTSNRVEVYASGARDRAEELGDLIHDDAWVKRGSEAVRHLFRVASGLESMMVGEQEILRQVKKAYDRAARLGTLDEALKIVFRRAINLGKRAREETRI
+>d1gpma3 d.52.2.1 (A:405-525) GMP synthetase C-terminal dimerisation domain {Escherichia coli [TaxId: 562]}
+GPGLGVRVLGEVKKEYCDLLRRADAIFIEELRKADLYDKVSQAFTVFLPVRSVGVMGDGRKYDWVVSLRAVETIDFMTAHWAHLPYDFLGRVSNRIINEVNGISRVVYDISGKPPATIEWE
+>d1gppa_ b.86.1.2 (A:) VMA1-derived endonuclease (VDE) PI-Scei intein {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+SACFAKGTNVLMADGSIECIENIEVGNKVMGKDGRPREVIKLPRGSETMYSVVQKSQHRAHKSDSSREMPELLKFTCNATHELVVRTPRSVRRLSRTIKGVEYFEVITFEMGQKKAPDGRIVELVKEVSKSYPVSEGPERANELVESYRKASNKAYFEWTIEARDLSLLGSHVRKATYQTYAPIGAAFARECRGFYFELQELKEDDYYGITLSDDSDHQFLLANQVVVH
+>d1gpqa_ d.233.1.1 (A:) Inhibitor of vertebrate lysozyme, Ivy {Escherichia coli [TaxId: 562]}
+DDLTISSLAKGETTKAAFNQMVQGHKLPAWVMKGGTYTPAQTVTLGDETYQVMSACKPHDCGSQRIAVMWSEKSNQMTGLFSTIDEKTSQEKLTWLNVNDALSIDGKTVLFAALTGSLENHPDGFNF
+>d1gqea_ e.38.1.1 (A:) Polypeptide chain release factor 2 (RF2) {Escherichia coli [TaxId: 562]}
+INPVNNRIQDLTERSDVLRGYLDYDAKKERLEEVNAELEQPDVWNEPERAQALGKERSSLEAVVDTLDQMKQGLEDVSGLLELAVEADDEETFNEAVAELDALEEKLAQLEFRRMFSGEYDSADCYLDIQAGSGGTEAQDWASMLERMYLRWAESRGFKTEIIEESEGEVAGIKSVTIKISGDYAYGWLRTETGVHRLVRKSPFDSGGRRHTSFSSAFVYPEVDDDIDIEINPADLRIDVYRASGAGGQHVNRTESAVRITHIPTGIVTQCQNDRSQHKNKDQAMKQMKAKLYEVEMQKKNAEKQAMEDNKSDIGWGSQIRSYVLDDSRIKDLRTGVETRNTQAVLDGSLDQFIEASLKAGL
+>d1gqia2 d.92.2.2 (A:5-151) alpha-D-glucuronidase, N-terminal domain {Pseudomonas cellulosa [TaxId: 155077]}
+EDGYDMWLRYQPIADQTLLKTYQKQIRHLHVAGDSPTINAAAAELQRGLSGLLNKPIVARDEKLKDYSLVIGTPDNSPLIASLNLGERLQALGAEGYLLEQTRINKRHVVIVAANSDVGVLYGSFHLLRLIQTQHALEKLSLSSAPR
+>d1gs9a_ a.24.1.1 (A:) Apolipoprotein E {Human (Homo sapiens), E4 [TaxId: 9606]}
+SGQRWELALGRFWDYLRWVQTLSEQVQEELLSSQVTQELRALMDETMKELKAYKSELEEQLTPVAEETRARLSKELQAAQARLGADMEDVRGRLVQYRGEVQAMLGQSTEELRVRLASHLRKLRKRLLRDADDLQKRLAVYQAG
+>d1gtea1 a.1.2.2 (A:2-183) Dihydropyrimidine dehydrogenase, N-terminal domain {Pig (Sus scrofa) [TaxId: 9823]}
+APVLSKDVADIESILALNPRTQSHAALHSTLAKKLDKKHWKRNPDKNCFHCEKLENNFDDIKHTTLGERGALREAMRCLKCADAPCQKSCPTHLDIKSFITSISNKNYYGAAKMIFSDNPLGLTCGMVCPTSDLCVGGCNLYATEEGSINIGGLQQFASEVFKAMNIPQIRNPCLPSQEKMP
+>d1gvna_ a.8.2.1 (A:) Plasmid maintenance system epsilon/zeta, antidote epsilon subunit {Streptococcus pyogenes [TaxId: 1314]}
+VTYEKTFEIEIINELSASVYNRVLNYVLNHELNKNDSQLLEVNLLNQLKLAKRVNLFDYSLEELQAVHEYWRSMNRYSKQVLNKEKVA
+>d1gwea_ e.5.1.1 (A:) Catalase I {Micrococcus lysodeikticus [TaxId: 1270]}
+TTPHATGSTRQNGAPAVSDRQSLTVGSEGPIVLHDTHLLETHQHFNRMNIPERRPHAKGSGAFGEFEVTEDVSKYTKALVFQPGTKTETLLRFSTVAGELGSPDTWRDVRGFALRFYTEEGNYDLVGNNTPIFFLRDPMKFTHFIRSQKRLPDSGLRDATMQWDFWTNNPESAHQVTYLMGPRGLPRTWREMNGYGSHTYLWVNAQGEKHWVKYHFISQQGVHNLSNDEATKIAGENADFHRQDLFESIAKGDHPKWDLYIQAIPYEEGKTYRFNPFDLTKTISQKDYPRIKVGTLTLNRNPENHFAQIESAAFSPSNTVPGIGLSPDRMLLGRAFAYHDAQLYRVGAHVNQLPVNRPKNAVHNYAFEGQMWYDHTGDRSTYVPNSNGDSWSDETGPVDDGWEADGTLTREAQALRADDDDFGQAGTLVREVFSDQERDDFVETVAGALKGVRQDVQARAFEYWKNVDATIGQRIEDEVKRHEGDGIPGVEAGGEARI
+>d1gxma_ a.102.5.1 (A:) Polygalacturonic acid lyase (pectate lyase) {Cellvibrio cellulosa [TaxId: 155077]}
+MTGRMLTLDGNPAANWLNNARTKWSASRADVVLSYQQNNGGWPKNLDYNSVGNGGGGNESGTIDNGATITEMVFLAEVYKSGGNTKYRDAVRKAANFLVNSQYSTGALPQFYPLKGGYSDHATFNDNGMAYALTVLDFAANKRAPFDTDVFSDNDRTRFKTAVTKGTDYILKAQWKQNGVLTVWCAQHGALDYQPKKARAYELESLSGSESVGVLAFLMTQPQTAEIEQAVRAGVAWFNSPRTYLEGYTYDSSLAATNPIVPRAGSKMWYRFYDLNTNRGFFSDRDGSKFYDITQMSLERRTGYSWGGNYGTSIINFAQKVGYL
+>d1gxua_ d.58.10.1 (A:) Hydrogenase maturation protein HypF N-terminal domain (HypF-ACP) {Escherichia coli [TaxId: 562]}
+NTSCGVQLRIRGKVQGVGFRPFVWQLAQQLNLHGDVCNDGDGVEVRLREDPEVFLVQLYQHCPPLARIDSVEREPFIWSALPTEFTIR
+>d1gzsb_ a.168.1.1 (B:) GEF domain of SopE toxin {Salmonella typhimurium [TaxId: 90371]}
+GSLTNKVVKDFMLQTLNDIDIRGSASKDPAYASQTREAILSAVYSKNKDQCCNLLISKGINIAPFLQEIGEAAKNAGLPGTTKNDVFTPSGAGANPFITPLISSANSKYPRMFINQHQQASFKIYAEKIIMTEVAPLFNECAMPTPQQFQLILENIANKYIQNTP
+>d1h16a_ c.7.1.1 (A:) Pyruvate formate-lyase, PFL {Escherichia coli [TaxId: 562]}
+SELNEKLATAWEGFTKGDWQNEVNVRDFIQKNYTPYEGDESFLAGATEATTTLWDKVMEGVKLENRTHAPVDFDTAVASTITSHDAGYINKQLEKIVGLQTEAPLKRALIPFGGIKMIEGSCKAYNRELDPMIKKIFTEYRKTHNQGVFDVYTPDILRCRKSGVLTGLPDAYGRGRIIGDYRRVALYGIDYLMKDKLAQFTSLQADLENGVNLEQTIRLREEIAEQHRALGQMKEMAAKYGYDISGPATNAQEAIQWTYFGYLAAVKSQNGAAMSFGRTSTFLDVYIERDLKAGKITEQEAQEMVDHLVMKLRMVRFLRTPEYDELFSGDPIWATESIGGMGLDGRTLVTKNSFRFLNTLYTMGPSPEPNMTILWSEKLPLNFKKFAAKVSIDTSSLQYENDDLMRPDFNNDDYAIACCVSPMIVGKQMQFFGARANLAKTMLYAINGGVDEKLKMQVGPKSEPIKGDVLNYDEVMERMDHFMDWLAKQYITALNIIHYMHDKYSYEASLMALHDRDVIRTMACGIAGLSVAADSLSAIKYAKVKPIRDEDGLAIDFEIEGEYPQFGNNDPRVDDLAVDLVERFMKKIQKLHTYRDAIPTQSVLTITSNVVYGKKTGNTPDGRRAGAPFGPGANPMHGRDQKGAVASLTSVAKLPFAYAKDGISYTFSIVPNALGKDDEVRKTNLAGLMDGYFHHEASIEGGQHLNVNVMNREMLLDAMENPEKYPQLTIRVSGYAVRFNSLTKEQQQDVITRTFTQSM
+>d1h2ca_ b.31.1.1 (A:) EV matrix protein {Ebola virus [TaxId: 205488]}
+VSSAFILEAMVNVISGPKVLMKQIPIWLPLGVADQKTYSFDSTTAAIMLASYTITHFGKATNPLVRVNRLGPGIPDHPLRLLRIGNQAFLQEFVLPPVQLPQYFTFDLTALKLITQPLPAATWTD
+>d1h2sb_ f.17.4.1 (B:) Sensory rhodopsin II transducer, Htr2 {Natronomonas pharaonis [TaxId: 2257]}
+GAVFIFVGALTVLFGAIAYGEVTAAAATGDAAAVQEAAVSAILGLIILLGINLGLVAATL
+>d1h4ax1 b.11.1.1 (X:1-85) gamma-Crystallin {Human (Homo sapiens), isoform D [TaxId: 9606]}
+GKITLYEDRGFQGRHYECSSDHPNLQPYLSRCNSARVDSGCWMLYEQPNYSGLQYFLHRGDYADHQQWMGLSDSVRSCRLIPHSG
+>d1h4ra1 a.11.2.1 (A:104-214) Merlin {Human (Homo sapiens) [TaxId: 9606]}
+NAEEELVQEITQHLFFLQVKKQILDEKIYCPPEASVLLASYAVQAKYGDYDPSVHKRGFLAQEELLPKRVINLYQMTPEMWEERITAWYAEHRGRARDEAEMEYLKIAQDL
+>d1h4xa_ c.13.2.1 (A:) Anti-sigma factor antagonist SpoIIaa {Bacillus sphaericus [TaxId: 1421]}
+AFQLEMVTRETVVIRLFGELDHHAVEQIRAKISTAIFQGAVTTIIWNFERLSFMDSSGVGLVLGRMRELEAVAGRTILLNPSPTMRKVFQFSGLGPWMMDATEEEAIDRVR
+>d1h5wa_ e.27.1.1 (A:) Upper collar protein gp10 (connector protein) {Bacteriophage phi-29 [TaxId: 10756]}
+RQKRNRWFIHYLNYLQSLAYQLFEWENLPPTINPSFLEKSIHQFGYVGFYKDPVISYIACNGALSGQRDVYNQATVFRAASPVYQKEFKLYNYRDMKEEDMGVVIYNNDMAFPTTPTLELFAAELAELKEIISVNQNAQKTPVLIRANDNNQLSLKQVYNQYEGNAPVIFAHEALDSDSIEVFKTDAPYVVDKLNAQKNAVWNEMMTFLGIKNANLEKKERMVTDEVSSNDEQIESSGTVFLKSREEACEKINELYGLNVKVKFRYDI
+>d1h7ca_ a.7.5.1 (A:) Tubulin chaperone cofactor A {Human (Homo sapiens) [TaxId: 9606]}
+PRVRQIKIKTGVVRRLVKERVMYEKEAKQQEEKIEKMRAEDGENYDIKKQAEILQESRMMIPDCQRRLEAAYLDLQRILENEKDLEEAEEYKEARLVLDSVKL
+>d1h99a1 a.142.1.1 (A:54-168) Transcriptional antiterminator LicT {Bacillus subtilis [TaxId: 1423]}
+GAMEKFKTLLYDIPIECMEVSEEIISYAKLQLGKKLNDSIYVSLTDHINFAIQRNQKGLDIKNALLWETKRLYKDEFAIGKEALVMVKNKTGVSLPEDEAGFIALHIVNAELNEE
+>d1hbna1 a.89.1.1 (A:270-549) Alpha chain {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+RRARGENEPGGVPFGYLADICQSSRVNYEDPVRVSLDVVATGAMLYDQIWLGSYMSGGVGFTQYATAAYTDNILDDFTYFGKEYVEDKYGLCEAPNNMDTVLDVATEVTFYGLEQYEEYPALLEDQFGGSQRAAVVAAAAGCSTAFATGNAQTGLSGWYLSMYLHKEQHSRLGFYGYDLQDQCGASNVFSIRGDEGLPLELRGPNYPNYAMNVGHQGEYAGISQAPHAARGDAFVFNPLVKIAFADDNLVFDFTNVRGEFAKGALREFEPAGERALITPA
+>d1hbna2 d.58.31.2 (A:2-269) Alpha chain {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+ADKLFINALKKKFEESPEEKKTTFYTLGGWKQSERKTEFVNAGKEVAAKRGIPQYNPDIGTPLGQRVLMPYQVSTTDTYVEGDDLHFVNNAAMQQMWDDIRRTVIVGLNHAHAVIEKRLGKEVTPETITHYLETVNHAMPGAAVVQEHMVETHPALVADSYVKVFTGNDEIADEIDPAFVIDINKQFPEDQAETLKAEVGDGIWQVVRIPTIVSRTCDGATTSRWSAMQIGMSMISAYKQAAGEAATGDFAYAAKHAEVIHMGTYLPV
+>d1hc7a3 d.68.5.1 (A:404-477) C-terminal domain of ProRS {Thermus thermophilus [TaxId: 274]}
+TRKVDTYEAFKEAVQEGFALAFHCGDKACERLIQEETTATTRCVPFEAEPEEGFCVRCGRPSAYGKRVVFAKAY
+>d1he1a_ a.24.11.1 (A:) ExoS toxin {Pseudomonas aeruginosa [TaxId: 287]}
+ASSAVVFKQMVLQQALPMTLKGLDKASELATLTPEGLAREHSRLASGDGALRSLSTALAGIRAGSQVEESRIQAGRLLERSIGGIALQQWGTTGGAASQLVLDASPELRREITDQLHQVMSEVALLRQAVESEVS
+>d1hf2a1 b.80.3.1 (A:100-206) Cell-division inhibitor MinC, C-terminal domain {Thermotoga maritima [TaxId: 2336]}
+TGKVIKRNIRSGQTVVHSGDVIVFGNVNKGAEILAGGSVVVFGKAQGNIRAGLNEGGQAVVAALDLQTSLIQIAGFITHSKGEENVPSIAHVKGNRIVIEPFDKVSF
+>d1hf2a2 c.102.1.1 (A:1-99) Cell-division inhibitor MinC, N-terminal domain {Thermotoga maritima [TaxId: 2336]}
+MVDFKMTKEGLVLLIKDYQNLEEVLNAISARITQMGGFFAKGDRISLMIENHNKHSQDIPRIVSHLRNLGLEVSQILVGSTVEGKENDLKVQSRTTVES
+>d1hfes_ a.137.4.1 (S:) Fe-only hydrogenase smaller subunit {Desulfovibrio desulfuricans [TaxId: 876]}
+VKQIKDYMLDRINGVYGADAKFPVRASQDNTQVKALYKSYLEKPLGHKSHDLLHTHWFDKSKGVKELTTAGKLPNPRASEFEGPYPYE
+>d1hi9a_ c.99.1.1 (A:) Zn-dependent D-aminopeptidase DppA {Bacillus subtilis [TaxId: 1423]}
+MKLYMSVDMEGISGLPDDTFVDSGKRNYERGRLIMTEEANYCIAEAFNSGCTEVLVNDSHSKMNNLMVEKLHPEADLISGDVKPFSMVEGLDDTFRGALFLGYHARASTPGVMSHSMIFGVRHFYINDRPVGELGLNAYVAGYYDVPVLMVAGDDRAAKEAEELIPNVTTAAVKQTISRSAVKCLSPAKRGRLLTEKTAFALQNKDKVKPLTPPDRPVLSIEFANYGQAEWANLMPGTEIKTGTTTVQFQAKDMLEAYQAMLVMTELAMRTSFC
+>d1hp1a1 d.114.1.1 (A:363-550) 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain {Escherichia coli [TaxId: 562]}
+KIGETNGRLEGDRDKVRFVQTNMGRLILAAQMDRTGADFAVMSGGGIRDSIEAGDISYKNVLKVQPFGNVVVYADMTGKEVIDYLTAVAQMKPDSGAYPQFANVSFVAKDGKLNDLKIKGEPVDPAKTYRMATLNFNATGGDGYPRLDNKPGYVNTGFIDAEVLKAYIQKSSPLDVSVYEPKGEVSWQ
+>d1hq1a_ a.36.1.1 (A:) Signal sequence binding protein Ffh {Escherichia coli [TaxId: 562]}
+GFDLNDFLEQLRQMKNMGGMASLMGKLPGMGQIPDNVKSQMDDKVLVRMEAIINSMTMKERAKPEIIKGSRKRRIAAGSGMQVQDVNRLLKQFDDMQRMMKKMK
+>d1hqsa_ c.77.1.1 (A:) Isocitrate dehydrogenase, ICDH {Bacillus subtilis [TaxId: 1423]}
+MAQGEKITVSNGVLNVPNNPIIPFIEGDGTGPDIWNAASKVLEAAVEKAYKGEKKITWKEVYAGEKAYNKTGEWLPAETLDVIREYFIAIKGPLTTPVGGGIRSLNVALRQELDLFVCLRPVRYFTGVPSPVKRPEDTDMVIFRENTEDIYAGIEYAKGSEEVQKLISFLQNELNVNKIRFPETSGIGIKPVSEEGTSRLVRAAIDYAIEHGRKSVTLVHKGNIMKFTEGAFKNWGYELAEKEYGDKVFTWAQYDRIAEEQGKDAANKAQSEAEAAGKIIIKDSIADIFLQQILTRPNEFDVVATMNLNGDYISDALAAQVGGIGIAPGANINYETGHAIFEATHGTAPKYAGLDKVNPSSVILSGVLLLEHLGWNEAADLVIKSMEKTIASKVVTYDFARLMDGATEVKCSEFGEELIKNMD
+>d1hufa_ d.195.1.1 (A:) YopH tyrosine phosphatase N-terminal domain {Yersinia pestis [TaxId: 632]}
+LSLSDLHRQVSRLVQQESGDCTGKLRGNVAANKETTFQGLTIASGARESEKVFAQTVLSHVANVVLTQEDTAKLLQSTVKHNLNNYDLRSVGNGNSVLVSLRSDQMTLQDAKVLLEAALRQES
+>d1hw1a2 a.78.1.1 (A:79-230) Fatty acid responsive transcription factor FadR, C-terminal domain {Escherichia coli [TaxId: 562]}
+GLNILETLARLDHESVPQLIDNLLSVRTNISTIFIRTAFRQHPDKAQEVLATANEVADHADAFAELDYNIFRGLAFASGNPIYGLILNGMKGLYTRIGRHYFANPEARSLALGFYHKLSALCSEGAHDQVYETVRRYGHESGEIWHRMQKNL
+>d1hx6a1 b.121.2.1 (A:15-244) Coat protein p3 {Bacteriophage PRD1 [TaxId: 10658]}
+LRNQQAMAANLQARQIVLQQSYPVIQQVETQTFDPANRSVFDVTPANVGIVKGFLVKVTAAITNNHATEAVALTDFGPANLVQRVIYYDPDNQRHTETSGWHLHFVNTAKQGAPFLSSMVTDSPIKYGDVMNVIDAPATIAAGATGELTMYYWVPLAYSETDLTGAVLANVPQSKQRLKLEFANNNTAFAAVGANPLEAIYQGAGAADCEFEEISYTVYQSYLDQLPVGQ
+>d1hxna_ b.66.1.1 (A:) Hemopexin {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+ESTRCDPDLVLSAMVSDNHGATYVFSGSHYWRLDTNRDGWHSWPIAHQWPQGPSTVDAAFSWEDKLYLIQDTKVYVFLTKGGYTLVNGYPKRLEKELGSPPVISLEAVDAAFVCPGSSRLHIMAGRRLWWLDLKSGAQATWTELPWPHEKVDGALCMEKPLGPNSCSTSGPNLYLIHGPNLYCYRHVDKLNAAKNLPQPQRVSRLLGCTH
+>d1hxra_ b.88.1.1 (A:) RabGEF Mss4 {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ELVSAEGRNRKAVLCQRCGSRVLQPGTALFSRRQLFLPSMRKKPDLVDGSNPDGDVLEEHWLVNDMFIFENVGFTKDVGNVKFLVCADCEIGPIGWHCLDDKNSFYVALERVSHE
+>d1hyoa1 b.34.8.1 (A:1-118) Fumarylacetoacetate hydrolase, FAH, N-terminal domain {Mouse (Mus musculus) [TaxId: 10090]}
+MSFIPVAEDSDFPIQNLPYGVFSTQSNPKPRIGVAIGDQILDLSVIKHLFTGPALSKHQHVFDETTLNNFMGLGQAAWKEARASLQNLLSASQARLRDDKELRQRAFTSQASATMHLP
+>d1hyoa2 d.177.1.1 (A:119-416) Fumarylacetoacetate hydrolase, FAH, C-terminal domain {Mouse (Mus musculus) [TaxId: 10090]}
+ATIGDYTDFYSSRQHATNVGIMFRGKENALLPNWLHLPVGYHGRASSIVVSGTPIRRPMGQMRPDNSKPPVYGACRLLDMELEMAFFVGPGNRFGEPIPISKAHEHIFGMVLMNDWSARDIQQWEYVPLGPFLGKSFGTTISPWVVPMDALMPFVVPNPKQDPKPLPYLCHSQPYTFDINLSVSLKGEGMSQAATICRSNFKHMYWTMLQQLTHHSVNGCNLRPGDLLASGTISGSDPESFGSMLELSWKGTKAIDVGQGQTRTFLLDGDEVIITGHCQGDGYRVGFGQCAGKVLPAL
+>d1hz4a_ a.118.8.2 (A:) Transcription factor MalT domain III {Escherichia coli [TaxId: 562]}
+EIKDIREDTMHAEFNALRAQVAINDGNPDEAERLAKLALEELPPGWFYSRIVATSVLGEVLHCKGELTRSLALMQQTEQMARQHDVWHYALWSLIQQSEILFAQGFLQTAWETQEKAFQLINEQHLEQLPMHEFLVRIRAQLLWAWARLDEAEASARSGIEVLSSYQPQQQLQCLAMLIQCSLARGDLDNARSQLNRLENLLGNGKYHSDWISNANKVRVIYWQMTGDKAAAANWLRHTAKPEFANNHFLQGQWRNIARAQILLGEFEPAEIVLEELNENARSLRLMSDLNRNLLLLNQLYWQAGRKSDAQRVLLDALKLANRTGFISHFVIEGEAMAQQLRQLIQLNTLPELEQHRAQRILREIN
+>d1i1wa_ c.1.8.3 (A:) Xylanase A, catalytic core {Thermoascus aurantiacus [TaxId: 5087]}
+EAAQSVDQLIKARGKVYFGVATDQNRLTTGKNAAIIQANFGQVTPENSMKWDATEPSQGNFNFAGADYLVNWAQQNGKLIRGHTLVWHSQLPSWVSSITDKNTLTNVMKNHITTLMTRYKGKIRAWDVVNEAFNEDGSLRQTVFLNVIGEDYIPIAFQTARAADPNAKLYINDYNLDSASYPKTQAIVNRVKKWRAAGVPIDGIGSQTHLSAGQGASVLQALPLLASAGTPEVAITELDVAGASSTDYVNVVNACLNVSSCVGITVWGVADPDSWRASTTPLLFDGNFNPKPAYNAIVQNLQQ
+>d1i2aa_ e.24.1.1 (A:) Ribosomal protein L1 {Methanococcus jannaschii [TaxId: 2190]}
+MDREALLQAVKEARELAKPRNFTQSFEFIATLKEIDMRKPENRIKTEVVLPHGRGKEAKIAVIGTGDLAKQAEELGLTVIRKEEIEELGKNKRKLRKIAKAHDFFIAQADLMPLIGRYMGVILGPRGKMPKPVPANANIKPLVERLKKTVVINTRDKPYFQVLVGNEKMTDEQIVDNIEAVLNVVAKKYEKGLYHIKDAYVKLTMGPAVKVK
+>d1i2ta_ a.144.1.1 (A:) hyperplastic discs protein {Human (Homo sapiens) [TaxId: 9606]}
+HRQALGERLYPRVQAMQPAFASKITGMLLELSPAQLLLLLASEDSLRARVDEAMELIIAHG
+>d1i3ja_ d.285.1.1 (A:) DNA-binding domain of intron endonuclease I-TevI {Bacteriophage T4 [TaxId: 10665]}
+KFCKCGVRIQTSAYTCSKCRNRSGENNSFFNHKHSDITKSKISEKMKGKKPSNIKKISCDGVIFDCAADAARHFKISSGLVTYRVKSDKWNWFYIN
+>d1i4ja_ d.55.1.1 (A:) Ribosomal protein L22 {Thermus aquaticus, subsp. Thermus thermophilus [TaxId: 271]}
+MEAKAIARYVRISPRKVRLVVDLIRGKSLEEARNILRYTNKRGAYFVAKVLESAAANAVNNHDALEDRLYVKAAYVDEGPAVLPRARGRADIIKKRTSHITVILGEKHGK
+>d1i71a_ g.14.1.1 (A:) Apolipoprotein A {Human (Homo sapiens), IV-7 variant [TaxId: 9606]}
+DCYHGDGQSYRGSFSTTVTGRTCQSWSSMTPHWHQRTTEYYPNGGLTRNYCRNPDAEIRPWCYTMDPSVRWEYCNLTQCPVME
+>d1ifra_ b.1.16.1 (A:) Lamin A/C globular tail domain {Human (Homo sapiens) [TaxId: 9606]}
+GSHRTSGRVAVEEVDEEGKFVRLRNKSNEDQSMGNWQIKRQNGDDPLLTYRFPPKFTLKAGQVVTIWAAGAGATHSPPTDLVWKAQNTWGCGNSLRTALINSTGEEVAMRKLV
+>d1ig0a1 b.82.6.1 (A:224-319) Thiamin pyrophosphokinase, substrate-binding domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+TDLIFLIKKNGTLIEYDPQFRNTCIGNCGLLPIGEATLVKETRGLKWDVKNWPTSVVTGRVSSSNRFVGDNCCFIDTKDDIILNVEIFVDKLIDFL
+>d1ig0a2 c.100.1.1 (A:3-223) Thiamin pyrophosphokinase, catalytic domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+EECIENPERIKIGTDLINIRNKMNLKELIHPNEDENSTLLILNQKIDIPRPLFYKIWKLHDLKVCADGAANRLYDYLDDDETLRIKYLPNYIIGDLDSLSEKVYKYYRKNKVTIIKQTTQYSTDFTKCVNLISLHFNSPEFRSLISNKDNLQSNHGIELEKGIHTLYNTMTESLVFSKVTPISLLALGGIGGRFDQTVHSITQLYTLSENASYFKLCYMTP
+>d1ijqa1 b.68.5.1 (A:377-642) Low density lipoprotein (LDL) receptor {Human (Homo sapiens) [TaxId: 9606]}
+IAYLFFTNRHEVRKMTLDRSEYTSLIPNLRNVVALDTEVASNRIYWSDLSQRMICSTQLDRAHGVSSYDTVISRDIQAPDGLAVDWIHSNIYWTDSVLGTVSVADTKGVKRKTLFRENGSKPRAIVVDPVHGFMYWTDWGTPAKIKKGGLNGVDIYSLVTENIQWPNGITLDLLSGRLYWVDSKLHSISSIDVNGGNRKTILEDEKRLAHPFSLAVFEDKVFWTDIINEAIFSANRLTGSDVNLLAENLLSPEDMVLFHNLTQPRG
+>d1ijya_ a.141.1.1 (A:) Frizzled 8 (FZ8) {Mouse (Mus musculus) [TaxId: 10090]}
+ELACQEITVPLCKGIGYEYTYMPNQFNHDTQDEAGLEVHQFWPLVEIQCSPDLKFFLCSMYTPICLEDYKKPLPPCRSVCERAKAGCAPLMRQYGFAWPDRMRCDRLPEQGNPDTLCMDYER
+>d1ik9a1 b.59.1.1 (A:1-117) XRCC4, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+MERKISRIHLVSEPSITHFLQVSWEKTLESGFVITLTDGHSAWTGTVSESEISQEADDMAMEKGKYVGELRKALLSGAGPADVYTFNFSKESAYFFFEKNLKDVSFRLGSFNLEKVE
+>d1ikpa3 f.1.5.1 (A:252-394) Exotoxin A, middle domain {Pseudomonas aeruginosa [TaxId: 287]}
+EGGSLAALTAHQACHLPLETFTRHRQPRGAEQLEQCGYPVQRLVALYLAARLSWNQVDQVIRNALASPGSGGDLGEAIREQPEQARLALTLAAAESERFVRQGTGNDEAGAANADVVSLTCPVAAGECAGPADSGDALLERNY
+>d1in0a1 d.58.49.1 (A:2-89) Hypothetical protein HI1034 {Haemophilus influenzae [TaxId: 727]}
+PSFDIVSEITLHEVRNAVENANRVLSTRYDFRGVEAVIELNEKNETIKITTESDFQLEQLIEILIGSCIKRGIEHSSLDIPAESEHHG
+>d1io0a_ c.10.1.1 (A:) Tropomodulin C-terminal domain {Chicken (Gallus gallus) [TaxId: 9031]}
+NSTDVEETLKRIQNNDPDLEEVNLNNIMNIPVPTLKACAEALKTNTYVKKFSIVGTRSNDPVAFALAEMLKVNNTLKSLNVESNFISGSGILALVEALQSNTSLIELRIDNQSQPLGNNVEMEIANMLEKNTTLLKFGYHFTQQGPRLRASNAMMNNNDLVRKRRL
+>d1io1a_ e.32.1.1 (A:) Phase 1 flagellin {Salmonella typhimurium [TaxId: 90371]}
+NIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVSGQTQFNGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDQKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAGGATSPLTGGLPATATEDVKNVQVANADLTEAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLAVKVGDDYYSATQNKDGSISINTTKYTADDGTSKTALNKLGGADGKTEVVSIGGKTYAASKAEGHNFKAQPDLAEAAATTTENPLQKIDAALAQVDTLRSDLAAVQNRFNSAITNLGNTVNNLTSAR
+>d1ioma_ a.103.1.1 (A:) Citrate synthase {Thermus thermophilus [TaxId: 274]}
+VARGLEGVLFTESRMCYIDGQQGKLYYYGIPIQELAEKSSFEETTFLLLHGRLPRRQELEEFSAALARRRALPAHLLESFKRYPVSAHPMSFLRTAVSEFGMLDPTEGDISREALYEKGLDLIAKFATIVAANKRLKEGKEPIPPREDLSHAANFLYMANGVEPSPEQARLMDAALILHAEHGFNASTFTAIAAFSTETDLYSAITAAVASLKGPRHGGANEAVMRMIQEIGTPERAREWVREKLAKKERIMGMGHRVYKAFDPRAGVLEKLARLVAEKHGHSKEYQILKIVEEEAGKVLNPRGIYPNVDFYSGVVYSDLGFSLEFFTPIFAVARISGWVGHILEYQELDNRLLRPGAKYVGELDVPYVPLEAR
+>d1iq4a_ d.77.1.1 (A:) Ribosomal protein L5 {Bacillus stearothermophilus [TaxId: 1422]}
+MNRLKEKYLNEVVPALMSKFNYKSIMQVPKIEKIVINMGVGDAVQNPKALDSAVEELTLIAGQRPVVTRAKKSIAGFRLRQGMPIGAKVTLRGERMYEFLDKLISVSLPRARDFRGVSKKSFDGRGNYTLGIKEQLIFPEIDYDKVNKVRGMDIVIVTTANTDEEARELLALLGMPFQK
+>d1iqza_ d.58.1.4 (A:) Ferredoxin {Bacillus thermoproteolyticus [TaxId: 1427]}
+PKYTIVDKETCIACGACGAAAPDIYDYDEDGIAYVTLDDNQGIVEVPDILIDDMMDAFEGCPTDSIKVADEPFDGDPNKFE
+>d1irqa_ a.43.1.4 (A:) Omega transcriptional repressor {Streptococcus pyogenes [TaxId: 1314]}
+IMGDKTVRVRADLHHIIKIETAKNGGNVKEVMDQALEEYIRKYLPDKL
+>d1itxa2 d.26.3.1 (A:338-409) Chitinase A1 {Bacillus circulans [TaxId: 1397]}
+YGRGWDGCAQAGNGQYQTCTGGSSVGTWEAGSFDFYDLEANYINKNGYTRYWNDTAKVPYLYNASNKRFISY
+>d1iuqa_ c.112.1.1 (A:) Glycerol-3-phosphate (1)-acyltransferase {Cushaw squash (Cucurbita moschata) [TaxId: 3662]}
+ASHSRKFLDVRSEEELLSCIKKETEAGKLPPNVAAGMEELYQNYRNAVIESGNPKADEIVLSNMTVALDRILLDVEDPFVFSSHHKAIREPFDYYIFGQNYIRPLIDFGNSFVGNLSLFKDIEEKLQQGHNVVLISNHQTEADPAIISLLLEKTNPYIAENTIFVAGDRVLADPLCKPFSIGRNLICVYSKKHMFDIPELTETKRKANTRSLKEMALLLRGGSQLIWIAPSGGRDRPDPSTGEWYPAPFDASSVDNMRRLIQHSDVPGHLFPLALLCHDIMPPPSQVEIEIGEKRVIAFNGAGLSVAPEISFEEIAATHKNPEEVREAYSKALFDSVAMQYNVLKTAISGKQGLGASTADVSLSQPW
+>d1ix9a1 a.2.11.1 (A:1-90) Mn superoxide dismutase (MnSOD) {Escherichia coli [TaxId: 562]}
+SYTLPSLPYAYDALEPHFDKQTMEIHHTKHHQTYVNNANAALESLPEFANLPVEELITKLDQLPADKKTVLRNNAGGHANHSLFWKGLKK
+>d1ix9a2 d.44.1.1 (A:91-205) Mn superoxide dismutase (MnSOD) {Escherichia coli [TaxId: 562]}
+GTTLQGDLKAAIERDFGSVDNFKAEFEKAAASRFGSGWAWLVLKGDKLAVVSTANQDSPLMGEAISGASGFPIMGLDVWEHAYFLKFQNRRPDYIKEFWNVVNWDEAAARFAAKK
+>d1izma_ a.199.1.1 (A:) Hypothetical protein HI0817 {Haemophilus influenzae [TaxId: 727]}
+LISHSDMNQQLKSAGIGFNATELHGFLSGLLCGGLKDQSWLPLLYQFSNDNHAYPTGLVQPVTELYEQISQTLSDVEGFTFELGLTEDENVFTQADSLSDWANQFLLGIGLAQPELAKEKGEIGEAVDDLQDICQLGYDEDDNEEELAEALEEIIEYVRTIAMLFYSHFN
+>d1j09a1 a.97.1.1 (A:306-468) C-terminal domain of glutamyl-tRNA synthetase (GluRS) {Thermus thermophilus [TaxId: 274]}
+DLEKLRWMNGKYIREVLSLEEVAERVKPFLREAGLSWESEAYLRRAVELMRPRFDTLKEFPEKARYLFTEDYPVSEKAQRKLEEGLPLLKELYPRLRAQEEWTEAALEALLRGFAAEKGVKLGQVAQPLRAALTGSLETPGLFEILALLGKERALRRLERALA
+>d1j0pa_ a.138.1.1 (A:) Cytochrome c3 {Desulfovibrio vulgaris [TaxId: 881]}
+AAPKAPADGLKMDKTKQPVVFNHSTHKAVKCGDCHHPVNGKEDLQKCATAGCHDNMDKKDKSAKGYYHAMHDKGTKFKSCVGCHLETAGADAAKKKELTGCKGSKCHS
+>d1j1ja_ a.118.16.1 (A:) Translin {Human (Homo sapiens) [TaxId: 9606]}
+MSVSEIFVELQGFLAAEQDIREEIRKVVQSLEQTAREILTLLQGVHQGAGFQDIPKRCLKAREHFGTVKTHLTSLKTKFPAEQYYRFHEHWRFVLQRLVFLAAFVVYLETETLVTREAVTEILGIEPDREKGFHLDVEDYLSGVLILASELSRLSVNSVTAGDYSRPLHISTFINELDSGFRLLNLKNDSLRKRYDGLKYDVKKVEEVVYDLSIRGF
+>d1j27a_ d.58.50.1 (A:) Hypothetical protein TT1725 {Thermus thermophilus [TaxId: 274]}
+MKAYLGLYTARLETPARSLKEKRALIKPALERLKARFPVSAARLYGLDAWGYEVVGFTLLGNDPAWVEETMRAAARFLAEAGGFQVALEEFRLEAFEL
+>d1j2jb_ a.7.8.1 (B:) ADP-ribosylation factor binding protein Gga1 {Human (Homo sapiens) [TaxId: 9606]}
+IFEDEEKSKMLARLLKSSHPEDLRAANKLIKEMVQEDQKRM
+>d1j2la_ g.20.1.1 (A:) Flavoridin (triflavin) {Habu snake (Trimeresurus flavoviridis) [TaxId: 88087]}
+GEECDCGSPSNPCCDAATCKLRPGAQCADGLCCDQCRFKKKRTICRIARGDFPDDRCTGQSADCPRWN
+>d1j2ra_ c.33.1.3 (A:) Hypothetical protein YecD {Escherichia coli [TaxId: 562]}
+MLELNAKTTALVVIDLQEGILPFAGGPHTADEVVNRAGKLAAKFRASGQPVFLVRVGWSADYAEALKQPVDAPSPAKVLPENWWQHPAALGTTDSDIEIIKRQWGAFYGTDLELQLRRRGIDTIVLCGISTNIGVESTARNAWELGFNLVIAEDACSAASAEQHNNSINHIYPRIARVRSVEEILNAL
+>d1j3aa_ c.21.1.1 (A:) Ribosomal protein L13 {Pyrococcus horikoshii [TaxId: 53953]}
+MRIINADGLILGRLASRVAKMLLEGEEVVIVNAEKAVITGNREVIFSKYKQRTGLRTLTNPRRGPFYPKRSDEIVRRTIRGMLPWKTDRGRKAFRRLKVYVGIPKEFQDKQLETIVEAHVSRLSRPKYVTVGEVAKFLGGKF
+>d1j3ea_ d.228.1.1 (A:) Replication modulator SeqA, C-terminal DNA-binding domain {Escherichia coli [TaxId: 562]}
+PLGSAMRELLLSDEYAEQKRAVNRFMLLLSTLYSLDAQAFAEATESLHGRTRVYFAADEQTLLKNGNQTKPKHVPGTPYWVITNTNTGRKCSMIEHIMQSMQFPAELIEKVCGTI
+>d1j3wa_ d.110.7.1 (A:) Giding protein MglB {Thermus thermophilus [TaxId: 274]}
+LVLYGAPYERAVEVLEETLRETGARYALLIDRKGFVLAHKEALWAPKPPPLDTLATLVAGNAAATQALAKLLGEARFQEEVHQGERMGLYVDEAGEHALLVLVFDETAPLGKVKLHGKRASEALARIAEEALAN
+>d1j5ua_ d.208.1.1 (A:) Hypothetical protein TM1083 {Thermotoga maritima [TaxId: 2336]}
+HHHMRKPIEHTADIAYEISGNSYEELLEEARNILLEEEGIVLDTEEKEKMYPLEETEDAFFDTVNDWILEISKGWAPWRIKREGNELKVTFRKIRKKEGTEIKALTYHLLKFERDGDVLKTKVVFDT
+>d1j5ya2 d.94.2.1 (A:68-174) Putative transcriptional regulator TM1602, C-terminal domain {Thermotoga maritima [TaxId: 2336]}
+KSGVSRLVAVKHAPEEIKEELLCVVRNGGRIVDVIVEHPVYGEIRGIIDVSSEEEVLKFVNLMEMAKTEPLLTLSGGVHLHTIEAPDEETMERIMRELKKKGFLIEE
+>d1j8ba_ d.222.1.1 (A:) Hypothetical protein HI0442 {Haemophilus influenzae [TaxId: 727]}
+LGGLMKQAQQMQEKMQKMQEEIAQLEVTGESGAGLVKITINGAHNCRRIDIDPSLMEDDKEMLEDLIAAAFNDAVRRAEELQKEKMASVTAG
+>d1j98a_ d.185.1.2 (A:) Autoinducer-2 production protein LuxS {Bacillus subtilis [TaxId: 1423]}
+VESFELDHNAVVAPYVRHCGVHKVGTDGVVNKFDIRFCQPNKQAMKPDTIHTLEHLLAFTIRSHAEKYDHFDIIDISPMGCQTGYYLVVSGETTSAEIVDLLEDTMKEAVEITEIPAANEKQCGQAKLHDLEGAKRLMRFWLSQDKEELLKVFG
+>d1jb0a_ f.29.1.1 (A:) Apoprotein a1, PsaA {Synechococcus elongatus [TaxId: 32046]}
+RVVVDNDPVPTSFEKWAKPGHFDRTLARGPQTTTWIWNLHALAHDFDTHTSDLEDISRKIFSAHFGHLAVVFIWLSGMYFHGAKFSNYEAWLADPTGIKPSAQVVWPIVGQGILNGDVGGGFHGIQITSGLFQLWRASGITNEFQLYCTAIGGLVMAGLMLFAGWFHYHKRAPKLEWFQNVESMLNHHLAGLLGLGSLAWAGHQIHVSLPINKLLDAGVAAKDIPLPHEFILNPSLMAELYPKVDWGFFSGVIPFFTFNWAAYSDFLTFNGGLNPVTGGLWLSDTAHHHLAIAVLFIIAGHMYRTNWGIGHSLKEILEAHKGPFTGAGHKGLYEVLTTSWHAQLAINLAMMGSLSIIVAQHMYAMPPYPYLATDYPTQLSLFTHHMWIGGFLVVGGAAHGAIFMVRDYDPAMNQNNVLDRVLRHRDAIISHLNWVCIFLGFHSFGLYVHNDTMRAFGRPQDMFSDTGIQLQPVFAQWVQNLHTLAPGGTAPNAAATASVAFGGDVVAVGGKVAMMPIVLGTADFMVHHIHAFTIHVTVLILLKGVLFARSSRLIPDKANLGFRFPCDGPGRGGTCQVSGWDHVFLGLFWMYNCISVVIFHFSWKMQSDVWGTVAPDGTVSHITGGNFAQSAITINGWLRDFLWAQASQVIGSYGSALSAYGLLFLGAHFIWAFSLMFLFSGRGYWQELIESIVWAHNKLKVAPAIQPRALSIIQGRAVGVAHYLLGGIATTWAFFLARIISVG
+>d1jb0d_ d.187.1.1 (D:) Photosystem I subunit PsaD {Synechococcus elongatus [TaxId: 32046]}
+TTLTGQPPLYGGSTGGLLSAADTEEKYAITWTSPKEQVFEMPTAGAAVMREGENLVYFARKEQCLALAAQQLRPRKINDYKIYRIFPDGETVLIHPKDGVFPEKVNKGREAVNSVPRSIGQNPNPSQLKFTGKKPYDP
+>d1jb0f_ f.23.16.1 (F:) Subunit III of photosystem I reaction centre, PsaF {Synechococcus elongatus [TaxId: 32046]}
+DVAGLVPCKDSPAFQKRAAAAVNTTADPASGQKRFERYSQALCGEDGLPHLVVDGRLSRAGDFLIPSVLFLYIAGWIGWVGRAYLIAVRNSGEANEKEIIIDVPLAIKCMLTGFAWPLAALKELASGELTAKDNEITVSPR
+>d1jb0i_ f.23.17.1 (I:) Subunit VIII of photosystem I reaction centre, PsaI {Synechococcus elongatus [TaxId: 32046]}
+MMGSYAASFLPWIFIPVVCWLMPTVVMGLLFLYIEGEA
+>d1jb0j_ f.23.18.1 (J:) Subunit IX of photosystem I reaction centre, PsaJ {Synechococcus elongatus [TaxId: 32046]}
+MKHFLTYLSTAPVLAAIWMTITAGILIEFNRFYPDLLFHPL
+>d1jb0k_ f.30.1.1 (K:) Photosystem I reaction center subunit X, PsaK {Synechococcus elongatus [TaxId: 32046]}
+ILCNLFAIALGRYAIQSRGKGPGLPIALPALFEGFGLPELLATTSFGHLLAAGVVSGL
+>d1jb0l_ f.31.1.1 (L:) Photosystem I reaction center subunit XI, PsaL {Synechococcus elongatus [TaxId: 32046]}
+LVKPYNGDPFVGHLSTPISDSGLVKTFIGNLPAYRQGLSPILRGLEVGMAHGYFLIGPWVKLGPLRDSDVANLGGLISGIALILVATACLAAYGLVSFQKGGSSSDPLKTSEGWSQFTAGFFVGAMGSAFVAFFLLENFLVVDGIMTGLFN
+>d1jb0m_ f.23.19.1 (M:) Subunit XII of photosystem I reaction centre, PsaM {Synechococcus elongatus [TaxId: 32046]}
+MALTDTQVYVALVIALLPAVLAFRLSTELYK
+>d1jb3a_ b.40.3.2 (A:) The laminin-binding domain of agrin {Chicken (Gallus gallus) [TaxId: 9031]}
+ELQRREEEANVVLTGTVEEIMNVDPVHHTYSCKVRVWRYLKGKDIVTHEILLDGGNKVVIGGFGDPLICDNQVSTGDTRIFFVNPAPQYMWPAHRNELMLNSSLMRITLRNLEEVEHCVEEHRKLLA
+>d1jbea_ c.23.1.1 (A:) CheY protein {Escherichia coli [TaxId: 562]}
+ADKELKFLVVDDFSTMRRIVRNLLKELGFNNVEEAEDGVDALNKLQAGGYGFVISDWNMPNMDGLELLKTIRAXXAMSALPVLMVTAEAKKENIIAAAQAGASGYVVKPFTAATLEEKLNKIFEKLGM
+>d1jf8a_ c.44.1.1 (A:) Arsenate reductase ArsC {Staphylococcus aureus [TaxId: 1280]}
+DKKTIYFISTGNSARSQMAEGWGKEILGEGWNVYSAGIETHGVNPKAIEAMKEVDIDISNHTSDLIDNDILKQSDLVVTLCSDADNNCPILPPNVKKEHWGFDDPAGKEWSEFQRVRDEIKLAIEKFKLR
+>d1jfba_ a.104.1.1 (A:) Cytochrome P450-NOR, nitric reductase {Fungus (Fusarium oxysporum) [TaxId: 5507]}
+APSFPFSRASGPEPPAEFAKLRATNPVSQVKLFDGSLAWLVTKHKDVCFVATSEKLSKVRTRQGFPELSASGKQAAKAKPTFVDMDPPEHMHQRSMVEPTFTPEAVKNLQPYIQRTVDDLLEQMKQKGCANGPVDLVKEFALPVPSYIIYTLLGVPFNDLEYLTQQNAIRTNGSSTAREASAANQELLDYLAILVEQRLVEPKDDIISKLCTEQVKPGNIDKSDAVQIAFLLLVAGNATMVNMIALGVATLAQHPDQLAQLKANPSLAPQFVEELCRYHTASALAIKRTAKEDVMIGDKLVRANEGIIASNQSANRDEEVFENPDEFNMNRKWPPQDPLGFGFGDHRCIAEHLAKAELTTVFSTLYQKFPDLKVAVPLGKINYTPLNRDVGIVDLPVIF
+>d1jfla1 c.78.2.1 (A:1-115) Aspartate racemase {Pyrococcus horikoshii [TaxId: 53953]}
+MKTIGILGGMGPLATAELFRRIVIKTPAKRDQEHPKVIIFNNPQIPDRTAYILGKGEDPRPQLIWTAKRLEECGADFIIMPCNTAHAFVEDIRKAIKIPIISMIEETAKKVKELG
+>d1jhfa2 b.87.1.1 (A:73-198) LexA C-terminal domain {Escherichia coli [TaxId: 562]}
+EEGLPLVGRVAADEPLLAQQHIEGHYQVDPSLFKPNADFLLRVSGMSMKDIGIMDGDLLAVHKTQDVRNGQVVVARIDDEVTVKRLKKQGNKVELLPENSEFKPIVVDLRQQSFTIEGLAVGVIRN
+>d1jhga_ a.4.12.1 (A:) Trp repressor, TrpR {Escherichia coli [TaxId: 562]}
+SAAMAEQRHQEWLRFVDLLKNAYQNDLHLPLLNLMLTPDEREALGTRVRIIEELLRGEMSQRELKNELGAGIATITRGSNSLKAAPVELRQWLEEVLLKSD
+>d1ji7a_ a.60.1.1 (A:) Etv6 transcription factor pointed domain (Tel SAM) {Human (Homo sapiens) [TaxId: 9606]}
+SIRLPAHLRLQPIYWSRDDVAQWLKWAENEFSLRPIDSNTFEMNGKALLLLTKEDFRYRSPHSGDELYELLQHILKQ
+>d1jida_ d.201.1.1 (A:) SRP19 {Human (Homo sapiens) [TaxId: 9606]}
+AARSPADQDRFICIYPAYLNNKKTIAEGRRIPISKAVENPTATEIQDVCSAVGLNVFLEKNKMYSREWNRDVQYRGRVRVQLKQEDGSLCLVQFPSRKSVMLYAAEMIPKLKTR
+>d1jkea_ c.110.1.1 (A:) D-Tyr tRNAtyr deacylase, DTD {Escherichia coli [TaxId: 562]}
+MIALIQRVTRASVTVEGEVTGEIGAGLLVLLGVEKDDDEQKANRLCERVLGYRIFSDAEGKMNLNVQQAGGSVLVVSQFTLAADTERGMRPSFSKGASPDRAEALYDYFVERCRQQEMNTQTGRFAADMQVSLVNDGPVTFWLQV
+>d1jlya1 b.42.3.1 (A:1-153) Agglutinin {Love-lies-bleeding (Amaranthus caudatus) [TaxId: 3567]}
+AGLPVIMCLKSNNHQKYLRYQSDNIQQYGLLQFSADKILDPLAQFEVEPSKTYDGLVHIKSRYTNKYLVRWSPNHYWITASANEPDENKSNWACTLFKPLYVEEGNMKKVRLLHVQLGHYTQNYTVGGSFVSYLFAESSQIDTGSKDVFHVID
+>d1jm1a_ b.33.1.1 (A:) Rieske protein II (SoxF) {Sulfolobus acidocaldarius [TaxId: 2285]}
+NTDGLAGFPRYKVANIQQVQQQIKSSGCAVYFFAYPLTDEPCFLVDLQALTGQQITEIPNPYYGKYAGPLGQIQTIKGVGPNGTIFAFSDVCVHLGCQLPAQVIVSSESDPGLYAKGADLHCPCHGSIYALKDGGVVVSGPAPRPLPIVILDYDSSTGDIYAVGTNAPYFSAGIPRTTPQDNLLYDPRYSYSVPNNPSCSNG
+>d1jmma_ b.30.6.1 (A:) V-region of surface antigen I/II (SA I/II, PAC) {Streptococcus mutans [TaxId: 1309]}
+QKDLADYPVKLKAYEDEQASIKAALAELEKHKNEDGNLTEPSAQNLVYDLEPNANLSLTTDGKFLKASAVDDAFSKSTSKAKYVQKILQLDDLDITNLEQSNDVASSMELYGNFGDKAGWSTTVSNNSQVKWGSVLLERGQSATATYTNLQNSYYNGKKISKIVYKYTVDPKSKFQGQKVWLGIFTDPTLGVFASAYTGQVEKNTSIFIKNEFTFYDEDGKPINFDNALLSVASLNREHNSIEMAKDYSGKFVKISGSSIGEKNGMIYATDTLNFKQGEGGSRWTMYKNSQAGSGWDSSDAPNSWYGAGAIKMSGPNNHVTVGATSATNVMPVSDMPVVPGKDNTDGKKPNIWYSLNGKIRAVNVPKVTKEKPTPPV
+>d1jnra1 a.7.3.1 (A:503-643) Adenylylsulfate reductase A subunit {Archaeoglobus fulgidus [TaxId: 2234]}
+TADDVNPEYILPWQGLVRLQKIMDEYAAGIATIYKTNEKMLQRALELLAFLKEDLEKLAARDLHELMRAWELVHRVWTAEAHVRHMLFRKETRWPGYYYRTDYPELNDEEWKCFVCSKYDAEKDEWTFEKVPYVQVIEWSF
+>d1jo0a_ d.68.4.1 (A:) YhbY homologue HI1333 {Haemophilus influenzae [TaxId: 727]}
+TTLSTKQKQFLKGLAHHLNPVVMLGGNGLTEGVLAEIENALNHHELIKVKVAGADRETKQLIINAIVRETKAAQVQTIGHILVLYRPSEEAKIQLPR
+>d1jofa_ b.69.10.1 (A:) 3-carboxy-cis,cis-mucoante lactonizing enzyme {Fungus (Neurospora crassa) [TaxId: 5141]}
+PLHHLMIGTWTPPGAIFTVQFDDEKLTCKLIKRTEIPQDEPISWMTFDHERKNIYGAAMKKWSSFAVKSPTEIVHEASHPIGGHPRANDADTNTRAIFLLAAKQPPYAVYANPFYKFAGYGNVFSVSETGKLEKNVQNYEYQENTGIHGMVFDPTETYLYSADLTANKLWTHRKLASGEVELVGSVDAPDPGDHPRWVAMHPTGNYLYALMEAGNRICEYVIDPATHMPVYTHHSFPLIPPGIPDRDPETGKGLYRADVCALTFSGKYMFASSRANKFELQGYIAGFKLRDCGSIEKQLFLSPTPTSGGHSNAVSPCPWSDEWMAITDDQEGWLEIYRWKDEFLHRVARVRIPEPGFGMNAIWYD
+>d1josa_ d.52.7.1 (A:) Ribosome-binding factor A, RbfA {Haemophilus influenzae [TaxId: 727]}
+RSDRVAQEIQKEIAVILQREVKDPRIGMVTVSDVEVSSDLSYAKIFVTFLFDHDEMAIEQGMKGLEKASPYIRSLLGKAMRLRIVPEIRFIYDQSLVEGM
+>d1jr8a_ a.24.15.1 (A:) Thiol oxidase Erv2p {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+DDKVKKEVGRASWKYFHTLLARFPDEPTPEEREKLHTFIGLYAELYPCGECSYHFVKLIEKYPVQTSSRTAAAMWGCHIHNKVNEYLKKDIYDCATILEDYDCGC
+>d1js8a2 b.112.1.1 (A:2792-2892) C-terminal domain of mollusc hemocyanin {Giant octopus (Octopus dofleini) [TaxId: 267067]}
+EDRVFAGFLLRTIGQSADVNFDVCTKDGECTFGGTFCILGGEHEMFWAFDRLFKYDITTSLKHLRLDAHDDFDIKVTIKGIDGHVLSNKYLSPPTVFLAPA
+>d1jw9b_ c.111.1.1 (B:) Molybdenum cofactor biosynthesis protein MoeB {Escherichia coli [TaxId: 562]}
+AELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQYLASAGVGNLTLLDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINPHIAITPVNALLDDAELAALIAEHDLVLDCTDNVAVRNQLNAGCFAAKVPLVSGAAIRMEGQITVFTYQDGEPCYRCLSRLFGENALTCVEAGVMAPLIGVIGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKLMRNPGCEVCG
+>d1jx4a1 d.240.1.1 (A:241-341) DinB homolog (DBH) {Sulfolobus solfataricus, DNA polymerase IV [TaxId: 2287]}
+VRKSIGRIVTMKRNSRNLEEIKPYLFRAIEESYYKLDKRIPKAIHVVAVTEDLDIVSRGRTFPHGISKETAYSESVKLLQKILEEDERKIRRIGVRFSKFI
+>d1jyha_ d.60.1.3 (A:) Gyrase inhibitory protein GyrI (SbmC, YeeB) {Escherichia coli [TaxId: 562]}
+MNYEIKQEEKRTVAGFHLVGPWEQTVKKGFEQLMMWVDSKNIVPKEWVAVYYDNPDETPAEKLRCDTVVTVPGYFTLPENSEGVILTEITGGQYAVAVARVVGDDFAKPWYQFFNSLLQDSAYEMLPKPCFEVYLNNGAEDGYWDIEMYVAVQPK
+>d1jz8a1 b.1.4.1 (A:220-333) beta-Galactosidase, domains 2 and 4 {Escherichia coli [TaxId: 562]}
+TQISDFHVATRFNDDFSRAVLEAEVQMCGELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKLWSAEIPNLYRAVVELHTADGTLIEAEACDVGFR
+>d1jzta_ c.104.1.1 (A:) Hypothetical protein YNL200c (YNU0_YEAST) {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+LKVVSSKLAAEIDKELMGPQIGFTLQQLMELAGFSVAQAVCRQFPLRGKTETEKGKHVFVIAGPGNNGGDGLVCARHLKLFGYNPVVFYPKRSERTEFYKQLVHQLNFFKVPVLSQDEGNWLEYLKPEKTLCIVDAIFGFSFKPPMREPFKGIVEELCKVQNIIPIVSVDVPTGWDVDKGPISQPSINPAVLVSLTVPKPCSSHIRENQTTHYVGGRFIPRDFANKFGFEPFGYESTDQILKL
+>d1k04a_ a.24.14.1 (A:) FAT domain of focal adhesion kinase {Human (Homo sapiens) [TaxId: 9606]}
+EISPPPTANLDRSNDKVYENVTGLVKAVIEMSSKIQPAPPEEYVPMVKEVGLALRTLLATVDETIPLLPASTHREIEMAQKLLNSDLGELINKMKLAQQYVMTSLQQEYKKQMLTAAHALAVDAKNLLDVIDQARLKMLGQT
+>d1k0ra4 d.202.1.1 (A:-4-99) Transcription factor NusA, N-terminal domain {Mycobacterium tuberculosis [TaxId: 1773]}
+VSRRHMNIDMAALHAIEVDRGISVNELLETIKSALLTAYRHTQGHQTDARIEIDRKTGVVRVIARETDEAGNLISEWDDTPEGFGRIAATTARQVMLQRFRDAE
+>d1k1fa_ a.147.1.1 (A:) Bcr-Abl oncoprotein oligomerization domain {Human (Homo sapiens) [TaxId: 9606]}
+MVDPVGFAEAWKAQFPDSEPPRMELRSVGDIEQELERAKASIRRLEQEVNQERFRMIYLQTLLAKEK
+>d1k32a2 b.68.7.1 (A:39-319) Tricorn protease N-terminal domain {Thermoplasma acidophilum [TaxId: 2303]}
+MPNLLLNPDIHGDRIIFVCCDDLWEHDLKSGSTRKIVSNLGVINNARFFPDGRKIAIRVMRGSSLNTADLYFYNGENGEIKRITYFSGKSTGRRMFTDVAGFDPDGNLIISTDAMQPFSSMTCLYRVENDGINFVPLNLGPATHILFADGRRVIGRNTFELPHWKGYRGGTRGKIWIEVNSGAFKKIVDMSTHVSSPVIVGHRIYFITDIDGFGQIYSTDLDGKDLRKHTSFTDYYPRHLNTDGRRILFSKGGSIYIFNPDTEKIEKIEIGDLESPEDRII
+>d1k32a3 b.69.9.1 (A:320-679) Tricorn protease domain 2 {Thermoplasma acidophilum [TaxId: 2303]}
+SIPSKFAEDFSPLDGDLIAFVSRGQAFIQDVSGTYVLKVPEPLRIRYVRRGGDTKVAFIHGTREGDFLGIYDYRTGKAEKFEENLGNVFAMGVDRNGKFAVVANDRFEIMTVDLETGKPTVIERSREAMITDFTISDNSRFIAYGFPLKHGETDGYVMQAIHVYDMEGRKIFAATTENSHDYAPAFDADSKNLYYLSYRSLDPSPDRVVLNFSFEVVSKPFVIPLIPGSPNPTKLVPRSMTSEAGEYDLNDMYKRSSPINVDPGDYRMIIPLESSILIYSVPVHGEFAAYYQGAPEKGVLLKYDVKTRKVTEVKNNLTDLRLSADRKTVMVRKDDGKIYTFPLEKPEDERTVETDKRPLV
+>d1k3ia3 b.69.1.1 (A:151-537) Galactose oxidase, central domain {Fungus (Fusarium sp.) [TaxId: 29916]}
+YTAPQPGLGRWGPTIDLPIVPAAAAIEPTSGRVLMWSSYRNDAFGGSPGGITLTSSWDPSTGIVSDRTVTVTKHDMFCPGISMDGNGQIVVTGGNDAKKTSLYDSSSDSWIPGPDMQVARGYQSSATMSDGRVFTIGGSWSGGVFEKNGEVYSPSSKTWTSLPNAKVNPMLTADKQGLYRSDNHAWLFGWKKGSVFQAGPSTAMNWYYTSGSGDVKSAGKRQSNRGVAPDAMCGNAVMYDAVKGKILTFGGSPDYQDSDATTNAHIITLGEPGTSPNTVFASNGLYFARTFHTSVVLPDGSTFITGGQRRGIPFEDSTPVFTPEIYVPEQDTFYKQNPNSIVRVYHSISLLLPDGRVFNGGGGLCGDCTTNHFDAQIFTPNYLYNSN
+>d1k3xa1 a.156.1.2 (A:125-213) Endonuclease VIII {Escherichia coli [TaxId: 562]}
+VGPDVLDPNLTPEVVKERLLSPRFRNRQFAGLLLDQAFLAGLGNYLRVEILWQVGLTGNHKAKDLNAAQLDALAHALLEIPRFSYATRG
+>d1k3xa2 b.113.1.1 (A:1-124) Endonuclease VIII {Escherichia coli [TaxId: 562]}
+PEGPEIRRAADNLEAAIKGKPLTDVWFAFPQLKTYQSQLIGQHVTHVETRGKALLTHFSNDLTLYSHNQLYGVWRVVDTGEEPQTTRVLRVKLQTADKTILLYSASDIEMLRPEQLTTHPFLQR
+>d1k3xa3 g.39.1.8 (A:223-262) Endonuclease VIII {Escherichia coli [TaxId: 562]}
+ALFRFKVFHRDGEPCERCGSIIEKTTLSSRPFYWCPGCQH
+>d1k3ya1 a.45.1.1 (A:81-222) Class alpha GST {Human (Homo sapiens), (a1-1) [TaxId: 9606]}
+LYGKDIKERALIDMYIEGIADLGEMILLLPVCPPEEKDAKLALIKEKIKNRYFPAFEKVLKSHGQDYLVGNKLSRADIHLVELLYYVEELDSSLISSFPLLKALKTRISNLPTVKKFLQPGSPRKPPMDEKSLEEARKIFRF
+>d1k4ia_ d.115.1.2 (A:) 3,4-dihydroxy-2-butanone 4-phosphate synthase, DHBP synthase, RibB {Fungus (Magnaporthe grisea) [TaxId: 148305]}
+FDAIPDVIQAFKNGEFVVVLDDPSRENEADLIIAAESVTTEQMAFMVRHSSGLICAPLTPERTTALDLPQMVTHNADPRGTAYTVSVDAEHPSTTTGISAHDRALACRMLAAPDAQPSHFRRPGHVFPLRAVAGGVRARRGHTEAGVELCRLAGKRPVAVISEIVDDGQEVEGRAVRAAPGMLRGDECVAFARRWGLKVCTIEDMIAHVEKTEGKL
+>d1k4ta1 a.2.8.1 (A:641-712) Eukaryotic DNA topoisomerase I, dispensable insert domain {Human (Homo sapiens) [TaxId: 9606]}
+EKSMMNLQTKIDAKKEQLADARRDLKSAKADAKVMKDAKTKKVVESKKKAVQRLEEQLMKLEVQATDREENK
+>d1k4za_ b.80.5.1 (A:) C-terminal domain of adenylylcyclase associated protein {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MPPRKELVGNKWFIENYENETESLVIDANKDESIFIGKCSQVLVQIKGKVNAISLSETESCSVVLDSSISGMDVIKSNKFGIQVNHSLPQISIDKSDGGNIYLSKESLNTEIYTSCSTAINVNLPIGEDDDYVEFPIPEQMKHSFADGKFKSAVFEH
+>d1k5ca_ b.80.1.3 (A:) Polygalacturonase {Fungus (Stereum purpureum), endo-polygalacturonase I [TaxId: 58369]}
+CTVKSVDDAKDIAGCSAVTLNGFTVPAGNTLVLNPDKGATVTMAGDITFAKTTLDGPLFTIDGTGINFVGADHIFDGNGALYWDGKGTNNGTHKPHPFLKIKGSGTYKKFEVLNSPAQAISVGPTDAHLTLDGITVDDFAGDTKNLGHNTDGFDVSANNVTIQNCIVKNQDDCIAINDGNNIRFENNQCSGGHGISIGSIATGKHVSNVVIKGNTVTRSMYGVRIKAQRTATSASVSGVTYDANTISGIAKYGVLISQSYPDDVGNPGTGAPFSDVNFTGGATTIKVNNAATRVTVECGNCSGNWNWSQLTVTGGKAGTIKSDKAKITGGQYL
+>d1k5na2 d.19.1.1 (A:1-181) Class I MHC, alpha-1 and alpha-2 domains {Human (Homo sapiens), HLA-B27 [TaxId: 9606]}
+GSHSMRYFHTSVSRPGRGEPRFITVGYVDDTLFVRFDSDAASPREEPRAPWIEQEGPEYWDRETQICKAKAQTDREDLRTLLRYYNQSEAGSHTLQNMYGCDVGPDGRLLRGYHQHAYDGKDYIALNEDLSSWTAADTAAQITQRKWEAARVAEQLRAYLEGECVEWLRRYLENGKETLQR
+>d1k6ka_ a.174.1.1 (A:) N-terminal, ClpS-binding domain of ClpA, an Hsp100 chaperone {Escherichia coli [TaxId: 562]}
+MLNQELELSLNMAFARAREHRHEFMTVEHLLLALLSNPSAREALEACSVDLVALRQELEAFIEQTTPVLPASEEERDTQPTLSFQRVLQRAVFHVQSSGRNEVTGANVLVAIFSEQESQAAYLLRKHEVSRLDVVNFISHGT
+>d1k6ya1 a.4.10.1 (A:1-46) N-terminal Zn binding domain of HIV integrase {Human immunodeficiency virus type 1 [TaxId: 11676]}
+FLDGIDKAQEEHEKYHSNWRAMASDFNLPPVVAKEIVASCDKCQLK
+>d1k7ca_ c.23.10.4 (A:) Rhamnogalacturonan acetylesterase {Fungus (Aspergillus aculeatus) [TaxId: 5053]}
+TTVYLAGDSTMAKNGGGSGTNGWGEYLASYLSATVVNDAVAGRSARSYTREGRFENIADVVTAGDYVIVEFGHNDGGSLSTDNGRTDCSGTGAEVCYSVYDGVNETILTFPAYLENAAKLFTAKGAKVILSSQTPNNPWETGTFVNSPTRFVEYAELAAEVAGVEYVDHWSYVDSIYETLGNATVNSYFPIDHTHTSPAGAEVVAEAFLKAVVCTGTSLKSVLTTTSFEGTCL
+>d1k8kd1 d.198.2.1 (D:1-120) ARPC2 (34 kDa subunit) {Cow (Bos taurus) [TaxId: 9913]}
+MILLEVNNRIIEETLALKFENAAAGNKPEAVEVTFADFDGVLYHISNPNGDKTKVMVSISLKFYKELQAHGADELLKRVYGSYLVNPESGYNVSLLYDLENLPASKDSIVHQAGMLKRNC
+>d1k8ke_ a.148.1.1 (E:) Arp2/3 complex 21 kDa subunit ARPC3 {Cow (Bos taurus) [TaxId: 9913]}
+PAYHSSLMDPDTKLIGNMALLPIRSQFKGPAPRETKDTDIVDEAIYYFKANVFFKNYEIKNEADRTLIYITLYISECLKKLQKCNSKSQGEKEMYTLGITNFPIPGEPGFPLNAIYAKPANKQEDEVMRAYLQQLRQETGLRLCEKVFDPQNDKPSKWWTCFVKRQFMNKSLSG
+>d1k8kg_ a.118.13.1 (G:) Arp2/3 complex 16 kDa subunit ARPC5 {Cow (Bos taurus) [TaxId: 9913]}
+ARFRKVDVDEYDENKFVDEDDGGDGQAGPDEGEVDSCLRQGNMTAALQAALKNPPINTKSQAVKDRAGSIVLKVLISFKANDIEKAVQSLDKNGVDLLMKYIYKGFESPSDNSSAVLLQWHEKALAAGGVGSIVRVLTARKTV
+>d1k92a2 d.210.1.1 (A:189-444) Argininosuccinate synthetase, C-terminal domain {Escherichia coli [TaxId: 562]}
+AYSTDSNMLGATHEAKDLEYLNSSVKIVNPIMGVKFWDESVKIPAEEVTVRFEQGHPVALNGKTFSDDVEMMLEANRIGGRHGLGMSDQIENRIIEAKSRGIYEAPGMALLHIAYERLLTGIHNEDTIEQYHAHGRQLGRLLYQGRWFDSQALMLRDSLQRWVASQITGEVTLELRRGNDYSILNTVSENLTYKPERLTMEKGDSVFSPDDRIGQLTMRNLDITDTREKLFGYAKTGLLSSSAASGVPQVENLENK
+>d1ka1a_ e.7.1.1 (A:) 3';5'-adenosine bisphosphatase, PAP phosphatase {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+ALERELLVATQAVRKASLLTKRIQSEVISHKDSTTITKNDNSPVTTGDYAAQTIIINAIKSNFPDDKVVGEESSSGLSDAFVSGILNEIKANDEVYNKNYKKDDFLFTNDQFPLKSLEDVRQIIDFGNYEGGRKGRFWCLDPIDGTKGFLRGEQFAVCLALIVDGVVQLGCIGCPNLVLSSYGAQDLKGHESFGYIFRAVRGLGAFYSPSSDAESWTKIHVRHLKDTKDMITLEGVEKGHSSHDEQTAIKNKLNISKSLHLDSQAKYCLLALGLADVYLRLPIKLSYQEKIWDHAAGNVIVHEAGGIHTDAMEDVPLDFGNGRTLATKGVIASSGPRELHDLVVSTSCDVIQSR
+>d1kafa_ d.199.1.1 (A:) DNA-binding C-terminal domain of the transcription factor MotA {Bacteriophage T4 [TaxId: 10665]}
+MEITSDMEEDKDLMLKLLDKNGFVLKKVEIYRSNYLAILEKRTNGIRNFEINNNGNMRIFGYKMMEHHIQKFTDIGMSCKIAKNGNVYLDIKRSAENIEAVITVASEL
+>d1kapp1 b.80.7.1 (P:247-470) Metalloprotease {Pseudomonas aeruginosa [TaxId: 287]}
+GANLTTRTGDTVYGFNSNTERDFYSATSSSSKLVFSVWDAGGNDTLDFSGFSQNQKINLNEKALSDVGGLKGNVSIAAGVTVENAIGGSGSDLLIGNDVANVLKGGAGNDILYGGLGADQLWGGAGADTFVYGDIAESSAAAPDTLRDFVSGQDKIDLSGLDAFVNGGLVLQYVDAFAGKAGQAILSYDAASKAGSLAIDFSGDAHADFAINLIGQATQADIVV
+>d1kbla2 c.8.1.1 (A:377-509) Pyruvate phosphate dikinase, central domain {Clostridium symbiosum [TaxId: 1512]}
+LHPTFNPAALKAGEVIGSALPASPGAAAGKVYFTADEAKAAHEKGERVILVRLETSPEDIEGMHAAEGILTVRGGMTSHAAVVARGMGTCCVSGCGEIKINEEAKTFELGGHTFAEGDYISLDGSTGKIYKGD
+>d1kgsa1 a.4.6.1 (A:124-225) PhoB {Thermotoga maritima [TaxId: 2336]}
+SKSTKLVCGDLILDTATKKAYRGSKEIDLTKKEYQILEYLVMNKNRVVTKEELQEHLWSFDDEVFSDVLRSHIKNLRKKVDKGFKKKIIHTVRGIGYVARDE
+>d1kjna_ c.115.1.1 (A:) Hypothetical protein MTH777 (MT0777) {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+TGKALMVLGCPESPVQIPLAIYTSHKLKKKGFRVTVTANPAALRLVQVADPEGIYTDEMVDLESCINELAEGDYEFLAGFVPNDAAAAYLVTFAGILNTETLAIIFDRDADVLEELVNEIMETLDAEIIAARAHHNPAPLRVRIDRFMEEKP
+>d1kjqa1 b.84.2.1 (A:319-392) Glycinamide ribonucleotide transformylase PurT, C-domain {Escherichia coli [TaxId: 562]}
+GPAASAVILPQLTSQNVTFDNVQNAVGADLQIRLFGKPEIDGSRRLGVALATAESVVDAIERAKHAAGQVKVQG
+>d1kjqa2 c.30.1.1 (A:2-112) Glycinamide ribonucleotide transformylase PurT, N-domain {Escherichia coli [TaxId: 562]}
+TLLGTALRPAATRVMLLGSGELGKEVAIECQRLGVEVIAVDRYADAPAMHVAHRSHVINMLDGDALRRVVELEKPHYIVPEIEAIATDMLIQLEEEGLNVVPCARATKLTM
+>d1kjqa3 d.142.1.2 (A:113-318) Glycinamide ribonucleotide transformylase PurT, domain 2 {Escherichia coli [TaxId: 562]}
+NREGIRRLAAEELQLPTSTYRFADSESLFREAVADIGYPCIVKPVMSSSGKGQTFIRSAEQLAQAWKYAQQGGRAGAGRVIVEGVVKFDFEITLLTVSAVDGVHFCAPVGHRQEDGDYRESWQPQQMSPLALERAQEIARKVVLALGGYGLFGVELFVCGDEVIFSEVSPRPHDTGMVTLISQDLSEFALHVRAFLGLPVGGIRQY
+>d1kl9a1 a.60.14.1 (A:89-182) Eukaryotic initiation factor 2alpha, eIF2alpha, domain 2 {Human (Homo sapiens) [TaxId: 9606]}
+VSPEEAIKCEDKFTKSKTVYSILRHVAEVLEYTKDEQLESLFQRTAWVFDDKYKRPGYGAYDAFKHAVSDPSILDSLDLNEDEREVLINNINRR
+>d1klxa_ a.118.18.1 (A:) Cysteine rich protein B (HcpB) {Helicobacter pylori [TaxId: 210]}
+GGGTVKKDLKKAIQYYVKACELNEMFGCLSLVSNSQINKQKLFQYLSKACELNSGNGCRFLGDFYENGKYVKKDLRKAAQYYSKACGLNDQDGCLILGYKQYAGKGVVKNEKQAVKTFEKACRLGSEDACGIL
+>d1kmva_ c.71.1.1 (A:) Dihydrofolate reductases, eukaryotic type {Human (Homo sapiens) [TaxId: 9606]}
+VGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTWFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGIKYKFEVYEKND
+>d1knma_ b.42.2.1 (A:) Xylan binding domain, CBM13 (Endo-1,4-beta-xylanase C-terminal domain) {Streptomyces lividans [TaxId: 1916]}
+PPADGGQIKGVGSGRCLDVPDASTSDGTQLQLWDCHSGTNQQWAATDAGELRVYGDKCLDAAGTSNGSKVQIYSCWGGDNQKWRLNSDGSVVGVQSGLCLDAVGNGTANGTLIQLYTCSNGSNQRWTRT
+>d1knza_ e.34.1.1 (A:) NSP3 homodimer {Simian 11 rotavirus [TaxId: 10923]}
+TQQMAVSIINSSFEAAVVAATSALENMGIEYDYQDIYSRVKNKFDFVMDDSGVKNNPIGKAITIDQALNNKFGSAIRNRNWLADTSRPAKLDEDVNKLRMMLSSKGIDQKMRVLNACFSVKRIPGKSSSIIKCTKLMRDKLERGEVEVDDSFVDEKM
+>d1ko7a1 c.98.2.1 (A:1-129) HPr kinase/phoshatase HprK N-terminal domain {Staphylococcus xylosus [TaxId: 1288]}
+MLTTKSLVERFELEMIAGEAGLNKQIKNTDISRPGLEMAGYFSHYASDRIQLLGTTELSFYNLLPDEERKGRMRKLCRPETPAIIVTRDLEPPEELIEAAKEHETPLITSKIATTQLMSRLTTFLEHEL
+>d1kp6a_ d.58.25.1 (A:) Killer toxin KP6 alpha-subunit {Smut fungus (Ustilago maydis) [TaxId: 5270]}
+NNAFCAGFGLSCKWECWCTAHGTGNELRYATAAGCGDHLSKSYYDARAGHCLFSDDLRNQFYSHCSSLNNNMSCRSLSK
+>d1kpta_ d.70.1.1 (A:) Virally encoded KP4 toxin {Ustilago maydis, P4 strain [TaxId: 5270]}
+LGINCRGSSQCGLSGGNLMVRIRDQACGNQGQTWCPGERRAKVCGTGNSISAYVQSTNNCISGTEACRHLTNLVNHGCRVCGSDPLYAGNDVSRGQLTVNYVNSC
+>d1kq6a_ d.189.1.1 (A:) p47phox NADPH oxidase {Human (Homo sapiens) [TaxId: 9606]}
+GDTFIRHIALLGFEKRFVPSQHYVYMFLVKWQDLSEKVVYRRFTEIYEFHKTLKEMFPIEAGAINPENRIIPHLPAPKWFDGQRAAENRQGTLTEYCSTLMSLPTKISRCPHLLDFFKVRPDDLKLPTDNQTKKPETYLM
+>d1kqfb2 f.23.22.1 (B:246-290) Iron-sulfur subunit of formate dehydrogenase N, transmembrane anchor {Escherichia coli [TaxId: 562]}
+IDTSVSLWKGALKPLAAAGFIATFAGLIFHYIGIGPNKEVDDDEE
+>d1kqfc_ f.21.1.1 (C:) Formate dehydrogenase N, cytochrome (gamma) subunit {Escherichia coli [TaxId: 562]}
+SKSKMIVRTKFIDRACHWTVVICFFLVALSGISFFFPTLQWLTQTFGTPQMGRILHPFFGIAIFVALMFMFVRFVHHNIPDKKDIPWLLNIVEVLKGNEHKVADVGKYNAGQKMMFWSIMSMIFVLLVTGVIIWRPYFAQYFPMQVVRYSLLIHAAAGIILIHAILIHMYMAFWVKGSIKGMIEGKVSRRWAKKHHPRWYREIEKAEAKKESEEGI
+>d1kqpa_ c.26.2.1 (A:) NH3-dependent NAD+-synthetase {Bacillus subtilis [TaxId: 1423]}
+SMQEKIMRELHVKPSIDPKQEIEDRVNFLKQYVKKTGAKGFVLGISGGQDSTLAGRLAQLAVESIREEGGDAQFIAVRLPHGTQQDEDDAQLALKFIKPDKSWKFDIKSTVSAFSDQYQQETGDQLTDFNKGNVKARTRMIAQYAIGGQEGLLVLGTDHAAEAVTGFFTKYGDGGADLLPLTGLTKRQGRTLLKELGAPERLYLKEPTADLLDEKPQQSDETELGISYDEIDDYLEGKEVSAKVSEALEKRYSMTEHKRQVPASMFDDWWK
+>d1kwfa_ a.102.1.2 (A:) CelA cellulase {Clostridium thermocellum [TaxId: 1515]}
+AGVPFNTKYPYGPTSIADNQSEVTAMLKAEWEDWKSKRITSNGAGGYKRVQRDASTNYDTVSQGMGYGLLLAVCFNEQALFDDLYRYVKSHFNGNGLMHWHIDANNNVTSHDGGDGAATDADEDIALALIFADKLWGSSGAINYGQEARTLINNLYNHCVEHGSYVLKPGDRWGGSSVTNPSYFAPAWYKVYAQYTGDTRWNQVADKCYQIVEEVKKYNNGTGLVPDWCTASGTPASGQSYDYKYDATRYGWRTAVDYSWFGDQRAKANCDMLTKFFARDGAKGIVDGYTIQGSKISNNHNASFIGPVAAASMTGYDLNFAKELYRETVAVKDSEYYGYYGNSLRLLTLLYITGNFPNPLSDL
+>d1kyfa1 b.1.10.1 (A:692-824) Alpha-adaptin AP2 ear domain, N-terminal subdomain {Mouse (Mus musculus) [TaxId: 10090]}
+GSPGIRLGSSEDNFARFVCKNNGVLFENQLLQIGLKSEFRQNLGRMFIFYGNKTSTQFLNFTPTLICADDLQTNLNLQTKPVDPTVDGGAQVQQVVNIECISDFTEAPVLNIQFRYGGTFQNVSVKLPITLNK
+>d1kyfa2 d.105.1.1 (A:825-938) Alpa-adaptin AP2, C-terminal subdomain {Mouse (Mus musculus) [TaxId: 10090]}
+FFQPTEMASQDFFQRWKQLSNPQQEVQNIFKAKHPMDTEITKAKIIGFGSALLEEVDPNPANFVGAGIIHTKTTQIGCLLRLEPNLQAQMYRLTLRTSKDTVSQRLCELLSEQF
+>d1kyqa2 e.37.1.1 (A:151-273) Bifunctional dehydrogenase/ferrochelatase Met8p, dimerisation and C-terminal domains {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+GANLEIGDRLQILISTNGLSPRFGALVRDEIRNLFTQMGDLALEDAVVKLGELRRGIRLLAPDDKDVKYRMDWARRCTDLFGIQHCHNIDVKRLLDLFKVMFQEQNCSLQFPPRERLLSEYCS
+>d1kzqa1 b.6.2.1 (A:3-131) Major surface antigen p30, SAG1 {Toxoplasma gondii [TaxId: 5811]}
+PLVANQVVTCPDKKSTAAVILTPTENHFTLKCPKTALTEPPTLAYSPNRQICPAGTTSSCTSKAVTLSSLIPEAEDSWWTGDSASLDTAGIKLTVPIEKFPVTTQTFVVGCIKGDDAQSCMVTVTVQAR
+>d1l0qa1 b.1.3.1 (A:302-391) Surface layer protein {Methanosarcina mazei [TaxId: 2209]}
+PVYPSADFKSNITSGYIFLSEPVQFTDLSKDATEWKWDFGDGSSSKKQNPTHTYSETGIYTVRLTVSNSNGTDSQISTVNVVLKGSPTPS
+>d1l0sa_ b.81.2.1 (A:) Thermal hysteresis protein {Spruce budworm (Choristoneura fumiferana), 5-turn isoforms [TaxId: 7141]}
+SCTNTNSQLSANSKCEKSTLTNCYVDKSEVFGTTCTGSRFDGVTITTSTSTGSRISGPGCKISTCIITGGVPAPSAACKISGCTFSAN
+>d1l2pa_ f.23.21.1 (A:) F1F0 ATP synthase subunit B, membrane domain {Escherichia coli [TaxId: 562]}
+TDQLKKAKAEAQVIIEQANKRRSQILDEAKAEAEQERTKIVAQAQAEIEAERKRAREELRK
+>d1l3ka1 d.58.7.1 (A:8-91) Nuclear ribonucleoprotein A1 (RNP A1, UP1) {Human (Homo sapiens) [TaxId: 9606]}
+KEPEQLRKLFIGGLSFETTDESLRSHFEQWGTLTDCVVMRDPNTKRSRGFGFVTYATVEEVDAAMNARPHKVDGRVVEPKRAVS
+>d1l3la2 d.110.5.1 (A:2-169) Transcription factor TraR, N-terminal domain {Agrobacterium tumefaciens [TaxId: 358]}
+QHWLDKLTDLAAIEGDECILKTGLADIADHFGFTGYAYLHIQHRHITAVTNYHRQWQSTYFDKKFEALDPVVKRARSRKHIFTWSGEHERPTLSKDERAFYDHASDFGIRSGITIPIKTANGFMSMFTMASDKPVIDLDREIDAVAAAATIGQIHARISFLRTTPTAE
+>d1l3pa_ a.24.17.1 (A:) Functional domain of pollen allergen Phl P 5b {Timothy grass (Phleum pratense) [TaxId: 15957]}
+IPAGELQIIDKIDAAFKVAATAAATAPADDKFTVFEAAFNKAIKETTGGAYDTYKCIPSLEAAVKQAYAATVAAAPQVKYAVFEAALTKAITAMSEVQKVSQ
+>d1l5ja1 a.118.15.1 (A:1-160) Aconitase B, N-terminal domain {Escherichia coli [TaxId: 562]}
+MLEEYRKHVAERAAEGIAPKPLDANQMAALVELLKNPPAGEEEFLLDLLTNRVPPGVDEAAYVKAGFLAAIAKGEAKSPLLTPEKAIELLGTMQGGYNIHPLIDALDDAKLAPIAAKALSHTLLMFDNFYDVEEKAKAGNEYAKQVMQSWADAEWFLNRP
+>d1l5oa_ c.39.1.1 (A:) Nicotinate mononucleotide:5,6-dimethylbenzimidazole phosphoribosyltransferase (CobT) {Salmonella typhimurium [TaxId: 90371]}
+LHALLRDIPAPDAEAMARTQQHIDGLLKPPGSLGRLETLAVQLAGMPGLNGTPQVGEKAVLVMCADHGVWDEGVAVSPKIVTAIQAANMTRGTTGVCVLAAQAGAKVHVIDVGIDAEPIPGVVNMRVARGCGNIAVGPAMSRLQAEALLLEVSRYTCDLAQRGVTLFGVGELGMANTTPAAAMVSVFTGSDAKEVVGIGANLPPSRIDNKVDVVRRAIAINQPNPRDGIDVLSKVGGFDLVGMTGVMLGAARCGLPVLLDGFLSYSAALAACQIAPAVRPYLIPSHFSAEKGARIALAHLSMEPYLHMAMRLGEGSGAALAMPIVEAACAMFHNMGELAASNIVLP
+>d1l6pa_ b.1.17.1 (A:) Thiol:disulfide interchange protein DsbD, N-terminal domain (DsbD-alpha) {Escherichia coli [TaxId: 562]}
+DAPGRSQFVPADQAFAFDFQQNQHDLNLTWQIKDGYYLYRKQIRITPEHAKIADVQLPQGVWHEDEFYGKSEIYRDRLTLPVTINQASAGATLTVTYQGCADAGFCYPPETKTVPLSEVVA
+>d1l8wa_ a.154.1.1 (A:) Variable surface antigen VlsE {Lyme disease spirochete (Borrelia burgdorferi) [TaxId: 139]}
+GGLVAEAFGFKSDPKKSDVKTYFTTVAAKLEKTKTDLNSLPKEKSDISSTTGKPDSTGSVGTAVEGAIKEVSELLDKLVKAVKTAEGASSGTAAIGEVVADADAAKVADKASVKGIAKGIKEIVEAAGGSEKLKAVAAAKGENNKGAGKLFGKAGAAAHGDSEAASKAAGAVSAVSGEQILSAIVTAADAAEQDGKKPEEAKNPIAAAIGDKDGGAEFGQDEMKKDDQIAAAIALRGMAKDGKFAVKDGEKEKAEGAIKGAAESAVRKVLGAITGLIGDAVSSGLRKVGDS
+>d1l9la_ a.64.1.1 (A:) Granulysin, NKG5 protein {Human (Homo sapiens) [TaxId: 9606]}
+GRDYRTCLTIVQKLKKMVDKPTQRSVSNAATRVCRTGRSRWRDVCRNFMRRYQSRVIQGLVAGETAQQICEDLR
+>d1lc0a2 d.81.1.4 (A:129-246) Biliverdin reductase {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+MEEFEFLRREVLGKELLKGSLRFTASPLEEERFGFPAFSGISRLTWLVSLFGELSLISATLEERKEDQYMKMTVQLETQNKGLLSWIEEKGPGLKRNRYVNFQFTSGSLEEVPSVGVN
+>d1lfpa_ e.39.1.1 (A:) Hypothetical protein aq1575 {Aquifex aeolicus [TaxId: 63363]}
+SHWAQIKHKKAKVDAQRGKLFSKLIREIIVATRLGGPNPEFNPRLRTAIEQAKKANMPWENIERAIKKGAGELEGEQFEEVIYEGYAPGGVAVMVLATTDNRNRTTSEVRHVFTKHGGNLGASGCVSYLFERKGYIEVPAKEVSEEELLEKAIEVGAEDVQPGEEVHIIYTVPEELYEVKENLEKLGVPIEKAQITWKPISTVQINDEETAQKVIKLLNALEELDDVQQVIANFEIPEEILQK
+>d1lfwa2 d.58.19.1 (A:187-382) Aminopeptidase PepV {Lactobacillus delbrueckii [TaxId: 1584]}
+QGIFTLEFSFKNDDTKGDYVLDKFKAGIATNVTPQVTRATISGPDLEAVKLAYESFLADKELDGSFEINDESADIVLIGQGAHASAPQVGKNSATFLALFLDQYAFAGRDKNFLHFLAEVEHEDFYGKKLGIFHHDDLMGDLASSPSMFDYEHAGKASLLNNVRYPQGTDPDTMIKQVLDKFSGILDVTYNGFEEP
+>d1lg7a_ d.213.1.1 (A:) VSV matrix protein {Vesicular stomatitis virus, VSV [TaxId: 11276]}
+QLRYEKFFFTVKMTVRSNRPFRTYSDVAAAVSHWDHMYIGMAGKRPFYKILAFLGSSNLKATPAVLADQGQPEYHAHCEGRAYLPHRMGKTPPMLNVPEHFRRPFNIGLYKGTVELTMTIYDDESLEAAPMIWDHFNSSKFSDFREKALMFGLIVEKKASGAWVLDSVSH
+>d1lkka_ d.93.1.1 (A:) p56-lck tyrosine kinase {Human (Homo sapiens) [TaxId: 9606]}
+LEPEPWFFKNLSRKDAERQLLAPGNTHGSFLIRESESTAGSFSLSVRDFDQNQGEVVKHYKIRNLDNGGFYISPRITFPGLHELVRHYTNASDGLCTRLSRPCQT
+>d1llaa1 a.85.1.1 (A:2-109) Hemocyanin, N-terminal domain {Horseshoe crab (Limulus polyphemus) [TaxId: 6850]}
+LHDKQIRICHLFEQLSSATVIGDGDKHKHSDRLKNVGKLQPGAIFSCFHPDHLEEARHLYEVFWEAGDFNDFIEIAKEARTFVNEGLFAFAAEVAVLHRDDCKGLYVP
+>d1llaa2 a.86.1.1 (A:110-379) Arthropod hemocyanin {Horseshoe crab (Limulus polyphemus) [TaxId: 6850]}
+PVQEIFPDKFIPSAAINEAFKKAHVRPEFDESPILVDVQDTGNILDPEYRLAYYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFNNFDEPLAGYAPHLTHVASGKYYSPRPDGLKLRDLGDIEISEMVRMRERILDSIHLGYVISEDGSHKTLDELHGTDILGALVESSYESVNHEYYGNLHNWGHVTMARIHDPDGRFHEEPGVMSDTSTSLRDPIFYNWHRFIDNIFHEYKNTLK
+>d1lm5a_ d.211.2.1 (A:) Desmoplakin intermediate filament-binding domains {Human (Homo sapiens) [TaxId: 9606]}
+SSPIAAIFDTENLEKISITEGIERGIVDSITGQRLLEAQACTGGIIHPTTGQKLSLQDAVSQGVIDQDMATRLKPAQKAFIGFEGVKGKKKMSAAEAVKEKWLPYEAGQRFLEFQYLTGGLVDPEVHGRISTEEAIRKGFIDGRAAQRLQDTSSYAKILTCPKTKLKISYKDAINRSMVEDITGLRLLEAASVSSK
+>d1lm8v_ b.3.3.1 (V:) VHL {Human (Homo sapiens) [TaxId: 9606]}
+RPVLRSVNSREPSQVIFCNRSPRVVLPVWLNFDGEPQPYPTLPPGTGRRIHSYRGHLWLFRDAGTHDGLLVNQTELFVPSLNVDGQPIFANITLPVYTLKERCLQVVRSLVKPENYRRLDIVRSLYEDLEDHPNVQKDLERLTQERIAHQ
+>d1lmia_ b.1.19.1 (A:) Antigen MPT63/MPB63 (immunoprotective extracellular protein) {Mycobacterium tuberculosis [TaxId: 1773]}
+SAYPITGKLGSELTMTDTVGQVVLGWKVSDLKSSTAVIPGYPVAGQVWEATATVNAIRGSVTPAVSQFNARTADGINYRVLWQAAGPDTISGATIPQGEQSTGKIYFDVTGPSPTIVAMNNGMEDLLIWEP
+>d1lnsa1 a.40.2.1 (A:1-145) X-Prolyl dipeptidyl aminopeptidase PepX, N-terminal domain {Lactococcus lactis [TaxId: 1358]}
+MRFNHFSIVDKNFDEQLAELDQLGFRWSVFWDEKKILKDFLIQSPSDMTALQATAELDVIEFLKSSIELDWEIFWNIALQLLDFVPNFDFEIGKAFEYAKNSNLPQIEAEMTTENIISAFYYLLCTRRKTGMILVEHWVSEGLLP
+>d1lpba1 g.3.10.1 (A:6-44) (Pro)colipase {Pig (Sus scrofa) [TaxId: 9823]}
+GIIINLDEGELCLNSAQCKSNCCQHDTILSLSRCALKAR
+>d1lrza1 a.2.7.4 (A:245-309) Methicillin resistance protein FemA probable tRNA-binding arm {Staphylococcus aureus [TaxId: 1280]}
+FDEYIKELNEERDILNKDLNKALKDIEKRPENKKAHNKRDNLQQQLDANEQKIEEGKRLQEEHGN
+>d1ls1a1 a.24.13.1 (A:1-88) Signal sequence recognition protein Ffh {Thermus aquaticus [TaxId: 271]}
+MFQQLSARLQEAIGRLRGRGRITEEDLKATLREIRRALMDADVNLEVARDFVERVREEALGKQVLESLTPAEVILATVYEALKEALGG
+>d1lsha1 a.118.4.1 (A:285-620) Lipovitellin-phosvitin complex, superhelical domain {Lamprey (Ichthyomyzon unicuspis) [TaxId: 30308]}
+SSAITKMSSLFVTKGKNLESEIHTVLKHLVENNQLSVHEDAPAKFLRLTAFLRNVDAGVLQSIWHKLHQQKDYRRWILDAVPAMATSEALLFLKRTLASEQLTSAEATQIVASTLSNQQATRESLSYARELLNTSFIRNRPILRKTAVLGYGSLVFRYCANTVSCPDELLQPLHDLLSQSSDRAKEEEIVLALKALGNAGQPNSIKKIQRFLPGQGKSLDEYSTRVQAEAIMALRNIAKRDPRKVQEIVLPIFLNVAIKSELRIRSCIVFFESKPSVALVSMVAVRLRREPNLQVASFVYSQMRSLSRSSNPEFRDVAAACSVAIKMLGSKLDRLG
+>d1lsha2 f.7.1.1 (A:17-284) Lipovitellin-phosvitin complex; beta-sheet shell regions {Lamprey (Ichthyomyzon unicuspis) [TaxId: 30308]}
+EFQPGKVYRYSYDAFSISGLPEPGVNRAGLSGEMKIEIHGHTHNQATLKITQVNLKYFLGPWPSDSFYPLTGGYDHFIQQLEVPVRFDYSAGRIGDIYAPPQVTDTAVNIVRGILNLFQLSLKKNQQTFELQETGVEGICQTTYVVQEGYRTNEMAVVKTKDLNNCDHKVYKTMGTAYAERCPTCQKMNKNLRSTAVYNYAIFDEPSGYIIKSAHSEEIQQLSVFDIKEGNVVIESRQKLILEGIQSAPAASQAASLQNRGGLMYKFP
+>d1lsla1 g.60.1.1 (A:416-469) Thrombospondin-1 (TSP-1) {Human (Homo sapiens) [TaxId: 9606]}
+QDGGWSHWSPWSSCSVTCGDGVITRIRLCNSPSPQMNGKPCEGEARETKACKKD
+>d1ltza_ d.178.1.1 (A:) Phenylalanine hydroxylase, PAH {Chromobacterium violaceum [TaxId: 536]}
+FVVPDITTRKNVGLSHDANDFTLPQPLDRYSAEDHATWATLYQRQCKLLPGRACDEFLEGLERLEVDADRVPDFNKLNEKLMAATGWKIVAVPGLIPDDVFFEHLANRRFPVTWWLREPHQLDYLQEPDVFHDLFGHVPLLINPVFADYLEAYGKGGVKAKALGALPMLARLYWYTVEFGLINTPAGMRIYGAGILSSKSESIYCLDSASPNRVGFDLMRIMNTRYRIDTFQKTYFVIDSFKQLFDATAPDFAPLYLQLADAQPWGAGDIAPDDLVL
+>d1luca_ c.1.16.1 (A:) Bacterial luciferase alpha chain, LuxA {Vibrio harveyi [TaxId: 669]}
+MKFGNFLLTYQPPELSQTEVMKRLVNLGKASEGCGFDTVWLLEHHFTEFGLLGNPYVAAAHLLGATETLNVGTAAIVLPTAHPVRQAEDVNLLDQMSKGRFRFGICRGLYDKDFRVFGTDMDNSRALMDCWYDLMKEGFNEGYIAADNEHIKFPKIQLNPSAYTQGGAPVYVVAESASTTEWAAERGLPMILSWIINTHEKKAQLDLYNEVATEHGYDVTKIDHCLSYITSVDHDSNRAKDICRNFLGHWYDSYVNATKIFDDSDQTKGYDFNKGQWRDFVLKGHKDTNRRIDYSYEINPVGTPEECIAIIQQDIDATGIDNICCGFEANGSEEEIIASMKLFQSDVMPYLKEKQ
+>d1m0ka_ f.13.1.1 (A:) Bacteriorhodopsin {Halobacterium salinarum [TaxId: 2242]}
+TGRPEWIWLALGTALMGLGTLYFLVKGMGVSDPDAKKFYAITTLVPAIAFTMYLSMLLGYGLTMVPFGGEQNPIYWARYADWLFTTPLLLLDLALLVDADQGTILALVGADGIMIGTGLVGALTKVYSYRFVWWAISTAAMLYILYVLFFGFTSKAESMRPEVASTFKVLRNVTVVLWSAYPVVWLIGSEGAGIVPLNIETLLFMVLDVSAKVGFGLILLRSRAIFG
+>d1m15a1 a.83.1.1 (A:2-95) Arginine kinase, N-domain {Horseshoe crab (Limulus polyphemus) [TaxId: 6850]}
+VDQATLDKLEAGFKKLQEASDCKSLLKKHLTKDVFDSIKNKKTGMGATLLDVIQSGVENLDSGVGIYAPDAESYRTFGPLFDPIIDDYHGGFKL
+>d1m15a2 d.128.1.2 (A:96-357) Arginine kinase, C-terminal domain {Horseshoe crab (Limulus polyphemus) [TaxId: 6850]}
+TDKHPPKQWGDINTLVGLDPAGQFIISTRVRCGRSLQGYPFNPCLTAEQYKEMEEKVSSTLSSMEDELKGTYYPLTGMSKATQQQLIDDHFLFKEGDRFLQTANACRYWPTGRGIFHNDAKTFLVWVNEEDHLRIISMQKGGDLKTVYKRLVTAVDNIESKLPFSHDDRFGFLTFCPTNLGTTMRASVHIQLPKLAKDRKVLEDIASKFNLQVRGTRGEHTESEGGVYDISNKRRLGLTEYQAVREMQDGILEMIKMEKAAA
+>d1m1eb_ a.161.1.1 (B:) beta-catenin-interacting protein ICAT {Human (Homo sapiens) [TaxId: 9606]}
+KSPEEMYIQQKVRVLLMLRKMGSNLTASEEEFLRTYAGVVNSQLSQLPPHSIDQGAEDVVMAFSRSETED
+>d1m1fa_ b.34.6.2 (A:) Kid toxin protein (ParD) {Plasmid R1, from Escherichia coli [TaxId: 2482]}
+MERGEIWLVSLDPTAGHEQQGTRPVLIVTPAAFNRVTRLPVVVPVTSGGNFARTAGFAVSLDGVGIRTTGVVRCDQPRTIDMKARGGKRLERVPETIMNEVLGRLSTILT
+>d1m1ha1 b.114.1.1 (A:51-131) N-utilization substance G protein NusG, insert domain {Aquifex aeolicus [TaxId: 63363]}
+EEKVVIRAQGKEKYRLSLKGNARDISVLGKKGVTTFRIENGEVKVVESVEGDTCVNAPPISKPGQKITCKENKTEAKIVLD
+>d1m22a_ c.117.1.1 (A:) Peptide amidase Pam {Stenotrophomonas maltophilia [TaxId: 40324]}
+PFPYAETDVADLQARMTAGELDSTTLTQAYLQRIAALDRTGPRLRAVIELNPDALKEAAERDRERRDGRLRGPLHGIPLLLKDNINAAPMATSAGSLALQGFRPDDAYLVRRLRDAGAVVLGKTNLSEWANFRGNDSISGWSARGGQTRNPYRISHSPCGSSSGSAVAVAANLASVAIGTETDGSIVCPAAINGVVGLKPTVGLVSRDGIIPISFSQDTAGPMARSVADAAAVLTAIAGRDDADPATATMPGRAVYDYTARLDPQGLRGKRIGLLQTPLLKYRGMPPLIEQAATELRRAGAVVVPVELPNQGAWAEAERTLLLYEFKAGLERYFNTHRAPLRSLADLIAFNQAHSKQELGLFGQELLVEADATAGLADPAYIRARSDARRLAGPEGIDAALAAHQLDALVAPTTGVAWPIRSEGDDFPGESYSAAAVAGYPSLTVPMGQIDGLPVGLLFMGTAWSEPKLIEMAYAYEQRTRARRPPHFDT
+>d1m55a_ d.89.1.3 (A:) Replication protein Rep, nuclease domain {Adeno-associated virus, aav-5 [TaxId: 272636]}
+MATFYEVIVRVPFDVEEHLPGISDSFVDWVTGQIWELPPESDLNLTLVEQPQLTVADRIRRVFLYEWNKFSKQESKFFVQFEKGSEYFHLHTLVETSGISSMVLGRYVSQIRAQLVKVVFQGIEPQINDWVAITKVKKGGANKVVDSGYIPAYLLPKVQPELQWAWTNLDEYKLAALNLEERKRLVAQFLAES
+>d1m56d_ f.23.8.1 (D:) Bacterial aa3 type cytochrome c oxidase subunit IV {Rhodobacter sphaeroides [TaxId: 1063]}
+GHVAGSMDITQQEKTFAGFVRMVTWAAVVIVAALIFLALANA
+>d1m65a_ c.6.3.1 (A:) Hypothetical protein YcdX {Escherichia coli [TaxId: 562]}
+YPVDLHMHTVASTHAYSTLSDYIAQAKQKGIKLFAITDHGPDMEDAPHHWHFINMRIWPRVVDGVGILRGIEANIKNVDGEIDCSGKMFDSLDLIIAGFHEPVFAPHDKATNTQAMIATIASGNVHIISHPGNPKYEIDVKAVAEAAAKHQVALEINNSSFLHSRKGSEDNCREVAAAVRDAGGWVALGSDSHTAFTMGEFEECLKILDAVDFPPERILNVSPRRLLNFLESRGMAPIAEFADL
+>d1m6ya1 a.60.13.1 (A:115-215) Putative methyltransferase TM0872, insert domain {Thermotoga maritima [TaxId: 2336]}
+NRGFTFEREEPLDMRMDLESEVTAQKVLNELPEEELARIIFEYGEEKRFARRIARKIVENRPLNTTLDLVKAVREALPSYEIRRRKRHFATKTFQAIRIYV
+>d1m98a1 a.175.1.1 (A:2-175) Orange carotenoid protein, N-terminal domain {Arthrospira maxima [TaxId: 129910]}
+PFTIDTARSIFPETLAADVVPATIARFKQLSAEDQLALIWFAYLEMGKTITIAAPGAANMQFAENTLQEIRQMTPLQQTQAMCDLANRTDTPICRTYASWSPNIKLGFWYELGRFMDQGLVAPIPEGYKLSANANAILVTIQGIDPGQQITVLRNCVVDMGFDTSKLGSYQRVA
+>d1mc2a_ a.133.1.2 (A:) Snake phospholipase A2 {Hundred-pace snake (Agkistrodon acutus) [TaxId: 36307]}
+SLFELGKMIWQETGKNPVKNYGLYGCNCGVGGRGEPLDATDRCCFVHKCCYKKLTDCDSKKDRYSYKWKNKAIVCGKNQPCMQEMCECDKAFAICLRENLDTYNKSFRYHLKPSCKKTSEQC
+>d1mf7a_ c.62.1.1 (A:) Integrin alpha M (CR3, CD11b/CD18, Mac-1 alpha subunit) {Human (Homo sapiens) [TaxId: 9606]}
+CPQEDSDIAFLIDGSGSIIPHDFRRMKEFVSTVMEQLKKSKTLFSLMQYSEEFRIHFTFKEFQNNPNPRSLVKPITQLLGRTHTATGIRKVVRELFNITNGARKNAFKILVVITDGEKFGDPLGYEDVIPEADREGVIRYVIGVGDAFRSEKSRQELNTIASKPPRDHVFQVNNFEALKTIQNQLREKIFCIGS
+>d1mg4a_ d.15.11.1 (A:) Doublecortin-like kinase Dclk {Human (Homo sapiens) [TaxId: 9606]}
+KKAKKVRFYRNGDRYFKGIVYAISPDRFRSFEALLADLTRTLSDNVNLPQGVRTIYTIDGLKKISSLDQLVEGESYVCGSIEPFKKLEYTKNVNPNWSVNV
+>d1mg7a2 d.58.26.6 (A:188-380) Early switch protein XOL-1 {Nematode (Caenorhabditis elegans) [TaxId: 6239]}
+EEVHIIAEDGSLENSNGTTEHFNKKHDLVFVKTDLHPEDFTPQMFPSQAKAKLLRDAFNNEEDEDTFPDILVPAYMTAHSKNRVRQEDYTCLEVEFDSQVALEKLMNEHEQVEGFEVQQGGILVALKKDSFFDDELIEKIAIAIATESRQSVSSVSFDLLKLGPGASLVTLANSRRFEPECRVVLQIEVKPVS
+>d1mgta1 a.4.2.1 (A:89-169) O6-alkylguanine-DNA alkyltransferase {Pyrococcus kodakaraensis [TaxId: 311400]}
+VTPFEKKVYEWLTKNVKRGSVITYGDLAKALNTSPRAVGGAMKRNPYPIVVPCHRVVAHDGIGYYSSGIEEKKFLLEIEGV
+>d1mgta2 c.55.7.1 (A:1-88) O6-alkylguanine-DNA alkyltransferase {Pyrococcus kodakaraensis [TaxId: 311400]}
+MLSVEKFRVGERVVWIGVIFSGRVQGIAFAFDRGTLMKRIHDLAEHLGKRGVSISLDVQPSDYPEKVFKVLIGELDNASFLRELSFEG
+>d1mj4a_ d.120.1.1 (A:) Sulfite oxidase, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+STHIYTKEEVSSHTSPETGIWVTLGSEVFDVTEFVDLHPGGPSKLMLAAGGPLEPFWALYAVHNQSHVRELLAQYKIGEL
+>d1mk0a_ d.226.1.1 (A:) Homing endonuclease I-TevI {Bacteriophage T4 [TaxId: 10665]}
+MKSGIYQIKNTLNNKVYVGSAKDFEKRWKRHFKDLEKGCHSSIKLQRSFNKHGNVFECSILEEIPYEKDLIIERANFWIKELNSKINGYNIADATFG
+>d1mkfa_ b.116.1.1 (A:) Viral chemokine binding protein m3 {Murid herpesvirus 4, MuHV-4 [TaxId: 33708]}
+HSSGVSTQSVDLSQIKRGDEIQAHCLTPAETEVTECAGILKDVLSKNLHELQGLCNVKNKMGVPWVSVEELGQEIITGRLPFPSVGGTPVNDLVRVLVVAESNTPEETPEEEFYAYVELQTELYTFGLSDDNVVFTSDYMTVWMIDIPKSYVDVGMLTRATFLEQWPGAKVTVMIPYSSTFTWCGELGAISEESAPQPSLSARSPVCKNSARYSTSKFCEVDGCTAETGMEKMSLLTPFGGPPQQAKMNTCPCYYKYSVSPLPAMDHLILADLAGLDSLTSPVYVMAAYFDSTHENPVRPSSKLYHCALQMTSHDGVWTSTSSEQCPIRLVEGQSQNVLQVRVAPTSMPNLVGVSLMLEGQQYRLEYFGDH
+>d1mkya3 d.52.5.1 (A:359-439) Probable GTPase Der, C-terminal domain {Thermotoga maritima [TaxId: 2336]}
+KVPSSAINSALQKVLAFTNLPRGLKIFFGVQVDIKPPTFLFFVNSIEKVKNPQKIFLRKLIRDYVFPFEGSPIFLKFKRSR
+>d1mlaa2 d.58.23.1 (A:128-197) Probable ACP-binding domain of malonyl-CoA ACP transacylase {Escherichia coli [TaxId: 562]}
+GTGAMAAIIGLDDASIAKACEEAAEGQVVSPVNFNSPGQVVIAGHKEAVERAGAACKAAGAKRALPLPVS
+>d1mpga2 d.129.1.2 (A:1-99) 3-Methyladenine DNA glycosylase II (gene alkA or aidA) {Escherichia coli [TaxId: 562]}
+MYTLNWQPPYDWSWMLGFLAARAVSSVETVADSYYARSLAVGEYRGVVTAIPDIARHTLHINLSAGLEPVAAECLAKMSRLFDLQCNPQIVNGALGRLG
+>d1mska_ d.173.1.1 (A:) Methionine synthase SAM-binding domain {Escherichia coli [TaxId: 562]}
+TPPVTLEAARDNDFAFDWQAYTPPVAHRLGVQEVEASIETLRNYIDWTPFFMTWSLAGKYPRILEDEVVGVEAQRLFKDANDMLDKLSAEKTLNPRGVVGLFPANRVGDDIEIYRDETRTHVINVSHHLRQQTEKTGFANYCLADFVAPKLSGKADYIGAFAVTGGLEEDALADAFEAQHDDYNKIMVKALADRLAEAFAEYLHERVRKVYWGYAPNENLSNEELIRENYQGIRPAPGYPACPEHTEKATIWELLEVEKHTGMKLTESFAMWPGASVSGWYFSHPDSKYYAVAQIQRDQVEDYARRKGMSVTEVERWLAPNLGYDAD
+>d1mtyg_ a.23.3.1 (G:) Methane monooxygenase hydrolase, gamma subunit {Methylococcus capsulatus [TaxId: 414]}
+LGIHSNDTRDAWVNKIAHVNTLEKAAEMLKQFRMDHTTPFRNSYELDNDYLWIEAKLEEKVAVLKARAFNEVDFRHKTAFGEDAKSVLDGTVAKMNAAKDKWEAEKIHIGFRQAYKPPIMPVNYFLDGERQLGTRLMELRNLNYYDTPLEELRKQRGVRVVH
+>d1muwa_ c.1.15.3 (A:) D-xylose isomerase {Streptomyces olivochromogenes [TaxId: 1963]}
+SYQPTPEDRFTFGLWTVGWQGRDPFGDATRPALDPVETVQRLAELGAHGVTFHDDDLIPFGSSDTERESHIKRFRQALDATGMTVPMATTNLFTHPVFKDGGFTANDRDVRRYALRKTIRNIDLAVELGAKTYVAWGGREGAESGAAKDVRVALDRMKEAFDLLGEYVTSQGYDIRFAIEPKPNEPRGDILLPTVGHALAFIERLERPELYGVNPEVGHEQMAGLNFPHGIAQALWAGKLFHIDLNGQSGIKYDQDLRFGAGDLRAAFWLVDLLESAGYEGPRHFDFKPPRTEDIDGVWASAAGCMRNYLILKERAAAFRADPEVQEALRASRLDELAQPTAADGVQELLADRTAFEDFDVDAAAARGMAFERLDQLAMDHLLGAR
+>d1mv8a3 c.26.3.1 (A:301-436) GDP-mannose 6-dehydrogenase, GDP-binding domain {Pseudomonas aeruginosa [TaxId: 287]}
+VQKAFDLITSHDTRKVGLLGLSFKAGTDDLRESPLVELAEMLIGKGYELRIFDRNVEYARVHGANKEYIESKIPHVSSLLVSDLDEVVASSDVLVLGNGDELFVDLVNKTPSGKKLVDLVGFMPHTTTAQAEGICW
+>d1mvfd_ b.129.1.1 (D:) MazE {Escherichia coli [TaxId: 562]}
+SSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPV
+>d1mw5a_ d.259.1.1 (A:) Hypothetical protein HI1480 {Haemophilus influenzae [TaxId: 727]}
+ETDLLMKMVRQPVKLYSVATLFHEFSEVITKLEHSVQKEPTSLLSEENWHKQFLKFAQALPAHGSASWLNLDDALQAVVGNSRSAFLHQLIAKLKSRHLQVLELNKIGSEPLDLSNLPAPFYVLLPESFAARITLLVQDKALPYVRVSMEYWHALEYKGELN
+>d1mwpa_ d.170.2.1 (A:) N-terminal domain of the amyloid precursor protein {Human (Homo sapiens) [TaxId: 9606]}
+LLAEPQIAMFCGRLNMHMNVQNGKWDSDPSGTKTCIDTKEGILQYCQEVYPELQITNVVEANQPVTIQNWCKRGRKQCKTHPHFVIPYRCLVGEFV
+>d1mwqa_ d.58.4.7 (A:) Hypothetical protein HI0828 {Haemophilus influenzae [TaxId: 727]}
+SHMYYVIFAQDIPNTLEKRLAVREQHLARLKQLQAENRLLTAGPNPAIDDENPSEAGFTGSTVIAQFENLQAAKDWAAQDPYVEAGVYADVIVKPFKKVF
+>d1n3la_ c.26.1.1 (A:) Tyrosyl-tRNA synthetase (TyrRS) {Human (Homo sapiens) [TaxId: 9606]}
+APSPEEKLHLITRNLQEVLGEEKLKEILKERELKIYWGTATTGKPHVAYFVPMSKIADFLKAGCEVTILFADLHAYLDNMKAPWELLELRVSYYENVIKAMLESIGVPLEKLKFIKGTDYQLSKEYTLDVYRLSSVVTQHDSKKAGAEVVKQVEHPLLSGLLYPGLQALDEEYLKVDAQFGGIDQRKIFTFAEKYLPALGYSKRVHLMNPMVPGLTGSKMSSSEEESKIDLLDRKEDVKKKLKKAFCEPGNVENNGVLSFIKHVLFPLKSEFVILRDEKWGGNKTYTAYVDLEKDFAAEVVHPGDLKNSVEVALNKLLDPIREKFNTPALKKLASAAYP
+>d1n4ka1 a.118.22.1 (A:436-602) IP3 receptor type 1 binding core, domain 2 {Mouse (Mus musculus) [TaxId: 10090]}
+SPAEVRDLDFANDASKVLGSIAGKLEKGTITQNERRSVTKLLEDLVYFVTGGTNSGQDVLEVVFSKPNRERQKLMREQNILKQIFKLLQAPFTDCGDGPMLRLEELGDQRHAPFRHICRLCYRVLRHSQQDYRKNQEYIAKQFGFMQKQIGYDVLAEDTITALLHNN
+>d1n4wa2 d.16.1.1 (A:319-450) Cholesterol oxidase {Streptomyces sp. [TaxId: 1931]}
+GPNGNIMTARANHMWNPTGAHQSSIPALGIDAWDNSDSSVFAEIAPMPAGLETWVSLYLAITKNPQRGTFVYDAATDRAKLNWTRDQNAPAVNAAKALFDRINKANGTIYRYDLFGTQLKAFADDFCYHPLG
+>d1n5ua1 a.126.1.1 (A:2-196) Serum albumin {Human (Homo sapiens) [TaxId: 9606]}
+AHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQ
+>d1n62a1 a.56.1.1 (A:82-163) Carbon monoxide (CO) dehydrogenase iron-sulfur protein, C-domain {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+APDGTLSALQEGFRMMHGLQCGYCTPGMIMRSHRLLQENPSPTEAEIRFGIGGNLCRCTGYQNIVKAIQYAAAKINGVPFEE
+>d1n62a2 d.15.4.2 (A:3-81) Carbone monoxide (CO) dehydrogenase iron-sulfur protein, N-domain {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+KAHIELTINGHPVEALVEPRTLLIHFIREQQNLTGAHIGCDTSHCGACTVDLDGMSVKSCTMFAVQANGASITTIEGMA
+>d1n62b1 d.41.1.1 (B:6-146) Carbon monoxide (CO) dehydrogenase molybdoprotein, N-domain {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+TVEPTSAERAEKLQGMGCKRKRVEDIRFTQGKGNYVDDVKLPGMLFGDFVRSSHAHARIKSIDTSKAKALPGVFAVLTAADLKPLNLHYMPTLAGDVQAVLADEKVLFQNQEVAFVVAKDRYVAADAIELVEVDYEPLPVL
+>d1n62b2 d.133.1.1 (B:147-809) Carbon monoxide (CO) dehydrogenase molybdoprotein {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+VDPFKAMEPDAPLLREDIKDKMTGAHGARKHHNHIFRWEIGDKEGTDATFAKAEVVSKDMFTYHRVHPSPLETCQCVASMDKIKGELTLWGTFQAPHVIRTVVSLISGLPEHKIHVIAPDIGGGFGNKVGAYSGYVCAVVASIVLGVPVKWVEDRMENLSTTSFARDYHMTTELAATKDGKILAMRCHVLADHGAFDACADPSKWPAGFMNICTGSYDMPVAHLAVDGVYTNKASGGVAYRCSFRVTEAVYAIERAIETLAQRLEMDSADLRIKNFIQPEQFPYMAPLGWEYDSGNYPLAMKKAMDTVGYHQLRAEQKAKQEAFKRGETREIMGIGISFFTEIVGAGPSKNCDILGVSMFDSAEIRIHPTGSVIARMGTKSQGQGHETTYAQIIATELGIPADDIMIEEGNTDTAPYGLGTYGSRSTPTAGAATAVAARKIKAKAQMIAAHMLEVHEGDLEWDVDRFRVKGLPEKFKTMKELAWASYNSPPPNLEPGLEAVNYYDPPNMTYPFGAYFCIMDIDVDTGVAKTRRFYALDDCGTRINPMIIEGQVHGGLTEAFAVAMGQEIRYDEQGNVLGASFMDFFLPTAVETPKWETDYTVTPSPHHPIGAKGVGESPHVGGVPCFSNAVNDAYAFLNAGHIQMPHDAWRLWKVGEQLGLHV
+>d1n62c1 d.87.2.1 (C:178-286) Carbon monoxide (CO) dehydrogenase flavoprotein, C-terminal domain {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+GHGYAYEKLKRKIGDYATAAAAVVLTMSGGKCVTASIGLTNVANTPLWAEEAGKVLVGTALDKPALDKAVALAEAITAPASDGRGPAEYRTKMAGVMLRRAVERAKARA
+>d1n62c2 d.145.1.3 (C:1-177) Carbon monoxide (CO) dehydrogenase flavoprotein, N-terminal domain {Oligotropha carboxidovorans, formerly Pseudomonas carboxydovorans [TaxId: 40137]}
+MIPGSFDYHRPKSIADAVALLTKLGEDARPLAGGHSLIPIMKTRLATPEHLVDLRDIGDLVGIREEGTDVVIGAMTTQHALIGSDFLAAKLPIIRETSLLIADPQIRYMGTIGGNAANGDPGNDMPALMQCLGAAYELTGPEGARIVAARDYYQGAYFTAIEPGELLTAIRIPVPPT
+>d1n7va_ b.126.1.1 (A:) Adsorption protein p2 {Bacteriophage PRD1 [TaxId: 10658]}
+ANFNVPKLGVFPVAAVFDIDNVPEDSSATGSRWLPSIYQGGNYWGGGPQALHAQVSNFDSSNRLPYNPRTENNPAGNCAFAFNPFGQYISNISSAQSVHRRIYGIDLNDEPLFSPNAASITNGGNPTMSQDTGYHNIGPINTAYKAEIFRPVNPLPMSDTAPDPETLEPGQTEPLIKSDGVYSNSGIASFIFDRPVTEPNPNWPPLPPPVIPIIYPTPALGIGAAAAYGFGYQVTVYRWEEIPVEFIADPETCPAQPTTDKVIIRTTDLNPEGSPCAYEAGIILVRQTSNPMNAVAGRLVPYVEDIAVDIFLTGKFFTLNPPLRITNNYFADDEVKENTVTIGNYTTTLSSAYYAVYKTDGYGGATCFIASGGAGISALVQLQDNSVLDVLYYSLPLSLGGSKAAIDEWVANNCGLFPMSGGLDKTTLLEIPRRQLEAINPQDGPGQYDLFILDDSGAYASFSSFIGYPEAAYYVAGAATFMDVENPDEIIFILRNGAGWYACEIGDALKIADDEFDSVDYFAYRGGVMFIGSARYTEGGDPLPIKYRAIIPGLP
+>d1n7za_ b.127.1.1 (A:) Baseplate structural protein gp8 {Bacteriophage T4 [TaxId: 10665]}
+IYRAIVTSKFRTEKMLNFYNSIGSGPDKNTIFITFGRSEPWSSNENEVGFAPPYPTDSVLGVTDMWTHMMGTVKVLPSMLDAVIPRRDWGDTRYPDPYTFRINDIVVCNSAPYNATESGAGWLVYRCLDVPDTGMCSIASLTDKDECLKLGGKWTPSARSMTPPEGRGDAEGTIEPGDGYVWEYLFEIPPDVSINRCTNEYIVVPWPEELKEDPTRWGYEDNLTWQQDDFGLIYRVKANTIRFKAYLDSVYFPEAALPGNKGFRQISIITNPLEAKAHPNDPNVKAEKDYYDPEDLMRHSGEMIYMENRPPIIMAMDQTEEINILFTF
+>d1n81a_ a.185.1.1 (A:) Gametocyte protein Pfg27 {Malaria parasite (Plasmodium falciparum) [TaxId: 5833]}
+YHYEHETHAPLSPRIRKVGDIEFHACSDYIYLLMTLSKDPEKFNYALKDRVSIRRYVRKNQNRYNYFLIEERVQDNIVNRISDRLISYCTDKEVTEDYIKKIDDYLWVEQRVIEEVSINVDHAREVKEKKRIMNDKKLIRMLFDTYEYVKDVKFTDDQYKDAAARISQFLIDVVDSYIIKPIPALP
+>d1n8va_ a.118.21.1 (A:) Chemosensory protein Csp2 {Cabbage moth (Mamestra brassicae) [TaxId: 55057]}
+KYTDKYDNINLDEILANKRLLVAYVNCVMERGKCSPEGKELKEHLQDAIENGCKKCTENQEKGAYRVIEHLIKNEIEIWRELTAKYDPTGNWRKKYEDRAK
+>d1n93x_ a.206.1.1 (X:) P40 nucleoprotein {Borna disease virus [TaxId: 12455]}
+KLPGKFLQYTVGGSDPHPGIGHEKDIRQNAVALLDQSRRDMFHTVTPSLVFLCLLIPGLHAAFVHGGVPRESYLSTPVTRGEQTVVKTAKFYGEKTTQRDLTELEISSIFSHCCSLLIGVVIGSSSKIKAGAEQIKKRFKTMMAALNRPSHGETATLLQMFNPHEAIDWINGQPWVGSFVLSLLTTDFESPGKEFMDQIKLVASYAQMTTYTTIKEYLAECMDATLTIPVVAYEIRDFLEVSAKLKEDHADLFPFLGAIRHPDAIKLAPRSFPNLASAAFYWSKKENPTMAGYRASTIQPGASVKETQLARYRRREISRGEDGAELSGEISAIMKMIGVTGLN
+>d1na6a1 b.142.1.1 (A:4-178) Restriction endonuclease EcoRII, N-terminal domain {Escherichia coli [TaxId: 562]}
+SVFHNWLLEIACENYFVYIKRLSANDTGATGGHQVGLYIPSGIVEKLFPSINHTRELNPSVFLTAHVSSHDCPDSEARAIYYNSAHFGKTRNEKRITRWGRGSPLQDPENTGALTLLAFKLDEQGGDCKEVNIWVCASTDEEDVIETAIGEVIPGALISGPAGQILGGLSLQQAP
+>d1nc7a_ b.123.1.1 (A:) Hypothetical protein TM1070 {Thermotoga maritima [TaxId: 2336]}
+HMNGARKWFFPDGYIPNGKRGYLVSHESLCIMNTGDETAKIRITFLFEDSKPVVHEVEISPMKSLHLRLDKLGIPKCKPYSIMAESNVPVVMQLSRLDVGKNHYTLMTTIGYWEEG
+>d1nd7a_ d.148.1.1 (A:) WW domain-containing protein 1, WWP1 {Human (Homo sapiens) [TaxId: 9606]}
+HMGFRWKLAHFRYLCQSNALPSHVKINVSRQTLFEDSFQQIMALKPYDLRRRLYVIFRGEEGLDYGGLAREWFFLLSHEVLNPMYCLFEYAGKNNYCLQINPASTINPDHLSYFCFIGRFIAMALFHGKFIDTGFSLPFYKRMLSKKLTIKDLESIDTEFYNSLIWIRDNNIEECGLEMYFSVDMEILGKVTSHDLKLGGSNILVTEENKDEYIGLMTEWRFSRGVQEQTKAFLDGFNEVVPLQWLQYFDEKELEVMLCGMQEVDLADWQRNTVYRHYTRNSKQIIWFWQFVKETDNEVRMRLLQFVTGTCRLPLGGFAELMGSNGPQKFCIEKVGKDTWLPRSHTCFNRLDLPPYKSYEQLKEKLLFAIEETE
+>d1ng6a_ a.182.1.1 (A:) Hypothetical protein YqeY {Bacillus subtilis [TaxId: 1423]}
+MSLLERLNQDMKLYMKNREKDKLTVVRMVKASLQNEAIKLKKDSLTEDEELTVLSRELKQRKDSLQEFSNANRLDLVDKVQKELDILEVYLPEQLSEEELRTIVNETIAEVGASSKADMGKVMGAIMPKVKGKADGSLINKLVSSQLS
+>d1nh1a_ e.45.1.1 (A:) Type III effector AvrB {Pseudomonas syringae [TaxId: 317]}
+ALPGPSQRQLEVYDQCLIGAARWPDDSSKSNTPENRAYCQSMYNSIRSAGDEISRGGITSFEELWGRATEWRLSKLQRGEPLYSAFASERTSDTDAVTPLVKPYKSVLARVVDHEDAHDEIMQDNLFGDLNVKVYRQTAYLHGNVIPLNTFRVATDTEYLRDRVAHLRTELGAKALKQHLQRYNPDRIDHTNASYLPIIKDHLNDLYRQAISSDLSQAELISLIARTHWWAASAMPDQRGSAAKAEFAARAIASAHGIELPPFRNGNVSDIEAMLSGEEEFVEKYRSLLD
+>d1nh2b_ a.32.1.1 (B:) Large chain TOA1, N-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+NAEASRVYEIIVESVVNEVREDFENAGIDEQTLQDLKNIWQKKLTE
+>d1nh2c_ b.56.1.1 (C:) Large chain TOA1, C-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+DYLISEGEEDGPDENLMLCLYDKVTRTKARWKCSLKDGVVTINRNDYTFQKAQVEAEWV
+>d1nija2 d.237.1.1 (A:224-318) Hypothetical protein YjiA, C-terminal domain {Escherichia coli [TaxId: 562]}
+ISSIVVELDYPVDISEVSRVMENLLLESADKLLRYKGMLWIDGEPNRLLFQGVQRLYSADWDRPWGDEKPHSTMVFIGIQLPEEEIRAAFAGLRK
+>d1njha_ b.128.1.1 (A:) Hypothetical protein YojF {Bacillus subtilis [TaxId: 1423]}
+NAMKAIIKEDVQASLERYADRPVYIHLETTTGSYSAHLNEKNMTVVAYIRNAKVTYHQAKIKGNGPYRVGLKTEEGWIYAEGLTEYTVDEENRLLMAGHLPGGKLAISLQISEKPFTV
+>d1nkda_ a.30.1.1 (A:) ROP protein {Escherichia coli [TaxId: 562]}
+MTKQEKTALNMARFIRSQTLTLLEKLNELADAADEQADICESLHDHADELYRSCLARFG
+>d1nkia_ d.32.1.2 (A:) Fosfomycin resistance protein A (FosA) {Pseudomonas aeruginosa [TaxId: 287]}
+MLTGLNHLTLAVADLPASIAFYRDLLGFRLEARWDQGAYLELGSLWLCLSREPQYGGPAADYTHYAFGIAAADFARFAAQLRAHGVREWKQNRSEGDSFYFLDPDGHRLEAHVGDLRSRLAACRQAPYAGMRFA
+>d1nkpa_ a.38.1.1 (A:) Myc proto-oncogene protein {Human (Homo sapiens) [TaxId: 9606]}
+GHMNVKRRTHNVLERQRRNELKRSFFALRDQIPELENNEKAPKVVILKKATAYILSVQAEEQKLISEEDLLRKRREQLKHKLEQLGGC
+>d1nkza_ f.3.1.1 (A:) Light-harvesting complex subunits {Rhodoblastus acidophilus [TaxId: 1074]}
+MNQGKIWTVVNPAIGIPALLGSVTVIAILVHLAILSHTTWFPAYWQGGVKKAA
+>d1nlqa_ b.121.3.1 (A:) Chromatin decondensation protein 1 (Crp1, Nlp) {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+EESFYGVTLTAESDSVTWDVDEDYARGQKLVIKQILLGAEAKENEFNVVEVNTPKDSVQIPIAVLKAGETRAVNPDVEFYESKVTFKLIKGSGPVYIHGHNIKDD
+>d1nnxa_ b.40.10.1 (A:) Hypothetical protein YgiW {Escherichia coli [TaxId: 562]}
+QGGFSGPSATQSQAGGFQGPNGSVTTVESAKSLRDDTWVTLRGNIVERISDDLYVFKDASGTINVDIDHKRWNGVTVTPKDTVEIQGEVDKDWNSVEIDVKQIRKV
+>d1no1a_ a.179.1.1 (A:) Replisome organizer (g39p helicase loader/inhibitor protein) {Bacteriophage Spp1 [TaxId: 10724]}
+MIEKDVVQILKAVSEFYPGRFQPDDLKGTVKAWHRVLAEYELEEIMNNLTDYAKVNKFPPTVSDLLK
+>d1nqja_ b.23.2.1 (A:) Class 1 collagenase {Clostridium histolyticum [TaxId: 1498]}
+KATVIPNFNTTMQGSLLGDDSRDYYSFEVKEEGEVNIELDKKDEFGVTWTLHPESNINDRITYGQVDGNKVSNKVKLRPGKYYLLVYKYSGSGNYELRVNK
+>d1nqua_ c.16.1.1 (A:) Lumazine synthase {Aquifex aeolicus [TaxId: 63363]}
+MQIYEGKLTAEGLRFGIVASRFNHALVDRLVEGAIDCIVRHGGREEDITLVRVPGSWEIPVAAGELARKEDIDAVIAIGVLIRGATPHFDYIASEVSKGLANLSLELRKPITFGVITADTLEQAIERAGTKHGNKGWEAALSAIEMANLFKSLR
+>d1nrja_ d.110.4.4 (A:) Srx domain of the signal recognition particle receptor alpha-subunit {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MFDQLAVFTPQGQVLYQYNCLGKKFSEIQINSFISQLITSPVTRKESVANANTDGFDFNLLTINSEHKNSPSFNALFYLNKQPELYFVVTFAEQTLELNQETQQTLALVLKLWNSLHLSESILKNRQGQNEKNKHNYVDILQGIEDDLKKFEQYF
+>d1ntha_ c.1.25.1 (A:) Monomethylamine methyltransferase MtmB {Methanosarcina barkeri [TaxId: 2208]}
+TFRKSFDCYDFYDRAKVGEKCTQDDWDLMKIPMKAMELKQKYGLDFKGEFIPTDKDMMEKLFKAGFEMLLECGIYCTDTHRIVKYTEDEIWDAINNVQKEFVLGTGRDAVNVRKRSVGDKAKPIVQGGPTGSPISEDVFMPVHMSYALEKEVDTIVNGVMTSVRGKSPIPKSPYEVLAAKTETRLIKNACAMAGRPGMGVKGPETSLSAQGNISADCTGGMTCTDSHEVSQLNELKIDLDAISVIAHYKGNSDIIMDEQMPIFGGYAGGIEETTIVDVATHINAVLMSSASWHLDGPVHIRWGSTNTRETLMIAGWACATISEFTDILSGNQYYPCAGPCTEMCLLEASAQSITDTASGREILSGVASAKGVVTDKTTGMEARMMGEVARATAGVEISEVNVILDKLVSLYEKNYASAPAGKTFQECYDVKTVTPTEEYMQVYDGARKKLEDLGLVF
+>d1ntya1 a.87.1.1 (A:1231-1414) Triple functional domain protein TRIO {Human (Homo sapiens) [TaxId: 9606]}
+ARRKEFIMAELIQTEKAYVRDLRECMDTYLWEMTSGVEEIPPGIVNKELIIFGNMQEIYEFHNNIFLKELEKYEQLPEDVGHCFVTWADKFQMYVTYCKNKPDSTQLILEHAGSYFDEIQQRHGLANSISSYLIKPVQRITKYQLLLKELLTCCEEGKGEIKDGLEVMLSVPKRANDAMHLSML
+>d1nu9c1 a.8.6.1 (C:1-145) Staphylocoagulase {Staphylococcus aureus [TaxId: 1280]}
+IVTKDYSKESRVNENSKYGTLISDWYLKGRLTSLESQFINALGILETYHYGEKEYKDAKDKLMTRILGEDQYLLERKKVQYEEYKKLYKKYKEENPTSKVKMKTFDQYTIEDLTMREYNELTESLKSAVKDFEKDVEIIENQHHD
+>d1nvma1 a.5.7.1 (A:291-341) 4-hydroxy-2-oxovalerate aldolase DmpG, communication domain {Pseudomonas sp. [TaxId: 306]}
+YSSFLRHAEIAAAKYNLKTLDILVELGHRRMVGGQEDMIVDVALDLLAAHK
+>d1nvus_ a.117.1.1 (S:) Son of sevenless protein homolog 1 (sos-1) {Human (Homo sapiens) [TaxId: 9606]}
+QMRLPSADVYRFAEPDSEENIIFEENMQPKAGIPIIKAGTVIKLIERLTYHMYADPNFVRTFLTTYRSFCKPQELLSLIIERFEIPEPEPTEADRIAIENGDQPLSAELKRFRKEYIQPVQLRVLNVCRHWVEHHFYDFERDAYLLQRMEEFIGTVRGKAMKKWVESITKIIQRKKIARDNGPGHNITFQSSPPTVEWHISRPGHIETFDLLTLHPIEIARQLTLLESDLYRAVQPSELVGSVWTKEDKEINSPNLLKMIRHTTNLTLWFEKCIVETENLEERVAVVSRIIEILQVFQELNNFNGVLEVVSAMNSSPVYRLDHTFEQIPSRQKKILEEAHELSEDHYKKYLAKLRSINPPCVPFFGIYLTNILKTEEGNPEVLKRHGKELINFSKRRKVAEITGEIQQYQNQPYCLRVESDIKRFFENLNPMGNSMEKEFTDYLFNKSLEIEPRNPKPLPRFPKKYSYPLKSPGVRPSNPR
+>d1nwaa_ d.58.28.1 (A:) Peptide methionine sulfoxide reductase {Mycobacterium tuberculosis [TaxId: 1773]}
+RHMTSNQKAILAGGCFWGLQDLIRNQPGVVSTRVGYSGGNIPNATYRNHGTHAEAVEIIFDPTVTDYRTLLEFFFQIHDPTTKDRQGNDRGTSYRSAIFYFDEQQKRIALDTIADVEASGLWPGKVVTEVSPAGDFWEAEPEHQDYLQRYPNGYTCHFVRPGWRLPRR
+>d1nwza_ d.110.3.1 (A:) Photoactive yellow protein, PYP {Methylophilus methylotrophus, strain w3a1 [TaxId: 17]}
+MEHVAFGSEDIENTLAKMDDGQLDGLAFGAIQLDGDGNILQYNAAEGDITGRDPKQVIGKNFFKDVAPCTDSPEFYGKFKEGVASGNLNTMFEYTFDYQMTPTKVKVHMKKALSGDSYWVFVKRV
+>d1nxja_ c.8.7.1 (A:) Hypothetical protein Rv3853 {Mycobacterium tuberculosis [TaxId: 1773]}
+AISFRPTADLVDDIGPDVRSCDLQFRQFGGRSQFAGPISTVRCFQDNALLKSVLSQPSAGGVLVIDGAGSLHTALVGDVIAELARSTGWTGLIVHGAVRDAAALRGIDIGIKALGTNPRKSTKTGAGERDVEITLGGVTFVPGDIAYSDDDGIIVV
+>d1nxma_ b.82.1.1 (A:) dTDP-4-dehydrorhamnose 3,5-epimerase RmlC {Streptococcus suis [TaxId: 1307]}
+NFFGKTLAARPVEAIPGMLEFDIPVHGDNRGWFKENFQKEKMLPLGFPESFFAEGKLQNNVSFSRKNVLRGLHAEPWDKYISVADGGKVLGTWVDLREGETFGNTYQTVIDASKSIFVPRGVANGFQVLSDFVAYSYLVNDYWALELKPKYAFVNYADPSLDIKWENLEEAEVSEADENHPFLKDVKPLRKEDL
+>d1nxua_ c.122.1.1 (A:) 2,3-diketogulonate oxidoreductase (YiaK) {Escherichia coli [TaxId: 562]}
+MKVTFEQLKAAFNRVLISRGVDSETADACAEMFARTTESGVYSHGVNRFPRFIQQLENGDIIPDAQPKRITSLGAIEQWDAQRSIGNLTAKKMMDRAIELAADHGIGLVALRNANHWMRGGSYGWQAAEKGYIGICWTNSIAVMPPWGAKECRIGTNPLIVAIPSTPITMVDMSMSMFSYGMLEVNRLAGRQLPVDGGFDDEGNLTKEPGVIEKNRRILPMGYWKGSGMSIVLDMIATLLSDGASVAEVTQDNSDEYGISQIFIAIEVDKLIDGPTRDAKLQRIMDYVTSAERADENQAIRLPGHEFTTLLAENRRNGITVDDSVWAKIQAL
+>d1nyca_ b.61.2.2 (A:) Staphostatin B (SspC) {Staphylococcus aureus [TaxId: 1280]}
+GSMYQLQFINLVYDTTKLTHLEQTNINLFIGNWSNHQLQKSICIRHGDDTSHNQYHILFIDTAHQRIKFSSFDNEEIIYILDYDDTQHILMQTSSKQGIGTSRPIVYERLV
+>d1nz0a_ d.14.1.2 (A:) RNase P protein {Thermotoga maritima [TaxId: 2336]}
+ERLRLRRDFLLIFKEGKSLQNEYFVVLFRKNGMDYSRLGIVVKRKFGKATRRNKLKRWVREIFRRNKGVIPKGFDIVVIPRKKLSEEFERVDFWTVREKLLNLLKRIEG
+>d1nzea_ a.24.18.1 (A:) Oxygen-evolving enhancer protein 3, {Spinach (Spinacia oleracea) [TaxId: 3562]}
+FYLQPLPPTEAAQRAKVSASEILNVKQFIDRKAWPSLQNDLRLRASYLRYDLKTVISAKPKDEKKSLQELTSKLFSSIDNLDHAAKIKSPTEAEKYYGQTVSNINEVLAKLG
+>d1nzia1 b.23.1.1 (A:1-117) Complement C1S component {Human (Homo sapiens) [TaxId: 9606]}
+EPTMYGEILSPNYPQAYPSEVEKSWDIEVPEGYGIHLYFTHLDIELSENCAYDSVQIISGDTEEGRLCGQRSSNNPHSPIVEEFQVPYNKLQVIFKSDFSNEERFTGFAAYYVATDI
+>d1o22a_ d.238.1.1 (A:) Hypothetical protein TM0875 {Thermotoga maritima [TaxId: 2336]}
+ILEILYYKKGKEFGILEKKMKEIFNETGVSLEPVNSELIGRIFLKISVLEEGEEVPSFAIKALTPKENAVDLPLGDWTDLKNVFVEEIDYLDSYGDMKILSEKNWYKIYVPYSSVKKKNRNELVEEFMKYFFESKGWNPGEYTFSVQEI
+>d1o26a_ d.207.1.1 (A:) Thy1 homologue {Thermotoga maritima [TaxId: 2336]}
+HHMKIDILDKGFVELVDVMGNDLSAVRAARVSFDMGLKDEERDRHLIEYLMKHGHETPFEHIVFTFHVKAPIFVARQWFRHRIASYNELSGRYSKLSYEFYIPSPERLEGYKTTIPPERVTEKISEIVDKAYRTYLELIESGVPREVARIVLPLNLYTRFFWTVNARSLMNFLNLRADSHAQWEIQQYALAIARIFKEKCPWTFEAFLKYAYKGDILKE
+>d1o2da_ e.22.1.2 (A:) Alcohol dehydrogenase TM0920 {Thermotoga maritima [TaxId: 2336]}
+VWEFYMPTDVFFGEKILEKRGNIIDLLGKRALVVTGKSSSKKNGSLDDLKKLLDETEISYEIFDEVEENPSFDNVMKAVERYRNDSFDFVVGLGGGSPMDFAKAVAVLLKEKDLSVEDLYDREKVKHWLPVVEIPTTAGTGSEVTPYSILTDPEGNKRGCTLMFPVYAFLDPRYTYSMSDELTLSTGVDALSHAVEGYLSRKSTPPSDALAIEAMKIIHRNLPKAIEGNREARKKMFVASCLAGMVIAQTGTTLAHALGYPLTTEKGIKHGKATGMVLPFVMEVMKEEIPEKVDTVNHIFGGSLLKFLKELGLYEKVAVSSEELEKWVEKGSRAKHLKNTPGTFTPEKIRNIYREALGV
+>d1o3ua_ a.24.16.3 (A:) Hypothetical protein TM0613 {Thermotoga maritima [TaxId: 2336]}
+HHHMDAAKDDLEHAKHDLEHGFYNWACFSSQQAAEKAVKAVFQRMGAQAWGYSVPDFLGELSSRFEIPEELMDHALELDKACIPTRYPDALPSGSPRNRYSRIEAERLVNYAEKIIRFCEDLLSRI
+>d1o6aa_ b.139.1.1 (A:) Putative flagelar motor switch protein FliN {Thermotoga maritima [TaxId: 2336]}
+SDKLELLLDIPLKVTVELGRTRMTLKRVLEMIHGSIIELDKLTGEPVDILVNGKLIARGEVVVIDENFGVRITEIVSPKERLELLNE
+>d1o75a1 b.1.20.1 (A:207-332) Tp47 lipoprotein, middle and C-terminal domains {Treponema pallidum [TaxId: 160]}
+ESPHDLVVDTVGTGYHSRFGSDAEASVMLKRADGSELSHREFIDYVMNFNTVRYDYYGDDASYTNLMASYGTKHSADSWWKTGRVPRISCGINYGFDRFKGSGPGYYRLTLIANGYRDVVADVRFL
+>d1o75a3 b.120.1.1 (A:7-206) Tp47 lipoprotein, N-terminal domain {Treponema pallidum [TaxId: 160]}
+ETSYGYATLSYADYWAGELGQSRDVLLAGNAEADRAGDLDAGMFDAVSRATHGHGAFRQQFQYAVEVLGEKVLSKQETEDSRGRKKWEYETDPSVTKMVRASASFQDLGEDGEIKFEAVEGAVALADRASSFMVDSEEYKITNVKVHGMKFVPVAVPHELKGIAKEKFHFVEDSRVTENTNGLKTMLTEDSFSARKVSSM
+>d1o7ja_ c.88.1.1 (A:) Asparaginase type II {Erwinia chrysanthemi [TaxId: 556]}
+KLPNIVILATGGTIAGSAATGTQTTGYKAGALGVDTLINAVPEVKKLANVKGEQFSNMASENMTGDVVLKLSQRVNELLARDDVDGVVITHGTDTVEESAYFLHLTVKSDKPVVFVAAMRPATAISADGPMNLLEAVRVAGDKQSRGRGVMVVINDRIGSARYITKTNASTLDTFRANEEGYLGVIIGNRIYYQNRIDKLHTTRSVFDVRGLTSLPKVDILYGYQDDPEYLYDAAIQHGVKGIVYAGMGAGSVSVRGIAGMRKALEKGVVVMRSTRTGNGIVPPDEELPGLVSDSLNPAHARILLMLALTRTSDPKVIQEYFHTY
+>d1o7qa_ c.68.1.9 (A:) alpha-1,3-galactosyltransferase catalytic domain {Cow (Bos taurus) [TaxId: 9913]}
+KLKLSDWFNPFKRPEVVTMTKWKAPVVWEGTYNRAVLDNYYAKQKITVGLTVFAVGRYIEHYLEEFLTSANKHFMVGHPVIFYIMVDDVSRMPLIELGPLRSFKVFKIKPEKRWQDISMMRMKTIGEHIVAHIQHEVDFLFCMDVDQVFQDKFGVETLGESVAQLQAWWYKADPNDFTYERRKESAAYIPFGEGDFYYHAAIFGGTPTQVLNITQECFKGILKDKKNDIEAQWHDESHLNKYFLLNKPTKILSPEYCWDYHIGLPADIKLVKMSWQTKEYNVVRNNV
+>d1o82a_ a.64.2.1 (A:) Bacteriocin AS-48 {Enterococcus faecalis [TaxId: 1351]}
+MAKEFGIPAAVAGTVLNVVEAGGWVTTIVSILTAVGSGGLSLLAAAGRESIKAYLKKEIKKKGKRAVIAW
+>d1o8ba2 d.58.40.1 (A:127-198) D-ribose-5-phosphate isomerase (RpiA), lid domain {Escherichia coli [TaxId: 562]}
+GKFPLPVEVIPMARSAVARQLVKLGGRPEYRQGVVTDNGNVILDVHGMEILDPIAMENAINAIPGVVTVGLF
+>d1o98a1 c.105.1.1 (A:77-310) 2,3-Bisphosphoglycerate-independent phosphoglycerate mutase, substrate-binding domain {Bacillus stearothermophilus [TaxId: 1422]}
+QSLTRINIAIREGEFDRNETFLAAMNHVKQHGTSLHLFGLLSDGGVHSHIHHLYALLRLAAKEGVKRVYIHGFLDGRDVGPQTAPQYIKELQEKIKEYGVGEIATLSGRYYSMDRDKRWDRVEKAYRAMVYGEGPTYRDPLECIEDSYKHGIYDEFVLPSVIVREDGRPVATIQDNDAIIFYNFRPDRAIQISNTFTNEDFREFDRGPKHPKHLFFVCLTHFSETVAGYVAFKP
+>d1oa8a_ b.145.1.1 (A:) Ataxin-1 {Human (Homo sapiens) [TaxId: 9606]}
+GSPAAAPPTLPPYFMKGSIIQLANGELKKVEDLKTEDFIQSAEISNDLKIDSSTVERIEDSHSPGVAVIQFAVGEHRAQVSVEVLVEYPFFVFGQGWSSCCPERTSQLFDLPCSKLSVGDVCISLTLK
+>d1oaca4 d.82.1.1 (A:5-90) Copper amine oxidase, domain N {Escherichia coli [TaxId: 562]}
+AHMVPMDKTLKEFGADVQWDDYAQLFTLIKDGAYVKVKPGAQTAIVNGQPLALQVPVVMKDNKAWVSDTFINDVFQSGLDQTFQVE
+>d1oaia_ a.5.2.3 (A:) FG-binding, C-terminal domain of TAP {Human (Homo sapiens) [TaxId: 9606]}
+PTLSPEQQEMLQAFSTQSGMNLEWSQKCLQDNNWDYTRSAQAFTHLKAKGEIPEVAFMK
+>d1oc0b_ g.64.1.1 (B:) Vitronectin {Human (Homo sapiens) [TaxId: 9606]}
+ESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAEC
+>d1ocya_ d.231.1.1 (A:) Receptor-binding domain of short tail fibre protein gp12 {Bacteriophage T4 [TaxId: 10665]}
+RVVTQNEIDRTIPVGAIMMWAADSLPSDAWRFCHGGTVSASDCPLYASRIGTRYGGSSSNPGLPDMRGLFVRGSGRGSHLTNPNVNGNDQFGKPRLGVGCTGGYVGEVQKQQMSYHKHAGGFGEYDDSGAFGNTRRSNFVGTRKGLDWDNRSYFTNDGYEIDPASQRNSRYTLNRPELIGNETRPWNISLNYIIKVKE
+>d1ofcx3 a.187.1.1 (X:697-798) HAND domain of the nucleosome remodeling ATPase ISWI {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+AVDAYFREALRVSEPKAPKAPRPPKQPIVQDFQFFPPRLFELLDQEIYYFRKTVGYKVPKNTELGSDATKVQREEQRKIDEAEPLTEEEIQEKENLLSQGFT
+>d1ofda1 b.80.4.1 (A:1240-1507) Alpha subunit of glutamate synthase, C-terminal domain {Synechocystis sp. [TaxId: 1143]}
+VHSNGPVLDDDILADPDIQEAINHQTTATKTYRLVNTDRTVGTRLSGAIAKKYGNNGFEGNITLNFQGAAGQSFGAFNLDGMTLHLQGEANDYVGKGMNGGEIVIVPHPQASFAPEDNVIIGNTCLYGATGGNLYANGRAGERFAVRNSVGKAVIEGAGDHCCEYMTGGVIVVLGPVGRNVGAGMTGGLAYFLDEVGDLPEKINPEIITLQRITASKGEEQLKSLITAHVEHTGSPKGKAILANWSDYLGKFWQAVPPSEKDSPEANN
+>d1ofza_ b.68.8.1 (A:) Fucose-specific lectin {Orange peel mushroom (Aleuria aurantia) [TaxId: 5188]}
+PTEFLYTSKIAAISWAATGGRQQRVYFQDLNGKIREAQRGGDNPWTGGSSQNVIGEAKLFSPLAAVTWKSAQGIQIRVYCVNKDNILSEFVYDGSKWITGQLGSVGVKVGSNSKLAALQWGGSESAPPNIRVYYQKSNLSGSSIHEYVWSGKWTAGASFGSTAPGTGIGATAIGPGRLRIYYQATDNKIREHCWDSNSWYVGGFSASASAGVSIAAISWGSTPNIRVYWQKGREELYEAAYGGSWNTPGQIKDASRPTPSLPDTFIAANSSGNIDISVFFQASGVSLQQWQWISGKGWSIGAVVPTGTPAGW
+>d1ogmx1 b.133.1.1 (X:3-201) Dextranase, N-terminal domain {Penicillium minioluteum [TaxId: 28574]}
+TTANTHCGADFCTWWHDSGEINTQTPVQPGNVRQSHKYSVQVSLAGTNNFHDSFVYESIPRNGNGRIYAPTDPPNSNTLDSSVDDGISIEPSIGLNMAWSQFEYSHDVDVKILATDGSSLGSPSDVVIRPVSISYAISQSDDGGIVIRVPADANGRKFSVEFKTDLYTFLSDGNEYVTSGGSVVGVEPTNALVIFASPF
+>d1oi0a_ c.97.3.1 (A:) Hypothetical protein AF2198 {Archaeoglobus fulgidus [TaxId: 2234]}
+GSSMKISRGLLKTILEAAKSAHPDEFIALLSGSKDVMDELIFLPFVSGSVSAVIHLDMLPIGMKVFGTVHSHPSPSCRPSEEDLSLFTRFGKYHIIVCYPYDENSWKCYNRKGEEVELEVV
+>d1oi7a2 c.23.4.1 (A:122-288) Succinyl-CoA synthetase, alpha-chain, C-terminal domain {Thermus thermophilus [TaxId: 274]}
+NCPGIISAEETKIGIMPGHVFKRGRVGIISRSGTLTYEAAAALSQAGLGTTTTVGIGGDPVIGTTFKDLLPLFNEDPETEAVVLIGEIGGSDEEEAAAWVKDHMKKPVVGFIGGRSAPKGKRMGHAGAIIMGNVGTPESKLRAFAEAGIPVADTIDEIVELVKKALG
+>d1oisa_ e.15.1.1 (A:) Eukaryotic DNA topoisomerase I, N-terminal DNA-binding fragment {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+DTIKWVTLKHNGVIFPPPYQPLPSHIKLYYDGKPVDLPPQAEEVAGFFAALLESDHAKNPVFQKNFFNDFLQVLKESGGPLNGIEIKEFSRCDFTKMFDYFQLQKEQKKQLTSQEKKQIRLEREKFEEDYKFCELDGRREQVGNFKVEPPDLFRGRGAHPKTGKLKRRVNPEDIVLNLSKDAPVPPAPEGHKWGEIRHDNTVQWLAMWRENIFNSFKYVRLAA
+>d1ojha_ a.214.1.1 (A:) Phycobilisome degradation protein NblA {Nostoc sp. PCC 7120 [TaxId: 103690]}
+IELSLEQQFSIRSFATQVQNMSHDQAKDFLVKLYEQMVVREATYQELLKHQW
+>d1ok0a_ b.5.1.1 (A:) alpha-Amylase inhibitor tendamistat {Streptomyces tendae [TaxId: 1932]}
+DTTVSEPAPSCVTLYQSWRYSQADNGCAETVTVKVVYEDDTEGLCYAVAPGQITTVGDGYIGSHGHARYLARCL
+>d1ok7a1 d.131.1.1 (A:1-122) DNA polymerase III, beta subunit {Escherichia coli [TaxId: 562]}
+MKFTVEREHLLKPLQQVSGPLGGRPTLPILGNLLLQVADGTLSLTGTDLEMEMVARVALVQPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGERMLVRSGRSRFSLSTLPAADFPNLDDW
+>d1okca_ f.42.1.1 (A:) ADP,ATP carrier protein {Cow (Bos taurus), heart isoform t1 [TaxId: 9913]}
+DQALSFLKDFLAGGVAAAISKTAVAPIERVKLLLQVQHASKQISAEKQYKGIIDCVVRIPKEQGFLSFWRGNLANVIRYFPTQALNFAFKDKYKQIFLGGVDRHKQFWRYFAGNLASGGAAGATSLCFVYPLDFARTRLAADVGKGAAQREFTGLGNCITKIFKSDGLRGLYQGFNVSVQGIIIYRAAYFGVYDTAKGMLPDPKNVHIIVSWMIAQTVTAVAGLVSYPFDTVRRRMMMQSGRKGADIMYTGTVDCWRKIAKDEGPKAFFKGAWSNVLRGMGGAFVLVLYDEI
+>d1oksa_ a.8.5.1 (A:) RNA polymerase alpha subunit {Measles virus [TaxId: 11234]}
+ASRSVIRSIIKSSRLEEDRKRYLMTLLDDIKGANDLAKFHQMLVKIIMKHHHHH
+>d1olma2 b.132.1.1 (A:275-393) Supernatant protein factor (SPF), C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+KQQYEHSVQISRGSSHQVEYEILFPGCVLRWQFMSDGADVGFGIFLKTKMGERQRAGEMTEVLPNQRYNSHLVPEDGTLTCSDPGIYVLRFDNTYSFIHAKKVNFTVEVLLPDKASEEK
+>d1olta_ c.1.28.2 (A:) Oxygen-independent coproporphyrinogen III oxidase HemN {Escherichia coli [TaxId: 562]}
+QQIDWDLALIQKYNYSGPRYTSYPTALEFSEDFGEQAFLQAVARYPERPLSLYVHIPFCHKLCYFCGCNKIVTRQQHKADQYLDALEQEIVHRAPLFAGRHVSQLHWGGGTPTYLNKAQISRLMKLLRENFQFNADAEISIEVDPREIELDVLDHLRAEGFNRLSMGVQDFNKEVQRLVNREQDEEFIFALLNHAREIGFTSTNIDLIYGLPKQTPESFAFTLKRVAELNPDRLSVFNYAHLPTIFAAQRKIKDADLPSPQQKLDILQETIAFLTQSGYQFIGMDHFARPDDELAVAQREGVLHRNFQGYTTQGDTDLLGMGVSAISMIGDCYAQNQKELKQYYQQVDEQGNALWRGIALTRDDCIRRDVIKSLICNFRLDYSPIEQQWDLLFADYFAEDLKLLAPLAKDGLVDVDEKGIQVTAKGRLLIRNICMCFDTYL
+>d1olza2 b.69.12.1 (A:3-480) Semaphorin 4d {Human (Homo sapiens) [TaxId: 9606]}
+FAPIPRITWEHREVHLVQFHEPDIYNYSALLLSEDKDTLYIGAREAVFAVNALNISEKQHEVYWKVSEDKKAKCAEKGKSKQTECLNYIRVLQPLSATSLYVCGTNAFQPACDHLNLTSFKFLGKNEDGKGRCPFDPAHSYTSVMVDGELYSGTSYNFLGSEPIISRNSSHSPLRTEYAIPWLNEPSFVFADVIRKSPDSPDGEDDRVYFFFTEVSVEYEFVFRVLIPRIARVCKGDQGGLRTLQKKWTSFLKARLICSRPDSGLVFNVLRDVFVLRSPGLKVPVFYALFTPQLNNVGLSAVCAYNLSTAEEVFSHGKYMQSTTVEQSHTKWVRYNGPVPKPRPGACIDSEARAANYTSSLNLPDKTLQFVKDHPLMDDSVTPIDNRPRLIKKDVNYTQIVVDRTQALDGTVYDVMFVSTDRGALHKAISLEHAVHIIEETQLFQDFEPVQTLLLSSKKGNRFVYAGSNSGVVQAPLA
+>d1olza3 g.16.2.1 (A:481-536) Semaphorin 4d {Human (Homo sapiens) [TaxId: 9606]}
+FCGKHGTCEDCVLARDPYCAWSPPTATCVALHQTESPSRGLIQEMSGDASVCPDKS
+>d1on2a2 a.76.1.1 (A:63-136) Manganese transport regulator MntR {Bacillus subtilis [TaxId: 1423]}
+TSKGKKIGKRLVYRHELLEQFLRIIGVDEEKIYNDVEGIEHHLSWNSIDRIGDLVQYFEEDDARKKDLKSIQKK
+>d1oo0a_ d.232.1.1 (A:) Mago nashi protein {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+EDFYLRYYVGHKGKFGHEFLEFEFRPDGKLRYANNSNYKNDTMIRKEAFVHQSVMEELKRIIIDSEIMQEDDLPWPPPDRVGRQELEIVIGDEHISFTTSKTGSLVDVNRSKDPEGLRCFYYLVQDLKCLVFSLIGLHFKIKPI
+>d1ooha_ a.39.2.1 (A:) Odorant binding protein LUSH {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+SHMTMEQFLTSLDMIRSGCAPKFKLKTEDLDRLRVGDFNFPPSQDLMCYTKCVSLMAGTVNKKGEFNAPKALAQLPHLVPPEMMEMSRKSVEACRDTHKQFKESCERVYQTAKCFSENADGQFMWP
+>d1oqja_ d.217.1.1 (A:) Glucocorticoid modulatory element binding protein-1 (Gmeb1) {Human (Homo sapiens) [TaxId: 9606]}
+DMEIAYPITCGESKAILLWKKFVCPGINVKCVKFNDQLISPKHFVHLAGKSTLKDWKRAIRLGGIMLRKMMDSGQIDFYQHDKVCSNTCR
+>d1or7a2 a.177.1.1 (A:-1-111) SigmaE factor (RpoE) {Escherichia coli [TaxId: 562]}
+SHMSEQLTDQVLVERVQKGDQKAFNLLVVRYQHKVASLVSRYVPSGDVPDVVQEAFIKAYRALDSFRGDSAFYTWLYRIAVNTAKNYLVAQGRRPPSSDVDAIEAENFESGGA
+>d1or7c_ a.180.1.1 (C:) N-terminal, cytoplasmic domain of anti-sigmaE factor RseA {Escherichia coli [TaxId: 562]}
+MQKEQLSALMDGETLDSELLNELAHNPEMQKTWESYHLIRDSMRGDTPEVLHFDISSRVMAAIEEE
+>d1orja_ a.24.19.1 (A:) Flagellar export chaperone FliS {Aquifex aeolicus [TaxId: 63363]}
+RNIAEAYFQNMVETATPLEQIILLYDKAIECLERAIEIYDQVNELEKRKEFVENIDRVYDIISALKSFLDHEKGKEIAKNLDTIYTIILNTLVKVDKTKEELQKILEILKDLREAWEEVKKKVHHH
+>d1osya_ b.1.21.1 (A:) Fungal immunomodulatory protein, FIP {Golden needle mushroom (Flammulina velutipes) [TaxId: 38945]}
+SATSLTFQLAYLVKKIDFDYTPNWGRGTPSSYIDNLTFPKVLTDKKYSYRVVVNGSDLGVESNFAVTPSGGQTINFLQYNKGYGVADTKTIQVFVVIPDTGNSEEYIIAEWKKT
+>d1ou8a_ b.136.1.1 (A:) Stringent starvation protein B, SspB {Haemophilus influenzae [TaxId: 727]}
+SSPKRPYLLRAYYDWLVDNSFTPYLVVDATYLGVNVPVEYVKDGQIVLNLSASATGNLQLTNDFIQFNARFKGVSRELYIPMGAALAIYARENGDGVMFEPEEIYD
+>d1ov9a_ a.155.1.1 (A:) H-NS-like protein VicH {Vibrio cholerae [TaxId: 666]}
+EITKTLLNIRSLRAYARELTIEQLEEALDKLTTVVQERKEAEAEE
+>d1ow1a_ b.131.1.3 (A:) SMART/HDAC1 associated repressor protein, SHARP {Human (Homo sapiens) [TaxId: 9606]}
+PVDMVQLLKKYPIVWQGLLALKNDTAAVQLHFVSGNNVLAHRSLPLSEGGPPLRIAQRMRLEATQLEGVARRMTVETDYCLLLALPCGRDQEDVVSQTESLKAAFITYLQAKQAAGIINVPNPGSNQPAYVLQIFPPCEFSESHLSRLAPDLLASISNISPHLMIVIASV
+>d1owla1 a.99.1.1 (A:205-475) C-terminal domain of DNA photolyase {Synechococcus elongatus [TaxId: 32046]}
+PVEPGETAAIARLQEFCDRAIADYDPQRNFPAEAGTSGLSPALKFGAIGIRQAWQAASAAHALSRSDEARNSIRVWQQELAWREFYQHALYHFPSLADGPYRSLWQQFPWENREALFTAWTQAQTGYPIVDAAMRQLTETGWMHNRCRMIVASFLTKDLIIDWRRGEQFFMQHLVDGDLAANNGGWQWSASSGMDPKPLRIFNPASQAKKFDATATYIKRWLPELRHVHPKDLISGEITPIERRGYPAPIVNHNLRQKQFKALYNQLKAAI
+>d1owla2 c.28.1.1 (A:3-204) DNA photolyase {Synechococcus elongatus [TaxId: 32046]}
+APILFWHRRDLRLSDNIGLAAARAQSAQLIGLFCLDPQILQSADMAPARVAYLQGCLQELQQRYQQAGSRLLLLQGDPQHLIPQLAQQLQAEAVYWNQDIEPYGRDRDGQVAAALKTAGIRAVQLWDQLLHSPDQILSGSGNPYSVYGPFWKNWQAQPKPTPVATPTELVDLSPEQLTAIAPLLLSELPTLKQLGFDWDGGF
+>d1ox0a1 c.95.1.1 (A:-5-251) Beta-ketoacyl-ACP synthase II {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+PRGSHMKLNRVVVTGYGVTSPIGNTPEEFWNSLATGKIGIGGITKFDHSDFDVHNAAEIQDFPFDKYFVKKDTNRFDNYSLYALYAAQEAVNHANLDVEALNRDRFGVIVASGIGGIKEIEDQVLRLHEKGPKRVKPMTLPKALPNMASGNVAMRFGANGVCKSINTACSSSNDAIGDAFRSIKFGFQDVMLVGGTEASITPFAIAGFQALTALSTTEDPTRASIPFDKDRNGFVMGEGSGMLVLESLEHAEKRGA
+>d1oxxk1 b.40.6.3 (K:243-352) Glucose transport protein GlcV, N-terminal domain {Sulfolobus solfataricus [TaxId: 2287]}
+EINELEGKVTNEGVVIGSLRFPVSVSSDRAIIGIRPEDVKLSKDVIKDDSWILVGKGKVKVIGYQGGLFRITITPLDSEEEIFTYSDHPIHSGEEVLVYVRKDKIKVFEK
+>d1ozja_ d.164.1.1 (A:) SMAD MH1 domain {Human (Homo sapiens) [TaxId: 9606]}
+FTPPIVKRLLGWKKGEQNGQEEKWCEKAVKSLVKKLKKTGQLDELEKAITTQNVNTKCITIPRSLDGRLQVSHRKGLPHVIYCRLWRWPDLHSHHELRAMELCEFAFNMKKDEVCVNPYHYQRVET
+>d1ozna_ c.10.2.7 (A:) Reticulon 4 receptor (Nogo-66 receptor, Ngr) {Human (Homo sapiens) [TaxId: 9606]}
+PCPGACVCYNEPKVTTSCPQQGLQAVPVGIPAASQRIFLHGNRISHVPAASFRACRNLTILWLHSNVLARIDAAAFTGLALLEQLDLSDNAQLRSVDPATFHGLGRLHTLHLDRCGLQELGPGLFRGLAALQYLYLQDNALQALPDDTFRDLGNLTHLFLHGNRISSVPERAFRGLHSLDRLLLHQNRVAHVHPHAFRDLGRLMTLYLFANNLSALPTEALAPLRALQYLRLNDNPWVCDCRARPLWAWLQKFRGSSSEVPCSLPQRLAGRDLKRLAANDLQGC
+>d1p0za_ d.110.6.1 (A:) Sensor kinase CitA {Klebsiella pneumoniae [TaxId: 573]}
+EERLHYQVGQRALIQAMQISAMPELVEAVQKRDLARIKALIDPMRSFSDATYITVGDASGQRLYHVNPDEIGKSMEGGDSDEALINAKSYVSVRKGSLGSSLRGKSPIQDATGKVIGIVSVGYTIEQLEHH
+>d1p1xa_ c.1.10.1 (A:) Deoxyribose-phosphate aldolase DeoC {Escherichia coli [TaxId: 562]}
+MTDLKASSLRALKLMDLTTLNDDDTDEKVIALCHQAKTPVGNTAAICIYPRFIPIARKTLKEQGTPEIRIATVTNFPHGNDDIDIALAETRAAIAYGADEVDVVFPYRALMAGNEQVGFDLVKACKEACAAANVLLKVIIETGELKDEALIRKASEISIKAGADFIKTSTGKVAVNATPESARIMMEVIRDMGVEKTVGFKPAGGVRTAEDAQKYLAIADELFGADWADARHYRFGASSLLASLLKALGH
+>d1p32a_ d.25.1.1 (A:) Acidic mitochondrial matrix protein p32 {Human (Homo sapiens) [TaxId: 9606]}
+MHTDGDKAFVDFLSDEIKEERKIQKHKTLPKMSGGWELELNGTEAKLVRKVAGEKITVTFNINNSIPPTFDGEEEPSQGQKVEEQEPELTSTPNFVVEVIKNDDGKKALVLDCHYPEDEVGQEDEAESDIFSIREVSFQSTGESEWKDTNYTLNTDSLDWALYDHLMDFLADRGVDNTFADELVELSTALEHQEYITFLEDLKSFVKSQ
+>d1p35a_ b.28.1.1 (A:) Baculovirus p35 protein {AcMNPV (Autographa californica nuclear polyhedrosis virus) [TaxId: 46015]}
+CVIFPVEIDVSQTIIRDCQVDKQTRELVYINKIMNTQLTKPVLMMFNISGPIRSVTRKNNNLRDRIKSKVDEQFDQLERDYSDQMDGFHDSIKYFKDEHYSVSCQNGSVLKSKFAKILKSHDYTDKKSIEAYEKYCLPKLVDERNDYYVAVCVLKPGFENGSNQVLSFEYNPIGNKVIVPFAHEINDTGLYEYDVVAYVDSVQFDGEQFEEFVQSLILPSSFKNSEKVLYYNEASKNKSMIYKALEFTTESSWGKSEKYNWKIFCNGFIYDKKSKVLYVKLHNVTSALNKNVILNTIKA
+>d1p5dx1 c.84.1.1 (X:9-154) Phosphomannomutase/phosphoglucomutase {Pseudomonas aeruginosa [TaxId: 287]}
+LPASIFRAYDIRGVVGDTLTAETAYWIGRAIGSESLARGEPCVAVGRDGRLSGPELVKQLIQGLVDCGCQVSDVGMVPTPVLYYAANVLEGKSGVMLTGSHNPPDYNGFKIVVAGETLANEQIQALRERIEKNDLASGVGSVEQVD
+>d1p5dx4 d.129.2.1 (X:368-463) Phosphomannomutase/phosphoglucomutase {Pseudomonas aeruginosa [TaxId: 287]}
+PSDISTPEINITVTEDSKFAIIEALQRDAQWGEGNITTLDGVRVDYPKGWGLVRASNTTPVLVLRFEADTEEELERIKTVFRNQLKAVDSSLPVPF
+>d1p6oa_ c.97.1.2 (A:) Cytosine deaminase {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+TGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE
+>d1p90a_ c.55.5.2 (A:) NafY core domain {Azotobacter vinelandii [TaxId: 354]}
+ERVPEGSIRVAIASNNGEQLDGHFGSCLRFLVYQVSAKDASLVDIRSTLDVALAEDKNAWRVEQIQDCQVLYVVSIGGPAAAKVVRAGIHPLKKPKGCAAQEAIAELQTVMAGSPPPWLAKLV
+>d1p9ga_ g.3.1.1 (A:) Antifungal peptide 2 {Hardy rubber tree (Eucommia ulmoides) [TaxId: 4392]}
+ETCASRCPRPCNAGLCCSIYGYCGSGAAYCGAGNCRCQCRG
+>d1p9ha_ b.81.3.1 (A:) Adhesin YadA, collagen-binding domain {Yersinia enterocolitica [TaxId: 630]}
+PNLTAVQISPNADPALGLEYPVRPPVPGAGGLNASAKGIHSIAIGATAEAAKGAAVAVGAGSIATGVNSVAIGPLSKALGDSAVTYGAASTAQKDGVAIGARASTSDTGVAVGFNSKADAKNSVAIGHSSHVAANHGYSIAIGDRSKTDRENSVSIGHESLNRQLTHLAAGTKDTDAVNVAQLKKEIEK
+>d1p9ya_ d.241.2.1 (A:) Trigger factor ribosome-binding domain {Escherichia coli [TaxId: 562]}
+MQVSVETTQGLGRRVTITIAADSIETAVKSELVNVAKKVRIDGLRKGKVPMNIVAQRYGASVRQDVLGDLMSRNFIDAIIKEKINPAGAPTYVPGEYKLGEDFTYSVEFEVYPEVEL
+>d1pbja3 d.37.1.1 (A:2-121) Hypothetical protein MTH1622 {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+RVEDVMVTDVDTIDITASLEDVLRNYVENAKGSSVVVKEGVRVGIVTTWDVLEAIAEGDDLAEVKVWEVMERDLVTISPRATIKEAAEKMVKNVVWRLLVEEDDEIIGVISATDILRAKM
+>d1pbya5 b.61.4.1 (A:166-273) Quinohemoprotein amine dehydrogenase A chain, domain 3 {Paracoccus denitrificans [TaxId: 266]}
+PDAYADDASGAYVLAGRQPGRGDYTGRLVLKKAGEDYEVTMTLDFADGSRSFSGTGRILGAGEWRATLSDGTVTIRQIFALQDGRFSGRWHDADSDVIGGRLAAVKAD
+>d1pbyc_ a.137.9.1 (C:) Quinohemoprotein amine dehydrogenase C chain {Paracoccus denitrificans [TaxId: 266]}
+MNALVGCTTSFDPGWEVDAFGAVSNLCQPMEADLYGCADPCWWPAQVADTLNTYPNWSAGADDVMQDWRKLQSVFPETK
+>d1pcfa_ d.18.1.1 (A:) Transcriptional coactivator PC4 C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+AMFQIGKMRYVSVRDFKGKVLIDIREYWMDPEGEMKPGRKGISLNPEQWSQLKEQISDIDDAVRKL
+>d1pdaa2 d.50.2.1 (A:220-307) Porphobilinogen deaminase (hydroxymethylbilane synthase), C-terminal domain {Escherichia coli [TaxId: 562]}
+NHHETALRVTAERAMNTRLEGACQVPIGSYAELIDGEIWLRGLVGAPDGSQIIRGERRGAPQDAEQMGISLAEELLNNGAREILAEVY
+>d1pfoa_ f.9.1.1 (A:) Perfringolysin {Clostridium perfringens [TaxId: 1502]}
+DITDKNQSIDSGISSLSYNRNEVLASNGDKIESFVPKEGKKAGNKFIVVERQKRSLTTSPVDISIIDSVNDRTYPGALQLADKALVENRPTILMVKRKPININIDLPGLKGENSIKVDDPTYGKVSGAIDELVSKWNEKYSSTHTLPARTQYSESMVYSKSQISSALNVNAKVLENSLGVDFNAVANNEKKVMILAYKQIFYTVSADLPKNPSDLFDDSVTFNDLKQKGVSNEAPPLMVSNVAYGRTIYVKLETTSSSKDVQAAFKALIKNTDIKNSQQYKDIYENSSFTAVVLGGDAQEHNKVVTKDFDEIRKVIKDNATFSTKNPAYPISYTSVFLKDNSVAAVHNKTDYIETTSTEYSKGKINLDHSGAYVAQFEVAWDEVSYDKEGNEVLTHKTWDGNYQDKTAHYSTVIPLEANARNIRIKARECTGLAWEWWRDVISEYDVPLTNNINVSIWGTTLYPGSSITYN
+>d1pfva1 a.27.1.1 (A:389-550) Methionyl-tRNA synthetase (MetRS) {Escherichia coli [TaxId: 562]}
+VVNLASRNAGFINKRFDGVLASELADPQLYKTFTDAAEVIGEAWESREFGKAVREIMALADLANRYVDEQAPWVVAKQEGRDADLQAICSMGINLFRVLMTYLKPVLPKLTERAEAFLNTELTWDGIQQPLLGHKVNPFKALYNRIDMRQVEALVEASKEEV
+>d1pfva3 g.41.1.1 (A:141-175) Methionyl-tRNA synthetase (MetRS), Zn-domain {Escherichia coli [TaxId: 562]}
+VKGTCPKCKSPDQYGDNCEVCGATYSPTELIEPKS
+>d1pgsa1 b.121.1.1 (A:4-140) Peptide:N-glycosidase F, PNGase F {Flavobacterium meningosepticum [TaxId: 238]}
+DNTVNIKTFDKVKNAFGDGLSQSAEGTFTFPADVTTVKTIKMFIKNECPNKTCDEWDRYANVYVKNKTTGEWYEIGRFITPYWVGTEKLPRGLEIDVTDFKSLLSGNTELKIYTETWLAKGREYSVDFDIVYGTPDY
+>d1pi1a_ a.29.7.1 (A:) Mob1a {Human (Homo sapiens) [TaxId: 9606]}
+MEATLGSGNLRQAVMLPEGEDLNEWIAVNTVDFFNQINMLYGTITEFCTEASCPVMSAGPRYEYHWADGTNIKKPIKCSAPKYIDYLMTWVQDQLDDETLFPSKIGVPFPKNFMSVAKTILKRLFRVYAHIYHQHFDSVMQLQEEAHLNTSFKHFIFFVQEFNLIDRRELAPLQELIEKLGSKDR
+>d1pjxa_ b.68.6.1 (A:) Diisopropylfluorophosphatase (phosphotriesterase, DFP) {Squid (Loligo vulgaris) [TaxId: 6622]}
+MEIPVIEPLFTKVTEDIPGAEGPVFDKNGDFYIVAPEVEVNGKPAGEILRIDLKTGKKTVICKPEVNGYGGIPAGCQCDRDANQLFVADMRLGLLVVQTDGTFEEIAKKDSEGRRMQGCNDCAFDYEGNLWITAPAGEVAPADYTRSMQEKFGSIYCFTTDGQMIQVDTAFQFPNGIAVRHMNDGRPYQLIVAETPTKKLWSYDIKGPAKIENKKVWGHIPGTHEGGADGMDFDEDNNLLVANWGSSHIEVFGPDGGQPKMRIRCPFEKPSNLHFKPQTKTIFVTEHENNAVWKFEWQRNGKKQYCETLKFGIF
+>d1pl3a_ b.1.9.1 (A:) Cytochrome domain of cellobiose dehydrogenase {Basidomycetes fungus (Phanerochaete chrysosporium) [TaxId: 5306]}
+ESASQFTDPTTGFQFTGITDPVHDVTYGFVFPPLATSGAQSTEFIGEVVAPIASKWIGIALGGAHNNDLLLVAWANGNQIVSSTRWATGYVQPTAYTGTATLTTLPETTINSTHWKWVFRCQGCTEWNNGGGIDVTSQGVLAWAFSNVAVDDPSDPQSTFSEHTDFGFFGIDYSTAHSANYQNYLN
+>d1pm4a_ b.135.1.1 (A:) Superantigen (mitogen) Ypm {Yersinia pseudotuberculosis [TaxId: 633]}
+IPNIATYTGTIQGKGEVCIIGNKEGKTRGGELYAVLHSTNVNADMTLILLRNVGGNGWGEIKRNDIDKPLKYEDYYTSGLSWIWKIKNNSSETSNYSLDATVHDDKEDSDVLTKCPV
+>d1pp0a_ d.103.1.1 (A:) Volvatoxin A2 {Volvariella volvacea, different isoforms [TaxId: 36659]}
+NVFQPVDQLPEDLIPSSIQVLKFSGKYLKLEQDKAYFDWPGFKTAIDNYTGEDLSFDKYDQSTINQQSQEVGAMVDKIAKFLHDAFAAVVDLSKLAAIILNTFTNLEEESSSGFLQFNTNNVKKNSSWEYRVLFSVPFGDNAPSYFYSLVTTILITADIEEKTGWWGLTSSTKKNFAVQIDALELVVKKGFKAP
+>d1ppjc1 f.32.1.1 (C:261-379) Mitochondrial cytochrome b subunit, C-terminal domain {Cow (Bos taurus) [TaxId: 9913]}
+PLNTPPHIKPEWYFLFAYAILRSIPNKLGGVLALAFSILILALIPLLHTSKQRSMMFRPLSQCLFWALVADLLTLTWIGGQPVEHPYITIGQLASVLYFLLILVLMPTAGTIENKLLKW
+>d1ppjd2 f.23.11.1 (D:196-241) Cytochrome c1 subunit of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase), transmembrane anchor {Cow (Bos taurus) [TaxId: 9913]}
+PEHDHRKRMGLKMLLMMGLLLPLVYAMKRHKWSVLKSRKLAYRPPK
+>d1ppje2 f.23.12.1 (E:1-69) Iron-sulfur subunit (ISP) of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase), transmembrane region {Cow (Bos taurus) [TaxId: 9913]}
+SHTDIKVPDFSDYRRPEVLDSTKSSKESSEARKGFSYLVTATTTVGVAYAAKNVVSQFVSSMSASADVL
+>d1ppjf_ f.27.1.1 (F:) 14 kDa protein of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase) {Cow (Bos taurus) [TaxId: 9913]}
+WLEGIRKWYYNAAGFNKLGLMRDDTIHENDDVKEAIRRLPENLYDDRVFRIKRALDLSMRQQILPKEQWTKYEEDKSYLEPYLKEVIRERKEREEWAKK
+>d1ppjg_ f.23.13.1 (G:) Ubiquinone-binding protein QP-C of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase) {Cow (Bos taurus) [TaxId: 9913]}
+GRQFGHLTRVRHVITYSLSPFEQRAFPHYFSKGIPNVLRRTRACILRVAPPFVAFYLVYTWGTQEFEKSKRKNPA
+>d1ppjh_ f.28.1.1 (H:) Non-heme 11 kDa protein of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase) {Cow (Bos taurus) [TaxId: 9913]}
+LVDPLTTVREQCEQLEKCVKARERLELCDERVSSRSQTEEDCTEELLDFLHARDHCVAHKLFNSLK
+>d1ppjj_ f.23.14.1 (J:) Subunit X (non-heme 7 kDa protein) of cytochrome bc1 complex (Ubiquinol-cytochrome c reductase) {Cow (Bos taurus) [TaxId: 9913]}
+FFERAFDQGADAIYEHINEGKLWKHIKHKYENK
+>d1pprm1 a.131.1.1 (M:1-156) Peridinin-chlorophyll protein {Dinoflagellate (Amphidinium carterae) [TaxId: 2961]}
+DEIGDAAKKLGDASYAFAKEVDWNNGIFLQAPGKLQPLEALKAIDKMIVMGAAADPKLLKAAAEAHHKAIGSISGPNGVTSRADWDNVNAALGRVIASVPENMVMDVYDSVSKITDPKVPAYMKSLVNGADAEKAYEGFLAFKDVVKKSQVTSAAG
+>d1ptqa_ g.49.1.1 (A:) Protein kinase C-delta (PKCdelta) {Mouse (Mus musculus) [TaxId: 10090]}
+HRFKVYNYMSPTFCDHCGSLLWGLVKQGLKCEDCGMNVHHKCREKVANLC
+>d1puca_ d.97.1.1 (A:) suc1 {Fission yeast (Schizosaccharomyces pombe) [TaxId: 4896]}
+SKSGVPRLLTASERERLEPFIDQIHYSPRYADDEYEYRHVMLPKAMLKAIPTDYFNPETGTLRILQEEEWRGLGITQSLGWEMYEVHVPEPHILLFKREKD
+>d1pv5a_ d.251.1.1 (A:) Hypothetical protein YwqG {Bacillus subtilis [TaxId: 1423]}
+MNHLPEKMRPYRDLLEKSAKEYVKLNVRKGKTGRYDSKIAGDPYFPKHETYPTDENGQPMKLLAQINFSHIPQLDGYPSSGILQFYISVHDDVYGLNFDDRCEQKNFRVIYFENIVENDDELVSDFSFIGTGECDFPILSEAAVEPVKSSEWVLPTDFQFEQYTGMETMEFFGQFGEDEEDIYNELAENGFGHKIGGYASFTQHDPREYAYKEHTIMLLQIDSDDDIDSMWGDVGIANFFITPEDLRKKDFSNVLYNWDCS
+>d1pvma3 g.41.13.1 (A:143-178) Hypothetical protein Ta0289 C-terminal domain {Thermoplasma acidophilum [TaxId: 2303]}
+QHLCPKCGVGVLEPVYNEKGEIKVFRCSNPACDYEE
+>d1px5a1 a.160.1.2 (A:201-346) 2'-5'-oligoadenylate synthetase 1, OAS1, second domain {Pig (Sus scrofa) [TaxId: 9823]}
+PTKLKSLIRLVKHWYQTCKKTHGNKLPPQYALELLTVYAWEQGSRKTDFSTAQGFQTVLELVLKHQKLCIFWEAYYDFTNPVVGRCMLQQLKKPRPVILDPADPTGNVGGGDTHSWQRLAQEARVWLGYPCCKNLDGSLVGAWTML
+>d1pz4a_ d.106.1.1 (A:) Sterol carrier protein 2 (SCP2) {Yellow fever mosquito (Aedes aegypti) [TaxId: 7159]}
+GIRMSLKSDEVFAKIAKRLESIDPANRQVEHVYKFRITQGGKVVKNWVMDLKNVKLVESDDAAEATLTMEDDIMFAIGTGALPAKEAMAQDKMEVDGQVELIFLLEPFIASLK
+>d1q0qa1 a.69.3.1 (A:301-398) 1-deoxy-D-xylulose-5-phosphate reductoisomerase, C-terminal domain {Escherichia coli [TaxId: 562]}
+KLSALTFAAPDYDRYPCLKLAMEAFEQGQAATTALNAANEITVAAFLAQQIRFTDIAALNLSVLEKMDMREPQCVDDVLSVDANAREVARKEVMRLAS
+>d1q2ha_ a.34.4.1 (A:) Adapter protein APS, dimerisation domain {Human (Homo sapiens) [TaxId: 9606]}
+PDWRQFCELHAQAAAVDFAHKFCRFLRDNPAYDTPDAGASFSRHFAANFLDVFGEEVRRVLVA
+>d1q5ya_ d.58.18.4 (A:) Nickel responsive regulator NikR, C-terminal domain {Escherichia coli [TaxId: 562]}
+TQGFAVLSYVYEHEKRDLASRIVSTQHHHHDLSVATLHVHINHDDCLEIAVLKGDMGDVQHFADDVIAQRGVRHGHLQCLPKED
+>d1q5za_ a.196.1.1 (A:) Invasion protein A (SipA) , C-terminal actin binding domain {Salmonella typhimurium [TaxId: 90371]}
+PFSGLKFKQNSFLSTVPSVTNMHSMHFDARETFLGVIRKALEPDTSTPFPVRRAFDGLRAEILPNDTIKSAALKAQCSDIDKHPELKAKMETLKEVITHHPQKEKLAEIALQFAREAGLTRLKGETDYVLSNVLDGLIGDGSWRA
+>d1q6oa_ c.1.2.3 (A:) 3-keto-L-gulonate 6-phosphate decarboxylase {Escherichia coli [TaxId: 562]}
+LPMLQVALDNQTMDSAYETTRLIAEEVDIIEVGTILCVGEGVRAVRDLKALYPHKIVLADAKIADAGKILSRMCFEANADWVTVICCADINTAKGALDVAKEFNGDVQIELTGYWTWEQAQQWRDAGIGQVVYHRSRDAQAAGVAWGEADITAIKRLSDMGFKVTVTGGLALEDLPLFKGIPIHVFIAGRSIRDAASPVEAARQFKRSIAELW
+>d1q6za1 c.31.1.3 (A:182-341) Benzoylformate decarboxylase {Pseudomonas putida [TaxId: 303]}
+SVRLNDQDLDILVKALNSASNPAIVLGPDVDAANANADCVMLAERLKAPVWVAPSAPRCPFPTRHPCFRGLMPAGIAAISQLLEGHDVVLVIGAPVFRYHQYDPGQYLKPGTRLISVTCDPLEAARAPMGDAIVADIGAMASALANLVEESSRQLPTAAP
+>d1q6za2 c.36.1.5 (A:2-181) Benzoylformate decarboxylase {Pseudomonas putida [TaxId: 303]}
+ASVHGTTYELLRRQGIDTVFGNPGSNALPFLKDFPEDFRYILALQEACVVGIADGYAQASRKPAFINLHSAAGTGNAMGALSNAWNSHSPLIVTAGQQTRAMIGVEALLTNVDAANLPRPLVKWSYEPASAAEVPHAMSRAIHMASMAPQGPVYLSVPYDDWDKDADPQSHHLFDRHVSS
+>d1q74a_ c.134.1.1 (A:) 1D-myo-inosityl 2-acetamido-2-deoxy-alpha-D-glucopyranoside deacetylase MshD {Mycobacterium tuberculosis [TaxId: 1773]}
+ETPRLLFVHAHPDDESLSNGATIAHYTSRGAQVHVVTCTLGEEGEVIGDRWAQLTADHADQLGGYRIGELTAALRALGVSAPIYLGGAGRWRDSGMAGTDQRSQRRFVDADPRQTVGALVAIIRELRPHVVVTYDPNGGYGHPDHVHTHTVTTAAVAAAGVGSGTADHPGDPWTVPKFYWTVLGLSALISGARALVPDDLRPEWVLPRADEIAFGYSDDGIDAVVEADEQARAAKVAALAAHATQVVVGPTGRAAALSNNLALPILADEHYVLAGGSAGARDERGWETDLLAGLGFT
+>d1q7ea_ c.123.1.1 (A:) Hypothetical protein YfdW {Escherichia coli [TaxId: 562]}
+LSTPLQGIKVLDFTGVQSGPSCTQMLAWFGADVIKIERPGVGDVTRHQLRDIPDIDALYFTMLNSNKRSIELNTKTAEGKEVMEKLIREADILVENFHPGAIDHMGFTWEHIQEINPRLIFGSIKGFDECSPYVNVKAYENVAQAAGGAASTTGFWDGPPLVSAAALGDSNTGMHLLIGLLAALLHREKTGRGQRVTMSMQDAVLNLCRVKLRDQQRLDKLGYLEEYPQYPNGTFGDAVPRGGNAGGGGQPGWILKCKGWETDPNAYIYFTIQEQNWENTCKAIGKPEWITDPAYSTAHARQPHIFDIFAEIEKYTVTIDKHEAVAYLTQFDIPCAPVLSMKEISLDPSLRQSGSVVEVEQPLRGKYLTVGCPMKFSAFTPDIKAAPLLGEHTAAVLQELGYSDDEIAAMKQNHAIE
+>d1q88a_ e.47.1.1 (A:) 39 kda initiator binding protein, IBP39, C-terminal domains {Trichomonas vaginalis [TaxId: 5722]}
+MCIGNSTPNEQETFRAKVDEIWFRLTQKTDGTVMRDFLIEKAAEYFKQPEQPKQNAIEVISAIMAPQEEQTKSKADLYKFLAMFGPYETIMLKIASLLLISNNKGHWLTFDPQAEKNANNQRDSISGWFDQNEPNCLILKTPTGIRKIWNKPLIEATGQYLMDENGEKYDSWDKYFEMKPIETYLTAYPTFA
+>d1q8da_ a.228.1.1 (A:) GDNF receptor alpha {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ERPNCLSLQDSCKTNYICRSRLADFFTNCQPESRSVSNCLKENYADCLLAYSGLIGTVMTPNYVDSSSLSVAPWCDCSNSGNDLEDCLKFLNFFKDNTCLKNAIQAFG
+>d1q9ua_ d.129.7.1 (A:) Unnamed hypothetical protein {Bacillus stearothermophilus [TaxId: 1422]}
+AMFHYTVDVSTGMNETIERLEESLKQEGFGVLWQFSVTEKLQEKGLDFSTPMVILEVCNPQEAARVLNENLLVGYFLPCKLVVYQENGTTKIGMPKPTMLVGMMNDPALKEIAADIEKRLAACLDRCR
+>d1qc7a_ a.118.14.1 (A:) FliG {Thermotoga maritima [TaxId: 2336]}
+MFVFEDILKLDDRSIQLVLREVDTRDLALALKGASDELKEKIFKNMSKRAAALLKDELEYMGPVRLKDVEEAQQKIINIIRRLEEAGEIVIARGGGEELIM
+>d1qcsa2 d.31.1.1 (A:86-201) C-terminal domain of NSF-N, NSF-Nc {Chinese hamster (Cricetulus griseus) [TaxId: 10029]}
+DKAKQCIGTMTIEIDFLQKKNIDSNPYDTDKMAAEFIQQFNNQAFSVGQQLVFSFNDKLFGLLVKDIEAMDPSILKGEPASGKRQKIEVGLVVGNSQVAFEKAENSSLNLIGKAKT
+>d1qcza_ c.23.8.1 (A:) N5-CAIR mutase (phosphoribosylaminoimidazole carboxylase, PurE) {Escherichia coli [TaxId: 562]}
+PARVAIVMGSKSDWATMQFAAEIFEILNVPHHVEVVSAHRTPDKLFSFAESAEENGYQVIIAGAGGAAHLPGMIAAKTLVPVLGVPVQSAALSGVDSLYSIVQMPRGIPVGTLAIGKAGAANAALLAAQILATHDKELHQRLNDWRKAQTDEVLENPDPRGAA
+>d1qd1a1 d.58.34.1 (A:2-180) Formiminotransferase domain of formiminotransferase-cyclodeaminase. {Pig (Sus scrofa) [TaxId: 9823]}
+SQLVECVPNFSEGKNQEVIDAISRAVAQTPGCVLLDVDSGPSTNRTVYTFVGRPEDVVEGALNAARAAYQLIDMSRHHGEHPRMGALDVCPFIPVRGVTMDECVRCAQAFGQRLAEELGVPVYLYGEAARTAGRQSLPALRAGEYEALPEKLKQAEWAPDFGPSAFVPSWGATVAGARK
+>d1qexa_ b.32.1.1 (A:) gp9 {Bacteriophage T4 [TaxId: 10665]}
+MFIQEPKKLIDTGEIGNASTGDILFDGGNKINSDFNAIYNAFGDQRKMAVANGTGADGQIIHATGYYQKHSITEYATPVKVGTRHDIDTSTVGVKVIIERGELGDCVEFINSNGSISVTNPLTIQAIDSIKGVSGNLVVTSPYSKVTLRCISSDNSTSVWNYSIESMFGQKESPAEGTWNISTSGSVDIPLFHRTEYNMAKLLVTCQSVDGRKIKTAEINILVDTVNSEVISSEYAVMRVGNETEEDEIANIAFSIKENYVTATISSSTVGMRAAVKVIATQKIGVAQ
+>d1qf8a_ g.41.4.1 (A:) Casein kinase II beta subunit {Human (Homo sapiens) [TaxId: 9606]}
+VSWISWFCGLRGNEFFCEVDEDYIQDKFNLTGLNEQVPHYRQALDMILDLEPDEELEDNPNQSDLIEQAAEMLYGLIHARYILTNRGIAQMLEKYQQGDFGYCPRVYCENQPMLPIGLSDIPGEAMVKLYCPKCMDVYTPKSSRHHHTDGAYFGTGFPHMLFMVHPEYRPKRP
+>d1qfma1 b.69.7.1 (A:1-430) Prolyl oligopeptidase, N-terminal domain {Pig (Sus scrofa) [TaxId: 9823]}
+MLSFQYPDVYRDETAIQDYHGHKVCDPYAWLEDPDSEQTKAFVEAQNKITVPFLEQCPIRGLYKERMTELYDYPKYSCHFKKGKRYFYFYNTGLQNQRVLYVQDSLEGEARVFLDPNILSDDGTVALRGYAFSEDGEYFAYGLSASGSDWVTIKFMKVDGAKELPDVLERVKFSCMAWTHDGKGMFYNAYPQQDGKSDGTETSTNLHQKLYYHVLGTDQSEDILCAEFPDEPKWMGGAELSDDGRYVLLSIREGCDPVNRLWYCDLQQESNGITGILKWVKLIDNFEGEYDYVTNEGTVFTFKTNRHSPNYRLINIDFTDPEESKWKVLVPEHEKDVLEWVACVRSNFLVLCYLHDVKNTLQLHDLATGALLKIFPLEVGSVVGYSGQKKDTEIFYQFTSFLSPGIIYHCDLTKEELEPRVFREVTVKGI
+>d1qkra_ a.24.9.1 (A:) Vinculin {Chicken (Gallus gallus) [TaxId: 9031]}
+KDEEFPEQKAGEAINQPMMMAARQLHDEARKWSSKGNDIIAAAKRMALLMAEMSRLVRGGSGNKRALIQCAKDIAKASDEVTRLAKEVAKQCTDKRIRTNLLQVCERIPTISTQLKILSTVKATMLGRTNISDEESEQATEMLVHNAQNLMQSVKETVREAEAASIKIRTDAGFTLRWVRK
+>d1qksa2 b.70.2.1 (A:136-567) C-terminal (heme d1) domain of cytochrome cd1-nitrite reductase {Paracoccus denitrificans [TaxId: 266]}
+EFGMKEMRESWKVHVAPEDRPTQQMNDWDLENLFSVTLRDAGQIALIDGSTYEIKTVLDTGYAVHISRLSASGRYLFVIGRDGKVNMIDLWMKEPTTVAEIKIGSEARSIETSKMEGWEDKYAIAGAYWPPQYVIMDGETLEPKKIQSTRGMTYDEQEYHPEPRVAAILASHYRPEFIVNVKETGKILLVDYTDLNNLKTTEISAERFLHDGGLDGSHRYFITAANARNKLVVIDTKEGKLVAIEDTGGQTPHPGRGANFVHPTFGPVWATSHMGDDSVALIGTDPEGHPDNAWKILDSFPALGGGSLFIKTHPNSQYLYVDATLNPEAEISGSVAVFDIKAMTGDGSDPEFKTLPIAEWAGITEGQPRVVQGEFNKDGTEVWFSVWNGKDQESALVVVDDKTLELKHVIKDERLVTPTGKFNVYNTMTDTY
+>d1qlma_ d.147.1.1 (A:) Methenyltetrahydromethanopterin cyclohydrolase {Methanopyrus kandleri [TaxId: 2320]}
+MVSVNENALPLVERMIERAELLNVEVQELENGTTVIDCGVEAAGGFEAGLLFSEVCMGGLATVELTEFEHDGLCLPAVQVTTDHPAVSTLAAQKAGWQVQVGDYFAMGSGPARALALKPKETYEEIDYEDDADVAILCLESSELPDEDVAEHVADECGVDPENLYLLVAPTASIVGSVQVSARVVETGLYKLLEVLEYDVTRVKYATGTAPIAPVADDDGEAMGRTNDCILYGGTVYLYVEGDDELPEVVEELPSEASEDYGKPFMKIFEEADYDFYKIDPGVFAPARVVVNDLSTGKTYTAGEINVDVLKESFSL
+>d1qmea1 d.11.1.1 (A:632-692) Penicillin-binding protein 2x (pbp-2x), c-terminal domain {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+QQSPYPMPSVKDISPGDLAEELRRNLVQPIVVGTGTKIKNSSAEEGKNLAPNQQVLILSDK
+>d1qmha1 c.47.2.1 (A:185-279) RNA 3'-terminal phosphate cyclase, RPTC, insert domain {Escherichia coli [TaxId: 562]}
+ERGNIVQMRGEVLLAGVPRHVAEREIATLAGSFSLHEQNIHNLPRDQGPGNTVSLEVESENITERFFVVGEKRVSAEVVAAQLVKEVKRYLASTA
+>d1qsaa1 a.118.5.1 (A:1-450) 70 KDa soluble lytic transglycosylase (SLT70), superhelical domain {Escherichia coli [TaxId: 562]}
+DSLDEQRSRYAQIKQAWDNRQMDVVEQMMPGLKDYPLYPYLEYRQITDDLMNQPAVTVTNFVRANPTLPPARTLQSRFVNELARREDWRGLLAFSPEKPGTTEAQCNYYYAKWNTGQSEEAWQGAKELWLTGKSQPNACDKLFSVWRASGKQDPLAYLERIRLAMKAGNTGLVTVLAGQMPADYQTIASAIISLANNPNTVLTFARTTGATDFTRQMAAVAFASVARQDAENARLMIPSLAQAQQLNEDQIQELRDIVAWRLMGNDVTDEQAKWRDDAIMRSQSTSLIERRVRMALGTGDRRGLNTWLARLPMEAKEKDEWRYWQADLLLERGREAEAKEILHQLMQQRGFYPMVAAQRIGEEYELKIDKAPQNVDSALTQGPEMARVRELMYWNLDNTARSEWANLVKSKSKTEQAQLARYAFNNQWWDLSVQATIAGKLWDHLEERFP
+>d1qw2a_ d.249.1.1 (A:) Hypothetical protein Ta1206 {Thermoplasma acidophilum [TaxId: 2303]}
+NYFQGHMMQIDSIEIGGKVYQFFKSDLGNAPLLFIKGSKGYAMCGYLNMETSNKVGDIAVRVMGVKTLDDMLSAKVVEASQEAQKVGINPGDVLRNVIDKLG
+>d1qwga_ c.1.27.1 (A:) (2r)-phospho-3-sulfolactate synthase ComA {Methanococcus jannaschii [TaxId: 2190]}
+MKAFEFLYEDFQRGLTVVLDKGLPPKFVEDYLKVCGDYIDFVKFGWGTSAVIDRDVVKEKINYYKDWGIKVYPGGTLFEYAYSKGKFDEFLNECEKLGFEAVEISDGSSDISLEERNNAIKRAKDNGFMVLTEVGKKMPDKDKQLTIDDRIKLINFDLDAGADYVIIEGRESGKGKGLFDKEGKVKENELDVLAKNVDINKVIFEAPQKSQQVAFILKFGSSVNLANIAFDEVISLETLRRGLRGDTFGKV
+>d1qwya_ b.84.3.2 (A:) Peptidoglycan hydrolase LytM {Staphylococcus aureus [TaxId: 1280]}
+VSYGTYYTIDSNGDYHHTPDGNWNQAMFDNKEYSYTFVDAQGHTHYFYNCYPKNANANGSGQTYVNPATAGDNNDYTASQSQQHINQYGYQSNVGPDASYYSHSNNNQAYNSHDGNGKVNYPNGTSNQNGGSASKATASGHAKDASWLTSRKQLQPYGQYHGGGAHYGVDYAMPENSPVYSLTDGTVVQAGWSNYGGGNQVTIKEANSNNYQWYMHNNRLTVSAGDKVKAGDQIAYSGSTGNSTAPHVHFQRMSGGIGNQYAVDPTSYLQ
+>d1r0da_ a.216.1.1 (A:) Huntingtin interacting protein 12 {Human (Homo sapiens) [TaxId: 9606]}
+DVRQEELGAVVDKEMAATSAAIEDAVRRIEDMMNQARHASSGVKLEVNERILNSCTDLMKAIRLLVTTSTSLQKEIVESGRGAATQQEFYAKNSRWTEGLISASKAVGWGATQLVEAADKVVLHTGKYEELIVCSHEIAASTAQLVAASKVKANKHSPHLSRLQECSRTVNERAANVVASTKSGQEQIEDRDTM
+>d1r0ma1 c.1.11.2 (A:133-375) N-acylamino acid racemase {Deinococcus radiodurans [TaxId: 1299]}
+HKEQVEVGVSLGIQADEQATVDLVRRHVEQGYRRIKLKIKPGWDVQPVRATREAFPDIRLTVDANSAYTLADAGRLRQLDEYDLTYIEQPLAWDDLVDHAELARRIRTPLCLDESVASASDARKALALGAGGVINLKVARVGGHAESRRVHDVAQSFGAPVWCGGMLESGIGRAHNIHLSTLSNFRLPGDTSSASRYWERDLIQEPLEAVDGLMPVPQGPGTGVTLDREFLATVTEAQEEHRA
+>d1r0ma2 d.54.1.1 (A:6-132) N-acylamino acid racemase {Deinococcus radiodurans [TaxId: 1299]}
+RMFKIEAAEIVVARLPLKFRFETSFGVQTHKVVPLLILHGEGVQGVAEGTMEARPMYREETIAGALDLLRGTFLPAILGQTFANPEAVSDALGSYRGNRMARAMVEMAAWDLWARTLGVPLGTLLGG
+>d1r0ri_ g.68.1.1 (I:) Ovomucoid domains {Turkey (Meleagris gallopavo) [TaxId: 9103]}
+VDCSEYPKPACTLEYRPLCGSDNKTYGNKCNFCNAVVESNGTLTLSHFGKC
+>d1r0va1 c.52.2.1 (A:62-139) Dimeric tRNA splicing endonuclease, domains 2 and 4 {Archaeoglobus fulgidus [TaxId: 2234]}
+DFSTYYFVYEDLRDRGNKVKIQGEFLLTKKPYLPISERKTIRMEEIAEKARNFDELRLAVVDEESEITYFRVYEPDMM
+>d1r0va3 d.75.1.1 (A:140-214) Dimeric tRNA splicing endonuclease, domains 1 and 3 {Archaeoglobus fulgidus [TaxId: 2234]}
+GEQKEELPEIAGVLSDEYVITKQTEIFSRYFYGSEKGDLVTLSLIESLYLLDLGKLNLLNADREELVKRAREVER
+>d1r29a_ d.42.1.1 (A:) B-cell lymphoma 6 (Bcl6) protein BTB domain {Human (Homo sapiens) [TaxId: 9606]}
+SQIQFTRHASDVLLNLNRLRSRDILTDVVIVVSREQFRAHKTVLMACSGLFYSIFTDQLKRNLSVINLDPEINPEGFNILLDFMYTSRLNLREGNIMAVMATAMYLQMEHVVDTCRKFIKAS
+>d1r3jc_ f.14.1.1 (C:) Potassium channel protein {Streptomyces coelicolor [TaxId: 1902]}
+SALHWRAAGAATVLLVIVLLAGSYLAVLAERGAPGAQLITYPRALWWSVETATTVGYGDLYPVTLWGRCVAVVVMVAGITSFGLVTAALATWFVGREQERRGH
+>d1r3sa_ c.1.22.1 (A:) Uroporphyrinogen decarboxylase, UROD {Human (Homo sapiens) [TaxId: 9606]}
+FPELKNDTFLRAAWGEETDYTPVWCMRQAGRYLPEFRETRAAQDFFSTCRSPEACCELTLQPLRRFPLDAAIIFSGILVVPQALGMEVTMVPGKGPSFPEPLREEQDLERLRDPEVVASELGYVFQAITLTRQRLAGRVPLIGFAGAPWTLMTYMVEGGGSSTMAQAKRWLYQRPQASHQLLRILTDALVPYLVGQVVAGAQALQLFESHAGHLGPQLFNKFALPYIRDVAKQVKARLREAGLAPVPMIIFAKDGHFALEELAQAGYEVVGLDWTVAPKKARECVGKTVTLQGNLDPCALYASEEEIGQLVKQMLDDFGPHRYIANLGHGLYPDMDPEHVGAFVDAVHKHSRLLRQ
+>d1r5la1 a.5.3.1 (A:25-90) Alpha-tocopherol transfer protein {Human (Homo sapiens) [TaxId: 9606]}
+QPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARDFDLDLAWRLLKNYYKWRAECPEISADLHPR
+>d1r5la2 c.13.1.1 (A:91-275) Alpha-tocopherol transfer protein {Human (Homo sapiens) [TaxId: 9606]}
+SIIGLLKAGYHGVLRSRDPTGSKVLIYRIAHWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIAAVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHFPDILPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISE
+>d1r6fa_ e.46.1.1 (A:) Low calcium response locus protein V, LcrV {Yersinia pestis [TaxId: 632]}
+GSSVLEELVQLVAAANIDISIKYDPRKDSEVFANRVITDDIELLKKILAYFLPEDAILKGGHYDNQLQNGIKRVKEFLESSPNTQWELRAFMAVMHFSLTADRIDDDILKVIVDSMNHHGDARSKLREELAELTAELKIYSVIQAEINKHLSSSGTINIHDKSINLMDKNLYGYTDEEIFKASAEYKILEKMPQTTIQVDGSEKKIVSIKDFLGSENKRTGALGNLKNSYSYNKDNNELSHFATTCSDKSRPLNDLVSQKTTQLSDITSRFNSAIEALNRFIQKYDSVMQRLLDD
+>d1r6ja_ b.36.1.1 (A:) Syntenin 1 {Human (Homo sapiens) [TaxId: 9606]}
+GAMDPRTITMHKDSTGHVGFIFKNGKITSIVKDSSAARNGLLTEHNICEINGQNVIGLKDSQIADILSTSGTVVTITIMPAF
+>d1r71a_ a.4.14.1 (A:) Transcriptional repressor protein KorB DNA-binding domain {Escherichia coli [TaxId: 562]}
+EADQVIENLQRNELTPREIADFIGRELAKGKKKGDIAKEIGKSPAFITQHVTLLDLPEKIADAFNTGRVRDVTVVNELVTAFKKRPEEVEAWLDDDTQEITRGTVKLLREFLDE
+>d1r75a_ b.134.1.1 (A:) Unnamed hypothetical protein {Leishmania major [TaxId: 5664]}
+VTFKNGKPTVKGTKTYPMFSNILYRIADTEARRWAFYNDSKELIIHVAVLFDYDSQIVPLGDTTAFRIDDPDEGNEDDFGKYLCEVDVRPLETQMFVEGSVTGWRVDTLEARTAEDERGYR
+>d1r7la_ d.277.1.1 (A:) Bacillus phage protein {Bacillus cereus [TaxId: 1396]}
+LYFQSNAMKPRDINKLIASKIFGYEIKDDNIIKDGRYRLGIPLYSQNIESAWQVVEKLEYDVKVTKTDLKPKYQVHVFVPGGVKMVFAETAPMAICKGALASV
+>d1r8se_ a.118.3.1 (E:) Exchange factor ARNO {Human (Homo sapiens) [TaxId: 9606]}
+NRKMAMGRKKFNMDPKKGIQFLVENELLQNTPEEIARFLYKGEGLNKTAIGDYLGEREELNLAVLHAFVDLHEFTDLNLVQALRQFLWSFRLPGKAQKIDRMMEAFAQRYCLCNPGVFQSTDTCYVLSYSVIMLNTDLHNPNVRDKMGLERFVAMNRGINEGGDLPEELLRNLYDSIRNEPFKIPED
+>d1r9fa_ d.255.1.1 (A:) Tombusvirus P19 core protein, VP19 {Tomato bushy stunt virus, TBSV [TaxId: 12145]}
+HMTSPFKLPDESPSWTEWRLHNDETNSNQDNPLGFKESWGFGKVVFKRYLRYDRTEASLHRVLGSWTGDSVNYAASRFFGFDQIGCTYSIRFRGVSITVSGGSRTLQHLCEMAIRSKQEMLQMA
+>d1rc9a2 g.19.1.2 (A:165-221) Cysteine-rich secretory protein (SteCRISP) {Chinese green tree viper (Trimeresurus stejnegeri) [TaxId: 39682]}
+TPCGDCPSDCDNGLCTNPCTRENKFTNCNTMVQQSSCQDNYMKTNCPASCFCQNKII
+>d1rcqa2 c.1.6.1 (A:8-233) Alanine racemase {Pseudomonas aeruginosa [TaxId: 287]}
+IDLQALRHNYRLAREATGARALAVIKADAYGHGAVRCAEALAAEADGFAVACIEEGLELREAGIRQPILLLEGFFEASELELIVAHDFWCVVHCAWQLEAIERASLARPLNVWLKMDSGMHRVGFFPEDFRAAHERLRASGKVAKIVMMSHFSRADELDCPRTEEQLAAFSAASQGLEGEISLRNSPAVLGWPKVPSDWVRPGILLYGATPFERAHPLADRLRPVM
+>d1rdqe_ d.144.1.7 (E:) cAMP-dependent PK, catalytic subunit {Mouse (Mus musculus) [TaxId: 10090]}
+GNAAAAKKGSEQESVKEFLAKAKEDFLKKWETPSQNTAQLDQFDRIKTLGTGSFGRVMLVKHKESGNHYAMKILDKQKVVKLKQIEHTLNEKRILQAVNFPFLVKLEFSFKDNSNLYMVMEYVAGGEMFSHLRRIGRFSEPHARFYAAQIVLTFEYLHSLDLIYRDLKPENLLIDQQGYIQVTDFGFAKRVKGRTWTLCGTPEALAPEIILSKGYNKAVDWWALGVLIYEMAAGYPPFFADQPIQIYEKIVSGKVRFPSHFSSDLKDLLRNLLQVDLTKRFGNLKNGVNDIKNHKWFATTDWIAIYQRKVEAPFIPKFKGPGDTSNFDDYEEEEIRVSINEKCGKEFTEF
+>d1regx_ d.58.27.1 (X:) Translational regulator protein regA {Bacteriophage T4 [TaxId: 10665]}
+MIEITLKKPEDFLKVKETLTRMGIANNKDKVLYQSCHILQKKGLYYIVHFKEMLRMDGRQVEMTEEDEVRRDSIAWLLEDWGLIEIVPGQRTFMKDLTNNFRVISFKQKHEWKLVPKYTIGN
+>d1rfya_ a.2.13.1 (A:) Transcriptional repressor TraM {Agrobacterium tumefaciens [TaxId: 358]}
+KKVELRPLIGLTRGLPPTDLETITIDAIRTHRRLVEKADELFQALPETYKTGQACGGPQHIRYIEASIEMHAQMSALNTLISILGFIPK
+>d1rg8a_ b.42.1.1 (A:) Acidic FGF (FGF1) {Human (Homo sapiens) [TaxId: 9606]}
+HHHHFNLPPGNYKKPKLLYCSNGGHFLRILPDGTVDGTRDRSDQHIQLQLSAESVGEVYIKSTETGQYLAMDTDGLLYGSQTPNEECLFLERLEENHYNTYISKKHAEKNWFVGLKKNGSCKRGPRTHYGQKAILFLPLPV
+>d1rgxa_ g.77.1.1 (A:) Resistin (ADSF, FIZZ3) {Mouse (Mus musculus) [TaxId: 10090]}
+CPIDEAIDKKIKQDFNSLFPNAIKNIGLNCWTVSSRGKLASCPEGTAVLSCSCGSACGSWDIREEKVCHCQCARIDWTAARCCKLQVAS
+>d1rh1a1 b.110.1.1 (A:10-312) Colicin B N-terminal domain {Escherichia coli [TaxId: 562]}
+TEGIDYGDTMVVWPSTGRIPGGDVKPGGSSGLAPSMPPGWGDYSPQGIALVQSVLFPGIIRRIILDKELEEGDWSGWSVSVHSPWGNEKVSAARTVLENGLRGGLPEPSRPAAVSFARLEPASGNEQKIIRLMVTQQLEQVTDIPASQLPAAGNNVPVKYRLTDLMQNGTQYMAIIGGIPMTVPVVDAVPVPDRSRPGTNIKDVYSAPVSPNLPDLVLSVGQMNTPVRSNPEIQEDGVISETGNYVEAGYTMSSNNHDVIVRFPEGSGVSPLYISAVEILDSNSLSQRQEAENNAKDDFRVKK
+>d1ri6a_ b.69.11.1 (A:) Putative isomerase YbhE {Escherichia coli [TaxId: 562]}
+SLKQTVYIASPESQQIHVWNLNHEGALTLTQVVDVPGQVQPMVVSPDKRYLYVGVRPEFRVLAYRIAPDDGALTFAAESALPGSLTHISTDHQGQFVFVGSYNAGNVSVTRLEDGLPVGVVDVVEGLDGCHSANISPDNRTLWVPALKQDRICLFTVSDDGHLVAQDPAEVTTVEGAGPRHMVFHPNEQYAYCVNELNSSVDVWELKDPHGNIECVQTLDMMPENFSDTRWAADIHITPDGRHLYACDRTASLITVFSVSEDGSVLSKEGFQPTETQPRGFNVDHSGKYLIAAGQKSHHISVYEIVGEQGLLHEKGRYAVGQGPMWVVVNAHE
+>d1rjuv_ g.46.1.1 (V:) Metallothionein {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+HECQCQCGSCKNNEQCQKSCSCPTGCNSDDKCPCGN
+>d1rk8c_ b.72.3.1 (C:) Pym (Within the bgcn gene intron protein, WIBG), N-terminal domain {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+TYLQSSEGKFIPATKRPDGTWRKARRVKDGYVP
+>d1rkia1 d.308.1.2 (A:1-98) Hypothetical protein PAE0736 {Pyrobaculum aerophilum [TaxId: 13773]}
+MKKHIIIKTIPKKEEIISRDLCDCIYYYDNSVICKPIGPSKVYVSTSLENLEKCLQLHYFKKLVKNIEIFDEVHNSKPNCDKCLIVEIGGVYFVRRVN
+>d1rl6a1 d.141.1.1 (A:7-81) Ribosomal protein L6 {Bacillus stearothermophilus [TaxId: 1422]}
+PIEIPAGVTVTVNGNTVTVKGPKGELTRTFHPDMTITVEGNVITVTRPSDEKHHRALHGTTRSLLANMVEGVSKG
+>d1rlra1 a.98.1.1 (A:10-221) R1 subunit of ribonucleotide reductase, N-terminal domain {Escherichia coli [TaxId: 562]}
+RDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQ
+>d1ro2a_ d.264.1.2 (A:) Bifunctional DNA primase/polymerase N-terminal domain {Sulfolobus islandicus [TaxId: 43080]}
+SSERIRYAKWMLEHGFNIIPIDPESKKPVLKEWQKYSHEMPSDEEKQRFLKMIEEGYNYAIPGGQKGMVIMDFESKEKLKAWIGESALEELCRKTLCTNTVHGGIHIYVLSNDIPPHKINPLFEENGKGIIDLQSYNSYVLGLGSCVNHLHCTTDKCPWKEQNYTTCYTLYNELKEISKVDLKSLLRFLAEKGKRLGITLSKTAKEWLEG
+>d1roca_ b.1.22.1 (A:) Anti-silencing protein 1, ASF1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+GASIVSLLGIKVLNNPAKFTDPYEFEITFECLESLKHDLEWKLTYVGSSRSLDHDQELDSILVGPVPVGVNKFVFSADPPSAELIPASELVSVTVILLSCSYDGREFVRVGYYVNNEYDEEELRENPPAKVQVDHIVRNILAEKPRVTRFNIVWD
+>d1rp3b_ a.137.11.1 (B:) Anti-sigma factor FlgM {Aquifex aeolicus [TaxId: 63363]}
+VNRIELSRLIGLLLETEKRKNTEQKESGTNKIEDKVTLSKIAQELSKNDVEEKDLEKKVKELKEKIEKGEYEVSDEKVVKGLIEFFT
+>d1rqpa1 b.141.1.1 (A:193-298) 5'-fluoro-5'-deoxyadenosine synthase {Streptomyces cattleya [TaxId: 29303]}
+PAVEQDGEALVGVVSAIDHPFGNVWTNIHRTDLEKAGIGYGARLRLTLDGVLPFEAPLTPTFADAGEIGNIAIYLNSRGYLSIARNAASLAYPYHLKEGMSARVEA
+>d1rqpa2 c.132.1.1 (A:8-192) 5'-fluoro-5'-deoxyadenosine synthase {Streptomyces cattleya [TaxId: 29303]}
+RPIIAFMSDLGTTDDSVAQCKGLMYSICPDVTVVDVCHSMTPWDVEEGARYIVDLPRFFPEGTVFATTTYPATGTTTRSVAVRIKQAAKGGARGQWAGSGAGFERAEGSYIYIAPNNGLLTTVLEEHGYLEAYEVTSPKVIPEQPEPTFYSREMVAIPSAHLAAGFPLSEVGRPLEDHEIVRFNR
+>d1rssa_ a.75.1.1 (A:) Ribosomal protein S7 {Thermus thermophilus [TaxId: 274]}
+LQPDLVYGDVLVTAFINKIMRDGKKNLAARIFYDACKIIQEKTGQEPLKVFKQAVENVKPRMEVRSRRVGGANYQVPMEVSPRRQQSLALRWLVQAANQRPERRAAVRIAHELMDAAEGKGGAVKKKEDVERMAEANRAYAHYRW
+>d1rtqa_ c.56.5.4 (A:) Aminopeptidase {Aeromonas proteolytica [TaxId: 671]}
+MPPITQQATVTAWLPQVDASQITGTISSLESFTNRFYTTTSGAQASDWIASEWQALSASLPNASVKQVSHSGYNQKSVVMTITGSEAPDEWIVIGGHLDSTIGSHTNEQSVAPGADDDASGIAAVTEVIRVLSENNFQPKRSIAFMAYAAEEVGLRGSQDLANQYKSEGKNVVSALQLDMTNYKGSAQDVVFITDYTDSNFTQYLTQLMDEYLPSLTYGFDTCGYACSDHASWHNAGYPAAMPFESKFNDYNPRIHTTQDTLANSDPTGSHAKKFTQLGLAYAIEMGSATG
+>d1rwha1 a.102.3.2 (A:4-372) Chondroitinase AC {Arthrobacter aurescens [TaxId: 43663]}
+PGAAEFAALRNRWVDQITGRNVIQAGDPDFAKAITALNNKAADSLAKLDAAAGRTSVFTDLSLAKDAEMVTTYTRLSQLATAWATPTAAVFGDAAVLAAIKAGLADANTLCYNDRKEEVGNWWSWEIGVPRALADAMVLLHAELSAAERTAYCAAIDHFVPDPWLQFPPKRGKITSVGANRVDLCQGIIIRSLAGEDPTKLNHAVAGLSQVWQYVTSGDGIFRDGSFIQHSTTPYTGSYGVVLLTGLSKLFSLLGGTAFEVSDPTRSIFFDAVEGSFAPVMINGAMADAVRGRSISREANTGYDLGASAIEAILLLARAMDPATAARWRGLCAGWIARDTYRPILNSASVPRTALVKQLEATGVAPVAE
+>d1rwha2 b.24.1.1 (A:645-757) Chondroitinase AC {Arthrobacter aurescens [TaxId: 43663]}
+KYSVIRNDATAQSVEFKTAKTTAATFWKPGMAGDLGASGPACVVFSRHGNELSLAVSEPTQKAAGLTLTLPEGTWSSVLEGAGTLGTDADGRSTLTLDTTGLSGKTKLIKLKR
+>d1rwia_ b.68.9.1 (A:) Serine/threonine-protein kinase PknD {Mycobacterium tuberculosis [TaxId: 1773]}
+GQTVLPFTGIDFRLSPSGVAVDSAGNVYVTSEGMYGRVVKLATGSTGTTVLPFNGLYQPQGLAVDGAGTVYVTDFNNRVVTLAAGSNNQTVLPFDGLNYPEGLAVDTQGAVYVADRGNNRVVKLAAGSKTQTVLPFTGLNDPDGVAVDNSGNVYVTDTDNNRVVKLEAESNNQVVLPFTDITAPWGIAVDEAGTVYVTEHNTNQVVKLLAGSTTSTVLPFTGLNTPLAVAVDSDRTVYVADRGNDRVVKLTSLEHHHHHH
+>d1rxwa1 a.60.7.1 (A:220-324) Flap endonuclease-1 (Fen-1 nuclease) {Archaeoglobus fulgidus [TaxId: 2234]}
+LTREQLIDIAILVGTDYNEGVKGVGVKKALNYIKTYGDIFRALKALKVNIDHVEEIRNFFLNPPVTDDYRIEFREPDFEKAIEFLCEEHDFSRERVEKALEKLKA
+>d1ryla_ d.276.1.1 (A:) Hypothetical protein yfbM {Escherichia coli [TaxId: 562]}
+MIGYFAEIDSEKINQLLESTEKPLMDNIHDTLSGLRRLDIDKRWDFLHFGLTGTSAFDPAKNDPLSRAVLGEHSLEDGIDGFLGLTWNQELAATIDRLESLDRNELRKQFSIKRLNEMEIYPGVTFSEELEGQLFASIMLDMEKLISAYRRMLRQGNHALTVIV
+>d1ryqa_ g.41.9.3 (A:) putative DNA-directed RNA polymerase subunit E'' (RpoE2) {Pyrococcus furiosus [TaxId: 2261]}
+HHHHHGSSEKACRHCHYITSEDRCPVCGSRDLSEEWFDLVIIVDVENSEIAKKIGAKVPGKYAIRVR
+>d1rzhh1 b.41.1.1 (H:36-248) Photosynthetic reaction centre {Rhodobacter sphaeroides [TaxId: 1063]}
+MREGYPLENEDGTPAANQGPFPLPKPKTFILPHGRGTLTVPGPESEDRPIALARTAVSEGFPHAPTGDPMKDGVGPASWVARRDLPELDGHGHNKIKPMKAAAGFHVSAGKNPIGLPVRGCDLEIAGKVVDIWVDIPEQMARFLEVELKDGSTRLLPMQMVKVQSNRVHVNALSSDLFAGIPTIKSPTEVTLLEEDKICGYVAGGLMYAAPKR
+>d1s0pa_ a.192.1.1 (A:) N-terminal domain of adenylylcyclase associated protein, CAP {Slime mold (Dictyostelium discoideum) [TaxId: 44689]}
+SVKEFQNLVDQHITPFVALSKKLAPEVGNQVEQLVKAIDAEKALINTASQSKKPSQETLLELIKPLNNFAAEVGKIRDSNRSSKFFNNLSAISESIGFLSWVVVEPTPGPHVAEMRGSAEFYTNRILKEFKGVNQDQVDWVSNYVNFLKDLEKYIKQYHTTGLTWNPKGGDAKSAT
+>d1s1da_ b.67.3.1 (A:) Soluble calcium-activated nucleotidase SCAN-1 {Human (Homo sapiens) [TaxId: 9606]}
+NWYNDTYPLSPPQRTPAGIRYRIAVIADLDTESRAQEENTWFSYLKKGYLTLSDSGDKVAVEWDKDHGVLESHLAEKGRGMELSDLIVFNGKLYSVDDRTGVVYQIEGSKAVPWVILSDGDGTVEKGFKAEWLAVKDERLYVGGLGKEWTTTTGDVVNENPEWVKVVGYKGSVDHENWVSNYNALRAAAGIQPPGYLIHESACWSDTLQRWFFLPRRASQERYSEKDDERKGANLLLSASPDFGDIAVSHVGAVVPTHGFSSFKFIPNTDDQIIVALKSEEDSGRVASYIMAFTLDGRFLLPETKIGSVKYEGIEFI
+>d1s2xa_ a.47.3.1 (A:) Cag-Z {Helicobacter pylori [TaxId: 210]}
+VDELGFNEAERQKILDSNSSLMRNANEVRDKFIQNYATSLKDSNDPQDFLRRVQELRINMQKNFISFDAYYNYLNNLVLASYNRCKQEKTFAESTIKNELTLGEFVAEISDNFNNFTCDEVARISDLVASYLPREYLPPFIDGNMMGVAFQILGIDDFGKKLNEIVQDIGTKYIILSKNK
+>d1s7ma_ b.144.1.1 (A:) Autotransporter Hia {Haemophilus influenzae [TaxId: 727]}
+GAKTEINKDGLTITPANGAGANNANTISVTKDGISAGGQSVKNVVSGLKKFGDANFDPLTSSADNLTKQNDDAYKGLTNLDEKGTDKQTPVVADNTAATVGDLRGLGWVISADKTTGGSTEYHDQVRNANEVKFKSGNGINVSGKTVNGRREITFELA
+>d1s7za_ a.159.3.1 (A:) B-form DNA mimic Ocr {Bacteriophage T7 [TaxId: 10760]}
+MTYNNVFDHAYEMLKENIRYDDIRDTDDLHDAIHMAADNAVPHYYADIFSVMASEGIDLEFEDSGLMPDTKDVIRILQARIYEQLTIDLWEDAEDLLNEYLEEVEE
+>d1s98a_ b.124.1.1 (A:) Fe-S scaffold protein IscA (YfhF) {Escherichia coli [TaxId: 562]}
+SITLSDSAAARVNTFLANRGKGFGLRLGVRTSGCSGMAYVLEFVDEPTPEDIVFEDKGVKVVVDGKSMQFLDGTQLDFVKEGLNEGFKFTNPNVKDE
+>d1s99a_ d.58.48.2 (A:) Putative thiamin/HMP-binding protein YkoF {Bacillus subtilis [TaxId: 1423]}
+RIAGFRFSLYPMTDDFISVIKSALAATDTSKVWTKTDHISTVLRGSIDHVFDAAKAIYLHAANSEQHIVMNGTFSIGCPGDTQGDTYLSKGDKRVNEDAVRGLKAEAPCQFALYPMNEPDYMGLIMEAVDIAKAQGTFVQGVHYASELDGDAHDVFSTLEAVFRMAEQQTNHITMTVNLSANSPSRKNR
+>d1saua_ d.203.1.1 (A:) DsrC, the gamma subunit of dissimilatory sulfite reductase {Archaeoglobus fulgidus [TaxId: 224325]}
+PELEVKGKKLRLDEDGFLQDWEEWDEEVAEALAKDTRFSPQPIELTEEHWKIIRYLRDYFIKYGVAPPVRMLVKHCKKEVRPDCNLQYIYKLFPQGPAKDACRIAGLPKPTGCV
+>d1sbxa_ a.6.1.4 (A:) Ski oncogene {Human (Homo sapiens) [TaxId: 9606]}
+GSHMFMPSDRSTERCETVLEGETISCFVVGGEKRLCLPQILNSVLRDFSLQQINAVCDELHIYCSRCTADQLEILKVMGILPFSAPSCGLITKTDAERLCNALLYG
+>d1sdia_ a.198.1.1 (A:) Hypothetical protein YcfC {Escherichia coli [TaxId: 562]}
+GAKNYYDITLALAGICQSARLVQQLAHQGHCDADALHVSLNSIIDMNPSSTLAVFGGSEANLRVGLETLLGVLNASSRQGLNAELTRYTLSLMVLERKLSSAKGALDTLGNRINGLQRQLEHFDLQSETLMSAMAAIYVDVISPLGPRIQVTGSPAVLQSPQVQAKVRATLLAGIRAAVLWHQVGGGRLQLMFSRNRLTTQAKQILAHLTPEL
+>d1seda_ a.219.1.1 (A:) Hypothetical protein YhaI {Bacillus subtilis [TaxId: 1423]}
+DSMDHRIERLEYYIQLLVKTVDMDRYPFYALLIDKGLSKEEGEAVMRICDELSEELATQKAQGFVTFDKLLALFAGQLNEKLDVHETIFALYEQGLYQELMEVFIDIMKHFD
+>d1seia_ d.140.1.1 (A:) Ribosomal protein S8 {Bacillus stearothermophilus [TaxId: 1422]}
+VMTDPIADMLTAIRNANMVRHEKLEVPASKIKREIAEILKREGFIRDYEYIEDNKQGILRIFLKYGPNERVITGLKRISKPGLRVYVKAHEVPRVLNGLGIAILSTSQGVLTDKEARQKGTGGEIIAYVI
+>d1sf9a_ b.34.15.1 (A:) Hypothetical protein YfhH {Bacillus subtilis [TaxId: 1423]}
+VDLGTENLYFQSNAMEKRYSQMTPHELNTEIALLSEKARKAEQHGIINELAVLERKITMAKAYLLNPEDYSPGETYRVENTEDEFTISYLNGVFAWGYRTSSPQQEEALPISVLQEKE
+>d1sg4a1 c.14.1.3 (A:2-250) Dienoyl-CoA isomerase (delta3-delta2-enoyl-CoA isomerase) {Human (Homo sapiens), mitochondrial [TaxId: 9606]}
+SQRVLVEPDAGAGVAVMKFKNPPVNSLSLEFLTELVISLEKLENDKSFRGVILTSDRPGVFSAGLDLTEMCGRSPAHYAGYWKAVQELWLRLYQSNLVLVSAINGACPAGGCLVALTCDYRILADNPRYCIGLNETQLGIIAPFWLKDTLENTIGHRAAERALQLGLLFPPAEALQVGIVDQVVPEEQVQSTALSAIAQWMAIPDHARQLTKAMMRKATASRLVTQRDADVQNFVSFISKDSIQKSLQM
+>d1sj7a1 a.215.1.1 (A:488-654) A middle domain of Talin 1 {Mouse (Mus musculus) [TaxId: 10090]}
+LTSAQQALTGTINSSMQAVQAAQATLDDFETLPPLGQDAASKAWRKNKMDESKHEIHSQVDAITAGTASVVNLTAGDPAETDYTAVGCAVTTISSNLTEMSRGVKLLAALLEDEGGNGRPLLQAAKGLAGAVSELLRSAQPASAEPRQNLLQAAGNVGQASGELLQQ
+>d1sknp_ a.37.1.1 (P:) Skn-1 {Nematode (Caenorhabditis elegans) [TaxId: 6239]}
+GRQSKDEQLASDNELPVSAFQISEMSLSELQQVLKNESLSEYQRQLIRKIRRRGKNKVAARTCRQRRTDRHDKM
+>d1slua_ b.16.1.1 (A:) Ecotin, trypsin inhibitor {Escherichia coli [TaxId: 562]}
+IAPYPQAEKGMKRQVIQLTPQEDESTLKVELLIGQTLEVDCNLHRLGGKLENKTLEGWGYDYYVFDKVSSPVSTMMHCPDGKKEKKFVTAYLGDAGMLRYNSKLPIVVYTPDNVDVKYRVWKAEEKIDNAVVR
+>d1smba_ d.111.1.1 (A:) Golgi-associated PR-1 protein {Human (Homo sapiens) [TaxId: 9606]}
+SASKQFHNEVLKAHNEYRQKHGVPPLKLCKNLNREAQQYSEALASTRILKHSPESSRGQCGENLAWASYDQTGKEVADRWYSEIKNYNFQQPGFTSGTGHFTAMVWKNTKKMGVGKASASDGSSFVVARYFPAGNVVNEGFFEENVLPP
+>d1sr8a_ e.54.1.1 (A:) Cobalamin biosynthesis protein CbiD {Archaeoglobus fulgidus [TaxId: 2234]}
+MLIDPIELYRYPEKWIKDRDAEKKVRSGLYILTEDGYLRRGITTGTTASAAAVAAIASLKEKVEKVKVSTPAGVDVEVEVEAEKGFARVRKFSGDHEFDVTNGIIFEAEVCETSGIFFGRGVGVKAGEKAVSRSAKLQILENFIKASREFNFSGGVRISVPDGEEVAKKTGNEKVGIKGGISILGTTGFVEPWCKKLVETKLKIAMQYHRIAITTGRKAWLYARKKFPEYQPFVFGVHIDEALKHPGEKIIVGFPGLLKIWAGSRDRIEERAREEGVRVVVI
+>d1sr9a3 d.270.1.1 (A:492-643) 2-isopropylmalate synthase LeuA, allosteric (dimerisation) domain {Mycobacterium tuberculosis [TaxId: 1773]}
+VRPLERIRQHVDAADDDGGTTSITATVKINGVETEISGSGNGPLAAFVHALADVGFDVAVLDYYEHAMSAGDDAQAAAYVEASVTIASPAQPGEAGRHASDPVTIASPAQPGEAGRHASDPVTSKTVWGVGIAPSITTASLRAVVSAVNRAA
+>d1su8a_ e.26.1.2 (A:) Ni-containing carbon monoxide dehydrogenase {Carboxydothermus hydrogenoformans [TaxId: 129958]}
+QNLKSTDRAVQQMLDKAKREGIQTVWDRYEAMKPQCGFGETGLCCRHCLQGPCRINPFGDEPKVGICGATAEVIVARGLDRSIAAGAAGHSGHAKHLAHTLKKAVQGKAASYMIKDRTKLHSIAKRLGIPTEGQKDEDIALEVAKAALADFHEKDTPVLWVTTVLPPSRVKVLSAHGLIPAGIDHEIAEIMHRTSMGCDADAQNLLLGGLRCSLADLAGCYMGTDLADILFGTPAPVVTESNLGVLKADAVNVAVHGHNPVLSDIIVSVSKEMENEARAAGATGINVVGICCTGNEVLMRHGIPACTHSVSQEMAMITGALDAMILDYQCIQPSVATIAECTGTTVITTMEMSKITGATHVNFAEEAAVENAKQILRLAIDTFKRRKGKPVEIPNIKTKVVAGFSTEAIINALSKLNANDPLKPLIDNVVNGNIRGVCLFAGCNNVKVPQDQNFTTIARKLLKQNVLVVATGCGAGALMRHGFMDPANVDELCGDGLKAVLTAIGEANGLGGPLPPVLHMGSCVDNSRAVALVAALANRLGVDLDRLPVVASAAEAMHEKAVAIGTWAVTIGLPTHIGVLPPITGSLPVTQILTSSVKDITGGYFIVELDPETAADKLLAAINERRAGLGLPW
+>d1svba2 f.10.1.1 (A:1-302) Envelope glycoprotein {Tick-borne encephalitis virus [TaxId: 11084]}
+SRCTHLENRDFVTGTQGTTRVTLVLELGGCVTITAEGKPSMDVWLDAIYQENPAKTREYCLHAKLSDTKVAARCPTMGPATLAEEHQGGTVCKRDQSDRGWGNHCGLFGKGSIVACVKAACEAKKKATGHVYDANKIVYTVKVEPHTGDYVAANETHSGRKTASFTISSEKTILTMGEYGDVSLLCRVASGVDLAQTVILELDKTVEHLPTAWQVHRDWFNDLALPWKHEGAQNWNNAERLVEFGAPHAVKMDVYNLGDQTGVLLKALAGVPVAHIEGTKYHLKSGHVTCEVGLEKLKMKGL
+>d1syxb1 d.76.1.1 (B:25-86) GYF domain from cd2bp2 protein {Human (Homo sapiens) [TaxId: 9606]}
+DVMWEYKWENTGDAELYGPFTSAQMQTWVSEGYFPDGVYCRKLDPPGGQFYNSKRIDFDLYT
+>d1sz7a_ d.278.1.2 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+KMSSELFTLTYGALVTQLCKDYENDEDVNKQLDKMGFNIGVRLIEDFLARSNVGRCHDFRETADVIAKVAFKMYLGITPSITNWSPAGDEFSLILENNPLVDFVELPDNHSSLIYSNLLCGVLRGALEMVQMAVEAKFVQDTLKGDGVTEIRMRFIRRI
+>d1szha_ a.226.1.1 (A:) Her-1 {Nematode (Caenorhabditis elegans) [TaxId: 6239]}
+STLTKELIKDAAEKCCTRNRQECCIEIMKFGTPIRCGYDRDPKLPGYVYKCLQNVLFAKEPKKKINLDDSVCCSVFGNDQEDSGRRCENRCKNLMTSPSIDAATRLDSIKSCSLLDNVLYKCFEKCRSLRKDGIKIEVLQFEEYCEA
+>d1t07a_ d.279.1.1 (A:) Hypothetical protein PA5148 {Pseudomonas aeruginosa [TaxId: 287]}
+GHMSRTVMCRKYHEELPGLDRPPYPGAKGEDIYNNVSRKAWDEWQKHQTMLINERRLNMMNAEDRKFLQQEMDKFLSGEDY
+>d1t0aa_ d.79.5.1 (A:) 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase IspF {Shewanella oneidensis [TaxId: 70863]}
+KIRIGHGFDVHKFGEPRPLILCGVEVPYETGLVAHSDGDVVLHAISDAILGAMALGDIGKHFPDTDAAYKGADSRVLLRHCYALAKAKGFELGNLDVTIIAQAPKMAPHIEDMRQVLAADLNADVADINVKATTTEKLGFTGRKEGIAVEAVVLLSRQ
+>d1t11a1 a.223.1.1 (A:248-376) Trigger factor, C-terminal domain {Vibrio cholerae [TaxId: 666]}
+LNDEFVARFGVAEGGVDALKAEVRKNMERELKQAIKARIKEQAIEGLVKENEIQVPSALIDQEINVLRQQAAQRFGGNVEAAAQLPRELFEEQAKRRVVVGLLLGEVIRTHELKADEEKVKALITEMAT
+>d1t1ea2 d.58.3.2 (A:12-190) Pro-kumamolisin activation domain {Bacillus sp. MN-32 [TaxId: 198803]}
+EKREVLAGHARRQAPQAVDKGPVTGDQRISVTVVLRRQRGDELEAHVERQAALAPHARVHLEREAFAASHGASLDDFAEIRKFAEAHGLTLDRAHVAAGTAVLSGPVDAVNQAFGVELRHFDHPDGSYRSYVGDVRVPASIAPLIEAVLGLDTRPVARPHFRLRRRAEGEFEARSQSAA
+>d1t1ua1 c.43.1.3 (A:20-401) Choline O-acetyltransferase {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ELDLPKLPVPPLQQTLATYLQCMQHLVPEEQFRKSQAIVKRFGAPGGLGETLQEKLLERQEKTANWVSEYWLNDMYLNNRLALPVNSSPAVIFARQHFQDTNDQLRFAACLISGVLSYKTLLDSHSLPTDWAKGQLSGQPLCMKQYYRLFSSYRLPGHTQDTLVAQKSSIMPEPEHVIVACCNQFFVLDVVINFRRLSEGDLFTQLRKIVKMASNEDERLPPIGLLTSDGRSEWAKARTVLLKDSTNRDSLDMIERCICLVCLDGPGTGELSDTHRALQLLHGGGCSLNGANRWYDKSLQFVVGRDGTCGVVCEHSPFDGIVLVQCTEHLLKHMMTSNKKLVRADSVSELPAPRRLRWKCSPETQGHLASSAEKLQRIVKNL
+>d1t2da2 d.162.1.1 (A:151-315) Lactate dehydrogenase {Malaria parasite (Plasmodium falciparum) [TaxId: 5833]}
+GVLDTSRLKYYISQKLNVCPRDVNAHIVGAHGNKMVLLKRYITVGGIPLQEFINNKLISDAELEAIFDRTVNTALEIVNLHASPYVAPAAAIIEMAESYLKDLKKVLICSTLLEGQYGHSDIFGGTPVVLGANGVEQVIELQLNSEEKAKFDEAIAETKRMKALA
+>d1t3ta1 a.5.10.1 (A:153-220) FGAM synthase PurL, linker domain {Salmonella typhimurium [TaxId: 90371]}
+HQPAPVSSVDLLGEGRQALIDANLRLGLALAEDEIDYLQEAFTKLGRNPNDIELYMFAQANSEHCRHK
+>d1t3ua_ d.244.1.1 (A:) ZapA homologue PA5227 {Pseudomonas aeruginosa [TaxId: 287]}
+TLTVQILDKEYCINCPDDERANLESAARYLDGKMREIRSSGKVIGADRVAVMAALNITHDLLHRKERLDQESSSTRERVRELLDRVDRALAN
+>d1t3ya_ d.109.1.2 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+ATKIDKEACRAAYNLVRDDGSAVIWVTFKYDGSTIVPGEQGAEYQHFIQQCTDDVRLFAFVRFTTGDAMSKRSKFALITWIGENVSGLQRAKTGTDKTLVKEVVQNFAKEFVISDRKELEEDFIKSELKKA
+>d1t6aa_ d.129.8.1 (A:) Rbstp2229 protein {Bacillus stearothermophilus [TaxId: 1422]}
+AMNTDLKLPAGKTMTIEDVKQLLERYQMALKKTGEQLGWAYEQAAFPYTVRIHESVLYLQGDGRLYKGMAISVRTAGEETFIDIALPPGATHGDKGKANEFSKWLAKTLGGELHLFSGRTMVFG
+>d1t6ua_ a.24.22.1 (A:) Nickel-containing superoxide dismutase, NiSOD {Streptomyces coelicolor [TaxId: 1902]}
+HCDLPCGVYDPAQARIEAESVKAVQEKMAGNDDPHFQTRATVIKEQRAELAKHHVSVLWSDYFKPPHFEKYPELHQLVNDTLKAMSAAKGSKDPATGQKALDYIAQIDKIFWETKKA
+>d1t77a1 a.169.1.1 (A:2186-2489) Lipopolysaccharide-responsive and beige-like anchor protein LRBA {Human (Homo sapiens) [TaxId: 9606]}
+GTSFGLPQTRRISLASPRQLFKASNMTQRWQHREISNFEYLMFLNTIAGRSYNDLNQYPVFPWVITNYESEELDLTLPTNFRDLSKPIGALNPKRAAFFAERYESWEDDQVPKFHYGTHYSTASFVLAWLLRIEPFTTYFLNLQGGKFDHADRTFSSISRAWRNSQRDTSDIKELIPEFYYLPEMFVNFNNYNLGVMDDGTVVSDVELPPWAKTSEEFVHINRLALESEFVSCQLHQWIDLIFGYKQQGPEAVRALNVFYYLTYEGAVNLNSITDPVLREAVEAQIRSFGQTPSQLLIEPHPPR
+>d1t8ka_ a.28.1.1 (A:) Acyl carrier protein {Escherichia coli [TaxId: 562]}
+STIEERVKKIIGEQLGVKQEEVTNNASFVEDLGADSLDTVELVMALEEEFDTEIPDEEAEKITTVQAAIDYINGHQA
+>d1t95a1 a.5.8.1 (A:87-161) Hypothetical protein AF0491, middle domain {Archaeoglobus fulgidus [TaxId: 2234]}
+LEGEVQITAEQRREMLEAKRKQIINFISRNTIDPRTNAPHPPSRIERALEEAKVHIDIFKSVEAQVKDIVKALKP
+>d1t95a2 d.235.1.2 (A:11-86) Hypothetical protein AF0491, N-terminal domain {Archaeoglobus fulgidus [TaxId: 2234]}
+DKAVIARLRKGGEEFEVLVDPYLARDLKEGKEVNFEDLLAAEEVFKDAKKGERASVDELRKIFGTDDVFEIARKII
+>d1t9ia_ d.95.2.1 (A:) DNA endonuclease I-CreI {Green alga (Chlamydomonas reinhardtii) [TaxId: 3055]}
+NTKYNKEFLLYLAGFVDGNGSIIAQIKPNQSYKFKHQLSLTFQVTQKTQRRWFLDKLVDEIGVGYVRDRGSVSDYILSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLDS
+>d1tbfa_ a.211.1.2 (A:) cGMP-specific 3',5'-cyclic phosphodiesterase pde5a1-Ibmx {Human (Homo sapiens) [TaxId: 9606]}
+EEETRELQSLAAAVVPSAQTLKITDFSFSDFELSDLETALCTIRMFTDLNLVQNFQMKHEVLCRWILSVKKNYRKNVAYHNWRHAFNTAQCMFAALKAGKIQNKLTDLEILALLIAALSHDLDHPGVSNQFLINTNSELALMYNDESVLEHHHFDQCLMILNSPGNQILSGLSIEEYKTTLKIIKQAILATDLALYIKRRGEFFELIRKNQFNLEDPHQKELFLAMLMTACDLSAITKPWPIQQRIAELVATEFFDQGDRERKELNIEPTDLMNREKKNKIPSMQVGFIDAICLQLYEALTHVSEDCFPLLDGCRKNRQKWQALAE
+>d1tbge_ a.137.3.1 (E:) Transducin (heterotrimeric G protein), gamma chain {Cow (Bos taurus) [TaxId: 9913]}
+APVINIEDLTEKDKLKMEVDQLKKEVTLERMLVSKCCEEFRDYVEERSGEDPLVKGIPEDKNPFKELK
+>d1td6a_ a.234.1.1 (A:) Hypothetical protein MPN330 {Mycoplasma pneumoniae [TaxId: 2104]}
+PNQFVNHLSALKKHFASYKELREAFNDYHKHNGDELTTFFLHQFDKVMELVKQKDFKTAQSRCEEELAAPYLPKPLVSFFQSLLQLVNHDLLEQQNAALASLPAAKIIELVLQDYPNKLNMIHYLLPKTKAFVKPHLLQRLQFVLTDSELLELKRFSFFQALNQIPGFQGEQVEYFNSKLKQKFTLTLGEFEIAQQPDAKAYFEQLITQIQQLFLKEPVNAEFANEIIDAFLVSYFPLHPPVPLAQLAAKIYEYVSQIVLNEAVNLKDELIKLIVHTLYEQLDRPV
+>d1tf5a1 a.162.1.1 (A:227-348) Pre-protein crosslinking domain of SecA {Bacillus subtilis [TaxId: 1423]}
+AAKSTKLYVQANAFVRTLKAEKDYTYDIKTKAVQLTEEGMTKAEKAFGIDNLFDVKHVALNHHINQALKAHVAMQKDVDYVVEDGQVVIVDSFTGRLMKGRRYSEGLHQAIEAKEGLEIQNE
+>d1tf5a2 a.172.1.1 (A:571-780) Helical scaffold and wing domains of SecA {Bacillus subtilis [TaxId: 1423]}
+SKMVSRAVESSQKRVEGNNFDSRKQLLQYDDVLRQQREVIYKQRFEVIDSENLREIVENMIKSSLERAIAAYTPREELPEEWKLDGLVDLINTTYLDEGALEKSDIFGKEPDEMLELIMDRIITKYNEKEEQFGKEQMREFEKVIVLRAVDSKWMDHIDAMDQLRQGIHLRAYAQTNPLREYQMEGFAMFEHMIESIEDEVAKFVMKAEI
+>d1tfea_ d.43.1.1 (A:) Elongation factor Ts (EF-Ts), dimerisation domain {Thermus thermophilus [TaxId: 274]}
+AREGIIGHYIHHNQRVGVLVELNCETDFVARNELFQNLAKDLAMHIAMMNPRYVSAEEIPAEELEKERQIYIQAALNEGKPQQIAEKIAEGRLKKYLEEVVLLEQPFVKDDKVKVKELIQQAIAKIGENIVVRRFCRFELGA
+>d1tg7a1 b.149.1.1 (A:570-666) Beta-galactosidase LacA, domain 3 {Penicillium sp. [TaxId: 5081]}
+RNSAYNYWVPQVPTKGTAPGYSNQETTASSIIVKAGYLVRSAYLDGNDLHIQADFNATTPIEVVGAPSGAKNLVINGKKTQTKVDKNGIWSASVAYT
+>d1ti6b1 b.3.5.1 (B:196-274) Transhydroxylase beta subunit, BthL, C-terminal domain {Pelobacter acidigallici [TaxId: 35816]}
+KNYVTAGILVQGDCFEGAKVVLKSGGKEVASAETNFFGEFKFDALDNGEYTVEIDADGKSYSDTVVIDDKSVDLGFIKL
+>d1tifa_ d.15.8.1 (A:) Translation initiation factor IF3, N-terminal domain {Bacillus stearothermophilus [TaxId: 1422]}
+KDFIINEQIRAREVRLIDQNGDQLGIKSKQEALEIAARRNLDLVLVAPNAKPPVCRIMDYGKFRFEQQKKEKEARK
+>d1tiga_ d.68.1.1 (A:) Translation initiation factor IF3, C-terminal domain {Bacillus stearothermophilus [TaxId: 1422]}
+INVKEVRLSPTIEEHDFNTKLRNARKFLEKGDKVKATIRFKGRAITHKEIGQRVLDRLSEACADIAVVETAPKMDGRNMFLVLAPKND
+>d1tj1a1 a.176.1.1 (A:89-261) N-terminal domain of bifunctional PutA protein {Escherichia coli [TaxId: 562]}
+SVSRAAITAAYRRPETEAVSMLLEQARLPQPVAEQAHKLAYQLADKLRNQKNASGRAGMVQGLLQEFSLSSQEGVALMCLAEALLRIPDKATRDALIRDKISNGNWQSHIGRSPSLFVNAATWGLLFTGKLVSTHNEASLSRSLNRIIGKSGEPLIRKGVDMAMRLMGEQFVT
+>d1tjla1 a.2.14.1 (A:7-110) DnaK suppressor protein DksA, alpha-hairpin domain {Escherichia coli [TaxId: 562]}
+RKTSSLSILAIAGVEPYQEKPGEEYMNEAQLAHFRRILEAWRNQLRDEVDRTVTHMQDEAANFPDPVDRAAQEEEFSLELRNRDRERKLIKKIEKTLKKVEDED
+>d1tjxa_ b.7.1.2 (A:) Synaptogamin I {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+SGGGGGILEKLGDICFSLRYVPTAGKLTVVILEAKNLKKMDVGGLSDPYVKIHLMQNGKRLKKKKTTIKKNTLNPYYNESFSFEVPFEQIQKVQVVVTVLDYDKIGKNDAIGKVFVGYNSTGAELRHWSDMLANPRRPIAQWHTLQVEEEVDAMLAV
+>d1tkea1 d.15.10.1 (A:1-62) Threonyl-tRNA synthetase (ThrRS), N-terminal 'additional' domain {Escherichia coli [TaxId: 562]}
+MPVITLPDGSQRHYDHAVSPMDVALDIGPGLAKACIAGRVNGELVDACDLIENDAQLSIITA
+>d1tkea2 d.67.1.1 (A:63-224) Threonyl-tRNA synthetase (ThrRS), second 'additional' domain {Escherichia coli [TaxId: 562]}
+KDEEGLEIIRHSCAHLLGHAIKQLWPHTKMAIGPVIDNGFYYDVDLDRTLTQEDVEALEKRMHELAEKNYDVIKKKVSWHEARETFANRGESYKVSILDENIAHDDKPGLYFHEEYVDMCRGPHVPNMRFCHHFKLMKTAGAYWRGDSNNKMLQRIYGTAWA
+>d1tl2a_ b.67.1.1 (A:) Tachylectin-2 {Japanese horseshoe crab (Tachypleus tridentatus) [TaxId: 6853]}
+GGESMLRGVYQDKFYQGTYPQNKNDNWLARATLIGKGGWSNFKFLFLSPGGELYGVLNDKIYKGTPPTHDNDNWMGRAKKIGNGGWNQFQFLFFDPNGYLYAVSKDKLYKASPPQSDTDNWIARATEVGSGGWSGFKFLFFHPNGYLYAVHGQQFYKALPPVSNQDNWLARATKIGQGGWDTFKFLFFSSVGTLFGVQGGKFYEDYPPSYAYDNWLARAKLIGNGGWDDFRFLFF
+>d1tqga_ a.24.10.3 (A:) Chemotaxis protein CheA P1 domain {Thermotoga maritima [TaxId: 2336]}
+GSHMEYLGVFVDETKEYLQNLNDTLLELEKNPEDMELINEAFRALHTLKGMAGTMGFSSMAKLCHTLENILDKARNSEIKITSDLLDKIFAGVDMITRMVDKIVS
+>d1ts9a_ b.137.1.1 (A:) Hypothetical protein AF1917 {Archaeoglobus fulgidus [TaxId: 2234]}
+LQGVELIARDWIGLMVEVVESPNHSEVGIKGEVVDETQNTLKIMTEKGLKVVAKRGRTFRVWYKGKIMRIKGDLINFRPEDRIKRGLMMLKRAKGVWI
+>d1tt8a_ d.190.1.1 (A:) Chorismate lyase {Escherichia coli [TaxId: 562]}
+SHPALTQLRALRYSKEIPALDPQLLDWLLLEDSMTKRFEQQGKTVSVTMIREGFVEQNEIPEELPLLPKESRYWLREILLSADGEPWLAGRTVVPVSTLSGPELALQKLGKTPLGRYLFTSSTLTRDFIEIGRDAGLWGRRSRLRLSGKPLLLTELFLPASPLY
+>d1tuka_ a.52.1.1 (A:) Non-specific lipid-transfer protein homologue (ns-LTP2) {Wheat (Triticum aestivum) [TaxId: 4565]}
+ACQASQLAVCASAILSGAKPSGECCGNLRAQQGCFCQYAKDPTYGQYIRSPHARDTLTSCGLAVPHC
+>d1tula_ b.85.5.1 (A:) Tlp20, baculovirus telokin-like protein {AcMNPV (Autographa californica nuclear polyhedrosis virus) [TaxId: 46015]}
+GTPDIIVNAQINSEDENVLDFIIEDEYYLKKRGVGAHIIKVASSPQLRLLYKNAYSTVSCGNYGVLCNLVQNGEYDLNAIMFNCAEIKLNKGQMLFQTKIWR
+>d1twda_ c.1.30.1 (A:) Copper homeostasis protein CutC {Shigella flexneri [TaxId: 623]}
+ALLEICCYSMECALTAQQNGADRVELCAAPKEGGLTPSLGVLKSVRQRVTIPVHPIIRPRGGDFCYSDGEFAAILEDVRTVRELGFPGLVTGVLDVDGNVDMPRMEKIMAAAGPLAVTFHRAFDMCANPLYTLNNLAELGIARVLTSGQKSDALQGLSKIMELIAHRDAPIIMAGAGVRAENLHHFLDAGVLEVHSSAGAWQASPMRYRNQGLSMSSDEHADEYSRYIVDGAAVAEMKGIIERHQAK
+>d1twfc2 d.181.1.1 (C:42-172) RPB3 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+PTLAIDSVEVETNTTVLADEFIAHRLGLIPLQSMDIEQLEYSRDCFCEDHCDKCSVVLTLQAFGESESTTNVYSKDLVIVSNLMGRNIGHPIIQDKEGNGVLICKLRKGQELKLTCVAKKGIAKEHAKWGP
+>d1twff_ a.143.1.2 (F:) RPB6 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+KAIPKDQRATTPYMTKYERARILGTRALQISMNAPVFVDLEGETDPLRIAMKELAEKKIPLVIRRYLPDGSFEDWSVEELIVDL
+>d1twfj_ a.4.11.1 (J:) RNA polymerase subunit RPB10 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MIVPVRCFSCGKVVGDKWESYLNLLQEDELDEGTALSRLGLKRYCCRRMILTHVDLIEKFLRYNP
+>d1tx4a_ a.116.1.1 (A:) p50 RhoGAP domain {Human (Homo sapiens) [TaxId: 9606]}
+PLPNQQFGVSLQHLQEKNPEQEPIPIVLRETVAYLQAHALTTEGIFRRSANTQVVREVQQKYNMGLPVDFDQYNALHLPAVILKTFLRELPEPLLTFDLYPHVVGFLNIDESQRVPATLQVLQTLPEENYQVLRFLTAFLVQISAHSDQNKMTNTNLAVVFGPNLLWAKDAAITLKAINPINTFTKFLLDHQGELF
+>d1tzba_ c.80.1.1 (A:) Glucose-6-phosphate isomerase, conjectural {Pyrobaculum aerophilum [TaxId: 13773]}
+SQLLQDYLNWENYILRRVDFPTSYVVEGEVVRIEAMPRLYISGMGGSGVVADLIRDFSLTWNWEVEVIAVKDYFLKARDGLLIAVSYSGNTIETLYTVEYAKRRRIPAVAITTGGRLAQMGVPTVIVPKASAPRAALPQLLTAALHVVAKVYGIDVKIPEGLEPPNEALIHKLVEEFQKRPTIIAAESMRGVAYRVKNEFNENAKIEPSVEILPEAHHNWIEGSERAVVALTSPHIPKEHQERVKATVEIVGGSIYAVEMHPKGVLSFLRDVGIASVKLAEIRGVNPLATPRIDALKRRLQ
+>d1tzpa_ d.65.1.3 (A:) D-alanyl-D-alanine-endopeptidase MepA {Escherichia coli [TaxId: 562]}
+ATPWQKITQPVPGSAQSIGSFSNGCIVGADTLPIQSEHYQVMRTDQRRYFGHPDLVMFIQRLSSQVSNLGMGTVLIGDMGMPAGGRFNGGHASHQTGLDVDIFLQLPKTRWTSAQLLRPQALDLVSRDGKHVVSTLWKPEIFSLIKLAAQDKDVTRIFVNPAIKQQLCLDAGTDRDWLRKVRPWFQHRAHMHVRLRCPADSLECEDQPLPPSGDGCGAELQSWFEPPKPGTTKPEKKTPPPLPPSCQALLDEHVI
+>d1u04a1 b.34.14.1 (A:2-323) Argonaute homologue PF0537 {Pyrococcus furiosus [TaxId: 2261]}
+KAIVVINLVKINKKIIPDKIYVYRLFNDPEEELQKEGYSIYRLAYENVGIVIDPENLIIATTKELEYEGEFIPEGEISFSELRNDYQSKLVLRLLKENGIGEYELSKLLRKFRKPKTFGDYKVIPSVEMSVIKHDEDFYLVIHIIHQIQSMKTLWELVNKDPKELEEFLMTHKENLMLKDIASPLKTVYKPCFEEYTKKPKLDHNQEIVKYWYNYHIERYWNTPEAKLEFYRKFGQVDLKQPAILAKFASKIKKNKNYKIYLLPQLVVPTYNAEQLESDVAKEILEYTKLMPEERKELLENILAEVDSDIIDKSLSEIEVEK
+>d1u07a_ d.212.1.2 (A:) TonB {Escherichia coli [TaxId: 562]}
+ASGPRALSRNQPQYPARAQALRIEGQVKVKFDVTPDGRVDNVQILSAKPANMFEREVKNAMRRWRYEPGKPGSGIVVNILFKINGTTEIQ
+>d1u0sa_ d.58.24.1 (A:) CheY-binding domain of CheA {Thermotoga maritima [TaxId: 2336]}
+GFKTFYIKVILKEGTQLKSARIYLVFHKLEELKCEVVRTIPSVEEIEEEKFENEVELFVISPVDLEKLSEALSSIADIERVIIKEV
+>d1u2ca2 d.272.1.1 (A:179-303) Dystroglycan, domain 2 {Mouse (Mus musculus) [TaxId: 10090]}
+ACAADEPVTVLTVILDADLTKMTPKQRIDLLNRMQSFSEVELHNMKLVPVVNNRLFDMSAFMAGPGNAKKVVENGALLSWKLGCSLNQNSVPDIRGVETPAREGAMSAQLGYPVVGWHIANKKPT
+>d1u2ha_ b.1.1.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+KAPPTFKVSLMDQSVREGQDVIMSIRVQGEPKPVVSWLRNRQPVRPDQRRFAEEAEGGLCRLRILAAERGDAGFYTCKAVNEYGARQCEARLEVRG
+>d1u2ma_ f.48.1.1 (A:) Periplasmic chaperon skp (HlpA) {Escherichia coli [TaxId: 562]}
+GMADKIAIVNMGSLFQQVAQKTGVSNTLENEFKGRASELQRMETDLQAKMKKLQSMKAGSDRTKLEKDVMAQRQTFAQKAQAFEQDRARRSNEERGKLVTRIQTAVKSVANSQDIDLVVDANAVAYNSSDVKDITADVLKQVK
+>d1u5ka2 g.45.1.2 (A:81-237) Recombinational repair protein RecO, C-terminal domain {Deinococcus radiodurans [TaxId: 1299]}
+PTLAEPERYAFAHLMAEFADALFQEGEFSEQAFDLFAASLRGVAHQPDPEWVALVMSYKLLGLAGVIPQTARCARCGAPDPEHPDPLGGQLLCSKCAALPPYPPAVLDFLRHAVRRTVRASFEQPVPSADRPALWRALEKFVTVQVGGVHSWRQLVP
+>d1u5pa1 a.7.1.1 (A:1662-1771) Spectrin alpha chain {Chicken (Gallus gallus) [TaxId: 9031]}
+ANKQQNFNTGIKDFDFWLSEVEALLASEDYGKDLASVNNLLKKHQLLEADISAHEDRLKDLNSQADSLMTSSAFDTSQVKDKRETINGRFQRIKSMAAARRAKLNESHRL
+>d1u6ka_ c.127.1.1 (A:) F420-dependent methylenetetrahydromethanopterin dehydrogenase (MTD) {Methanopyrus kandleri [TaxId: 2320]}
+TVAKAIFIKCGNLGTSMMMDMLLDERADREDVEFRVVGTSVKMDPECVEAAVEMALDIAEDFEPDFIVYGGPNPAAPGPSKAREMLADSEYPAVIIGDAPGLKVKDEMEEQGLGYILVKPDAMLGARREFLDPVEMAIYNADLMKVLAATGVFRVVQEAFDELIEKAKEDEISENDLPKLVIDRNTLLEREEFENPYAMVKAMAALEIAENVADVSVEGCFVEQDKERYVPIVASAHEMMRKAAELADEARELEKSNDAVLRTPHAPDGKVLSKRKFMEDPE
+>d1u7ga_ f.44.1.1 (A:) Ammonium transporter AmtB {Escherichia coli [TaxId: 562]}
+AVADKADNAFMMICTALVLFMTIPGIALFYGGLIRGKNVLSMLTQVTVTFALVCILWVVYGYSLASGEGNNFFGNINWLMLKNIELTAVMGSIYQYIHVAFQGSFACITVGLIVGALAERIRFPAVLIFVVVWLTLSYIPIAHMVWGGGLLASHGALDFAGGTVVHINAAIAGLVGAYLIGKRVGFGKEAFKPHNLPMVFTGTAILYIGWFGFNAGSAGTANEIAALAFVNTVVATAAAILGWIFGEWALRGLPSLLGACSGAIAGLVGVTPACGYIGVGGALIIGVVAGLAGLWGVTMLKRLLRVDDPCDVFGVHGVCGIVGCIMTGIFAASSLGGVGFAEGVTMGHQLLVQLESIAITIVWSGVVAFIGYKLADLTVGLRV
+>d1u7la_ e.57.1.1 (A:) Vacuolar ATP synthase subunit C {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+LYTANDFILISLPQNAQPVTAPGSKTDSWFNETLIGGRAFVSDFKIPEFKIGSLDTLIVESEELSKVDNQIGASIGKIIEILQGLNETSTNAYRTLPINNMPVPEYLENFQWQTRKFKLDKSIKDLITLISNESSQLDADVRATYANYNSAKTNLAAAERKKTGDLSVRSLHDIVKPEDFVLNSEHLTTVLVAVPKSLKSDFEKSYETLSKNVVPASASVIAEDAEYVLFNVHLFKKNVQEFTTAAREKKFIPREFNYSEELIDQLKKEHDSAASLEQSLRVQLVRLAKTAYVDVFINWFHIKALRVYVESVLRYGLPPHFNIKIIAVPPKNLSKCKSELIDAFGFLGGNAFMKDKKGKINKQDTSLHQYASLVDTEYEPFVMYIINL
+>d1u7za_ c.72.3.1 (A:) Coenzyme A biosynthesis bifunctional protein CoaBC, phosphopantothenoylcysteine synthase domain (CoaB) {Escherichia coli [TaxId: 562]}
+VNDLKHLNIMITAGPTREPLDPVRYISDHSSGKMGFAIAAAAARRGANVTLVSGPVSLPTPPFVKRVDVMTALEMEAAVNASVQQQNIFIGCAAVADYRAATVAPEKIKKQATQGDELTIKMVKNPDIVAGVAALKDHRPYVVGFAAETNNVEEYARQKRIRKNLDLICANDVSQPTQGFNSDNNALHLFWQDGDKVLPLERKELLGQLLLDEIVTRYDEKNR
+>d1u84a_ a.230.1.1 (A:) hypothetical protein YugE {Bacillus stearothermophilus [TaxId: 1422]}
+GQQLNRLLLEWIGAWDPFGLGKDAYDVEAASVLQAVYETEDARTLAARIQSIYEFAFDEPIPFPHCLKLARRLLELKQAAS
+>d1u8va1 a.29.3.1 (A:276-490) 4-hydroxybutyryl-CoA dehydratase AbfD, C-terminal domain {Clostridium aminobutyricum [TaxId: 33953]}
+QEYDFAGMMVERFAGYHRQSYGGCKVGVGDVVIGAAALAADYNGAQKASHVKDKLIEMTHLNETLYCCGIACSAEGYPTAAGNYQIDLLLANVCKQNITRFPYEIVRLAEDIAGGLMVTMPSEADFKSETVVGRDGETIGDFCNKFFAAAPTCTTEERMRVLRFLENICLGASAVGYRTESMHGAGSPQAQRIMIARQGNINAKKELAKAIAGIK
+>d1u8va2 e.6.1.1 (A:1-275) 4-hydroxybutyryl-CoA dehydratase AbfD, NM domains {Clostridium aminobutyricum [TaxId: 33953]}
+MLMTAEQYIESLRKLNTRVYMFGEKIENWVDHPMIRPSINCVRMTYELAQDPQYADLMTTKSNLIGKTINRFANLHQSTDDLRKKVKMQRLLGQKTASCFQRCVGMDAFNAVFSTTYEIDQKYGTNYHKNFTEYLKYIQENDLIVDGAMTDPKGDRGLAPSAQKDPDLFLRIVEKREDGIVVRGAKAHQTGSINSHEHIIMPTIAMTEADKDYAVSFACPSDADGLFMIYGRQSCDTRKMEEGADIDLGNKQFGGQEALVVFDNVFIPNDRIFLC
+>d1u94a2 d.48.1.1 (A:269-328) RecA protein, C-terminal domain {Escherichia coli [TaxId: 562]}
+NFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLL
+>d1u9la_ a.60.4.2 (A:) Transcription elongation protein NusA {Escherichia coli [TaxId: 562]}
+AHAAIDTFTKYLDIDEDFATVLVEEGFSTLEELAYVPMKELLEIEGLDEPTVEALRERAKNALATIAQ
+>d1uc2a_ d.261.1.1 (A:) Hypothetical protein PH1602 {Pyrococcus horikoshii [TaxId: 53953]}
+VVPLKRIDKIRWEIPKFDKRMRVPGRVYADEVLLEKMKNDRTLEQATNVAMLPGIYKYSIVMPDGHQGYGFPIGGVAAFDVKEGVISPGGIGYDINCGVRLIRTNLTEKEVRPRIKQLVDTLFKNVPSGVGSQGRIKLHWTQIDDVLVDGAKWAVDNGYGWERDLERLEEGGRMEGADPEAVSQRAKQRGAPQLGSLGSGNHFLEVQVVDKIFDPEVAKAYGLFEGQVVVMVHTGSRGLGHQVASDYLRIMERAIRKYRIPWPDRELVSVPFQSEEGQRYFSAMKAAANFAWANRQMITHWVRESFQEVFKQDPEGDLGMDIVYDVAHNIGKVEEHEVDGKRVKVIVHRKGATRAFPPGHEAVPRLYRDVGQPVLIPGSMGTASYILAGTEGAMKETFGSTCHGAGRVLSRKAATRQYRGDRIRQELLNRGIYVRAASMRVVAEEAPGAYKNVDNVVKVVSEAGIAKLVARMRPIGVAKG
+>d1ucda_ d.124.1.1 (A:) Ribonuclease MC1 {Bitter gourd (Momordica charantia) [TaxId: 3673]}
+FDSFWFVQQWPPAVCSFQKSGSCPGSGLRTFTIHGLWPQQSGTSLTNCPGSPFDITKISHLQSQLNTLWPNVLRANNQQFWSHEWTKHGTCSESTFNQAAYFKLAVDMRNNYDIIGALRPHAAGPNGRTKSRQAIKGFLKAKFGKFPGLRCRTDPQTKVSYLVQVVACFAQDGSTLIDCTRDTCGANFIF
+>d1ucsa_ b.85.1.1 (A:) Type III antifreeze protein, AFP III {Antarctic eel pout (Lycodichthys dearborni), RD1 isoform [TaxId: 8201]}
+NKASVVANQLIPINTALTLIMMKAEVVTPMGIPAEEIPKLVGMQVNRAVPLGTTLMPDMVKNYE
+>d1udxa1 b.117.1.1 (A:1-156) Obg GTP-binding protein N-terminal domain {Thermus thermophilus [TaxId: 274]}
+MFQDVLVITVAAGRGGDGAVSFRREKFVPKGGPDGGDGGRGGSVYLRARGSVDSLSRLSKRTYKAEDGEHGRGSQQHGRGGEDLVIEVPRGTRVFDADTGELLADLTEEGQTVLVARGGAGGRGNMHFVSPTRQAPRFAEAGEEGEKRRLRLELML
+>d1udxa3 d.242.1.1 (A:341-416) Obg GTP-binding protein C-terminal domain {Thermus thermophilus [TaxId: 274]}
+QAGVEVVPVAEGVYEVRAPEVERYLARIKGDLMEAAGYLQEVFRRQGVEAALRAKGVRAGDLVRIGGLEFEYIPEV
+>d1ueha_ c.101.1.1 (A:) Undecaprenyl diphosphate synthase {Escherichia coli [TaxId: 562]}
+LPAHGCRHVAIIMDGNGRWAKKQGKIRAFGHKAGAKSVRRAVSFAANNGIEALTLYAFSSENWNRPAQEVSALMELFVWALDSEVKSLHRHNVRLRIIGDTSRFNSRLQERIRKSEALTAGNTGLTLNIAANYGGRWDIVQGVRQLAEKVQQGNLQPDQIDEEMLNQHVCMHELAPVDLVIRTGGEHRISNFLLWQIAYAELYFTDVLWPDFDEQDFEGALNAFANRE
+>d1ufia_ a.30.4.1 (A:) Dimerisation domain of CENP-B {Human (Homo sapiens) [TaxId: 9606]}
+HMPVPSFGEAMAYFAMVKRYLTSFPIDDRVQSHILHLEHDLVHVTRKN
+>d1ufya_ d.79.1.2 (A:) Chorismate mutase {Thermus thermophilus [TaxId: 274]}
+MVRGIRGAITVEEDTPEAIHQATRELLLKMLEANGIQSYEELAAVIFTVTEDLTSAFPAEAARQIGMHRVPLLSAREVPVPGSLPRVIRVLALWNTDTPQDRVRHVYLREAVRLRPDLESA
+>d1ugia_ d.17.5.1 (A:) Uracil-DNA glycosylase inhibitor protein {Bacteriophage pbs2 [TaxId: 10684]}
+TNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML
+>d1uj8a1 a.159.5.1 (A:13-76) Iron-sulfur cluster assembly protein IscX {Escherichia coli [TaxId: 562]}
+GLKWTDSREIGEALYDAYPDLDPKTVRFTDMHQWICDLEDFDDDPQASNEKILEAILLVWLDEA
+>d1umga_ d.280.1.1 (A:) ST0318 {Sulfolobus tokodaii [TaxId: 111955]}
+KTTISVIKADIGSLAGHHIVHPDTMAAANKVLASAKEQGIILDYYITHVGDDLQLIMTHTRGELDTKVHETAWNAFKEAAKVAKDLGLYAAGQDLLSDSFSGNVRGLGPGVAEMEIEERASEPIAIFMADKTEPGAYNLPLYKMFADPFNTPGLVIDPTMHGGFKFEVLDVYQGEAVMLSAPQEIYDLLALIGTPARYVIRRVYRNEDNLLAAVVSIERLNLIAGKYVGKDDPVMIVRLQHGLPALGEALEAFAFPHLVPGWMRGSHYGPLMPVSQRDAKATRFDGPPRLLGLGFNVKNGRLVGPTDLFDDPAFDETRRLANIVADYMRRHGPFMPHRLEPTEMEYTTLPLILEKLKDRFKK
+>d1unqa_ b.55.1.1 (A:) Rac-alpha serine/threonine kinase {Human (Homo sapiens) [TaxId: 9606]}
+SMSDVAIVKEGWLHKRGEYIKTWRPRYFLLKNDGTFIGYKERPQDVDQREAPLNNFSVAQCQLMKTERPRPNTFIIRCLQWTTVIERTFHVETPEEREEWTTAIQTVADGLKKQEEEE
+>d1uoua3 d.41.3.1 (A:374-480) Thymidine phosphorylase {Human (Homo sapiens) [TaxId: 9606]}
+RAREQEELLAPADGTVELVRALPLALVLHELGAGRAGEPLRLGVGAELLVDVGQRLRRGTPWLRVHRDGPALSGPQSRALQEALVLSDRAPFAAPLPFAELVLPP
+>d1uoya_ g.3.19.1 (A:) Bubble protein {Penicillium brevicompactum [TaxId: 5074]}
+DTCGSGYNVDQRRTNSGCKAGNGDRHFCGCDRTGVVECKGGKWTEVQDCGSSSCKGTSNGGATC
+>d1uptb_ a.193.1.1 (B:) Golgi autoantigen, golgin-245 {Human (Homo sapiens) [TaxId: 9606]}
+EPTEFEYLRKVLFEYMMGRETKTMAKVITTVLKFPDDQTQKILEREDARLMSWLRSSS
+>d1us0a_ c.1.7.1 (A:) Aldose reductase (aldehyde reductase) {Human (Homo sapiens) [TaxId: 9606]}
+MASRILLNNGAKMPILGLGTWKSPPGQVTEAVKVAIDVGYRHIDCAHVYQNENEVGVAIQEKLREQVVKREELFIVSKLWCTYHEKGLVKGACQKTLSDLKLDYLDLYLIHWPTGFKPGKEFFPLDESGNVVPSDTNILDTWAAMEELVDEGLVKAIGISNFNHLQVEMILNKPGLKYKPAVNQIECHPYLTQEKLIQYCQSKGIVVTAYSPLGSPDRPWAKPEDPSLLEDPRIKAIAAKHNKTTAQVLIRFPMQRNLVVIPKSVTPERIAENFKVFDFELSSQDMTTLLSYNRNWRVCALLSCTSHKDYPFHE
+>d1us7b_ a.205.1.1 (B:) Hsp90 co-chaperone CDC37 {Human (Homo sapiens) [TaxId: 9606]}
+HKTFVEKYEKQIKHFGMLRRWDDSQKYLSDNVHLVCEETANYLVIWCIDLEVEEKCALMEQVAHQTIVMQFILELAKSLKVDPRACFRQFFTKIKTADRQYMEGFNDELEAFKERVRGRAKLRIEKAMKEYEEEERKKRLGPGGLDPVEVYESLPEELQKCFDVKDVQMLQDAISKMDPTDAKYHMQRCIDSGLWVPNSKA
+>d1usma_ d.74.1.1 (A:) Pterin-4a-carbinolamine dehydratase (PCD)/dimerization cofactor of HNF1 (DCoH) {Thermus thermophilus [TaxId: 274]}
+MDWEERENLKRLVKTFAFPNFREALDFANRVGALAERENHHPRLTVEWGRVTVEWWTHSAGGVTEKDREMARLTDALLQR
+>d1usub_ d.83.2.1 (B:) Activator of Hsp90 ATPase, Aha1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+VDKNCIGWAKEYFKQKIVGVEAGSVKDKKYAKIKSVSSIEGDCEVNQRKGKVISLFDLKITVLIEGHVDSKDGSALPFEGSINVPEVAFDSEASSYQFDISIFKETSELSEAKPLIRSELLPKLRQIFQQFGKDLLATHGND
+>d1ut7a_ b.143.1.1 (A:) No apical meristem (NAM, ANAC) {Mouse-ear cress (Arabidopsis thaliana) [TaxId: 3702]}
+GSHMGIQETDPLTQLSLPPGFRFYPTDEELMVQYLCRKAAGYDFSLQLIAEIDLYKFDPWVLPNKALFGEKEWYFFSPRDRKYPNGSRPNRVAGSGYWKATGTDKIISTEGQRVGIKKALVFYIGKAPKGTKTNWIMHEYRLIEPSRRNGSTKLDDWVLCRIYKKQ
+>d1utca2 b.69.6.1 (A:4-330) Clathrin heavy-chain terminal domain {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ILPIRFQEHLQLQNLGINPANIGFSTLTMESDKFICIREKVGEQAQVVIIDMNDPSNPIRRPISADSAIMNPASKVIALKAGKTLQIFNIEMKSKMKAHTMTDDVTFWKWISLNTVALVTDNAVYHWSMEGESQPVKMFDRHSSLAGCQIINYRTDAKQKWLLLTGISAQQNRVVGAMQLYSVDRKVSQPIEGHAASFAQFKMEGNAEESTLFCFAVRGQAGGKLHIIEVGTPPTGNQPFPKKAVDVFFPPEAQNDFPVAMQISEKHDVVFLITKYGYIHLYDLETGTCIYMNRISGETIFVTAPHEATAGIIGVNRKGQVLSVCVE
+>d1utga_ a.101.1.1 (A:) Uteroglobin {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+GICPRFAHVIENLLLGTPSSYETSLKEFEPDDTMKDAGMQMKKVLDSLPQTTRENIMKLTEKIVKSPLCM
+>d1utya_ b.147.1.1 (A:) Nonstructural protein NS2 {Bluetongue virus [TaxId: 40051]}
+FTKNIFVLDVTAKTLCGAIAKLSSQPYCQIKIGRVVAFKPVKNPEPKGYVLNVPGPGAYRIQDGQDIISLMLTPHGVEATTERWEEWKFEGVSVTPMATRVQYNGVMVDAEIKYCKGMGIVQPYMRNDFDRNEMPDLPGVMRSNYDIRELRQK
+>d1uuja_ a.221.1.1 (A:) Lissencephaly-1 protein (Lis-1, PAF-AH alpha) N-terminal domain {Mouse (Mus musculus) [TaxId: 10090]}
+VLSQRQRDELNRAIADYLRSNGYEEAYSVFKKEAELDMNEELDKKYAGLLEKKWTSVIRLQKKVMELESKLNEAKE
+>d1uuya_ c.57.1.1 (A:) Plant CNX1 G domain {Mouse-ear cress (Arabidopsis thaliana) [TaxId: 3702]}
+GPEYKVAILTVSDTVSAGAGPDRSGPRAVSVVDSSSEKLGGAKVVATAVVPDEVERIKDILQKWSDVDEMDLILTLGGTGFTPRDVTPEATKKVIERETPGLLFVMMQESLKITPFAMLARSAAGIRGSTLIINMPGNPNAVAECMEALLPALKHALKQIK
+>d1uv7a_ d.67.4.1 (A:) General secretion pathway protein M, EpsM {Vibrio cholerae [TaxId: 666]}
+QPLNQVITNSTRQFNIELIRVQPRGEMMQVWIQPLPFSQLVSWIAYLQERQGVSVDAIDIDRGKVNGVVEVKRLQLKRGG
+>d1uw6a_ b.96.1.1 (A:) Acetylcholine binding protein (ACHBP) {Great pond snail (Lymnaea stagnalis) [TaxId: 6523]}
+EFDRADILYNIRQTSRPDVIPTQRDRPVAVSVSLKFINILEVNEITNEVDVVFWQQTTWSDRTLAWNSSHSPDQVSVPISSLWVPDLAAYNAISKPEVLTPQLARVVSDGEVLYMPSIRQRFSCDVSGVDTESGATCRIKIGSWTHHSREISVDPTTENSDDSEYFSQYSRFEILDVTQKKNSVTYSCCPEAYEDVEVSLNFRKKGRS
+>d1uwka_ e.51.1.1 (A:) Urocanate hydratase HutU {Pseudomonas putida [TaxId: 303]}
+NNKYRDVEIRAPRGNKLTAKSWLTEAPLRMLMNNLDPQVAENPKELVVYGGIGRAARNWECYDKIVETLTRLEDDETLLVQSGKPVGVFKTHSNAPRVLIANSNLVPHWANWEHFNELDAKGLAMYGQMTAGSWIYIGSQGIVQGTYETFVEAGRQHYGGSLKGKWVLTAGLGGMGGAQPLAATLAGACSLNIESQQSRIDFRLETRYVDEQATDLDDALVRIAKYTAEGKAISIALHGNAAEILPELVKRGVRPDMVTDQTSAHDPLNGYLPAGWTWEQYRDRAQTEPAAVVKAAKQSMAVHVQAMLDFQKQGVPTFDYGNNIRQMAKEEGVADAFDFPGFVPAYIRPLFCRGVGPFRWAALSGEAEDIYKTDAKVKELIPDDAHLHRWLDMARERISFQGLPARICWVGLGLRAKLGLAFNEMVRSGELSAPVVIGRDHLDSGSVSSPNAETEAMRDGSDAVSDWPLLNALLNTAGGATWVSLHHGGGVGMGFSQHSGMVIVCDGTDEAAERIARVLTNDPGTGVMRHADAGYDIAIDCAKEQGLDLPMITG
+>d1ux5a_ a.207.1.1 (A:) Bni1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+KYPRPHKKLKQLHWEKLDCTDNSIWGTGKAEKFADDLYEKGVLADLEKAFAAREIKSLASKRKEDLQKITFLSRDISQQFGINLHMYSSLSVADLVKKILNCDRDFLQTPSVVEFLSKSEIIEVSVNLARNYAPYSTDWEGVRNLEDAKPPEKDPNDLQRADQIYLQLMVNLESYWGSRMRALTVVTSYEREYNELLAKLRKVDKAVSALQESDNLRNVFNVILAVGNFMNDTSKQAQGFKLSTLQRLTFIKDTTNSMTFLNYVEKIVRLNYPSFNDFLSELEPVLDVVKVSIEQLVNDCKDFSQSIVNVERSVEIGNLSDSSKFHPLDKVLIKTLPVLPEARKKGDLLEDEVKLTIMEFESLMHTYGEDSGDKFAKISFFKKFADFINEYKKAQAQNLAAEEEERLYIKH
+>d1ux6a2 g.75.1.1 (A:813-936) Thrombospondin-1 {Human (Homo sapiens) [TaxId: 9606]}
+ALADNCPLEHNPDQLDSDSDRIGDTCDNNQDIDEDGHQNNLDNCPYVPNANQADHDKDGKGDACDHDDDNDGIPDDKDNCRLVPNPDQKDSDGDGRGDACKDDFDHDSVPDIDDICPENVDISE
+>d1uxya2 d.146.1.1 (A:201-342) Uridine diphospho-N-Acetylenolpyruvylglucosamine reductase, MurB, C-terminal domain {Escherichia coli [TaxId: 562]}
+VTPQQVFNAVCHMRTTKLPDPKVNGNAGAFFKNPVVSAETAKALLSQFPTAPNYPQADGSVKLAAGWLIDQCQLKGMQIGGAAVHRQQALVLINEDNAKSEDVVQLAHHVRQKVGEKFNVWLEPEVRFIGASGEVSAVETIS
+>d1uz3a1 a.283.1.1 (A:13-102) Emsy {Human (Homo sapiens) [TaxId: 9606]}
+LSRDECKRILRKLELEAYAGVISALRAQGDLTKEKKDLLGELSKVLSISTERHRAEVRRAVNDERLTTIAHNMSGPNSSSEWSIEGRRLV
+>d1uz5a1 b.85.6.1 (A:329-402) Molybdenum cofactor biosynthesis protein MoeA, C-terminal domain {Pyrococcus horikoshii, PH0582 [TaxId: 53953]}
+IGKKVARLKHKVFSVKGRRQFLPVKLEGDLAVPILKGSGAVTSFIDADGFVEIPETVESLDEGEEVEVTLFKGW
+>d1uz5a2 b.103.1.1 (A:5-180) Molybdenum cofactor biosynthesis protein MoeA, N-terminal and linker domains {Pyrococcus horikoshii, PH0582 [TaxId: 53953]}
+KVVPLEKALEVVQSFKISPGIEEVPIEKGLGRIAAEDIYSPIDVPPFDRATVDGYAVRAEDTFMASEASPVRLKVIGSVHAGEEPKFKLGKGEAAYISTGAMLPGNADAVIQFEDVERVNGEILIYKPAYPGLGVMKKGIDIEKGRLLVKKGERLGFKQTALLSAVGINKVKVFRK
+>d1uzka3 g.23.1.1 (A:1529-1604) Fibrillin {Human (Homo sapiens) [TaxId: 9606]}
+TRSGNCYLDIRPRGDNGDTACSNEIGVGVSKASCCCSLGKAWGTPCEMCPAVNTSEYKILCPGGEGFRPNPITVIL
+>d1v0wa1 d.136.1.2 (A:6-263) Phospholipase D {Streptomyces sp. [TaxId: 1931]}
+SATPHLDAVEQTLRQVSPGLEGDVWERTSGNKLDGSAADPSDWLLQTPGCWGDDKCADRVGTKRLLAKMTENIGNATRTVDISTLAPFPNGAFQDAIVAGLKESAAKGNKLKVRILVGAAPVYHMNVIPSKYRDELTAKLGKAAENITLNVASMTTSKTAFSWNHSKILVVDGQSALTGGINSWKDDYLDTTHPVSDVDLALTGPAAGSAGRYLDTLWTWTCQNKSNIASVWFAASGNAGCMPTMHKDTNPKASPATG
+>d1v1ha1 b.83.1.1 (A:319-392) Adenovirus {Human adenovirus type 2 [TaxId: 10515]}
+VSIKKSSGLNFDNTAIAINAGKGLEFDTNTSESPDINPIKTKIGSGIDYNENGAMITKLGAGLSFDNSGAITIG
+>d1v2ba_ d.107.1.2 (A:) Oxygen-evolving enhancer protein PsbP {Tobacco (Nicotiana tabacum) [TaxId: 4097]}
+TDFQTYNGDGFKLQIPSKWNPNKEVEYPGQVLRFEDNFDATSNVIVAITPTDKKSITDFGSPEQFLSQVDYLLGRQAYSGKTDSEGGFESDAVAIANVLETSTAEVGGKQYYYLSILTRTADGNEGGKHQLVTATVNDGKLYICKAQAGDKRWFKGAKKFVENTATSFSLA
+>d1v30a_ d.269.1.1 (A:) Hypothetical protein PH0828 {Pyrococcus horikoshii [TaxId: 53953]}
+SVRIAVYGTLRKGKPLHWYLKGAKFLGEDWIEGYQLYFEYLPYAVKGKGKLKVEVYEVDKETFERINEIEIGTGYRLVEVSTKFGKAFLWEWGSKPRGKRIKSGDFDEIRLEHHHHHH
+>d1v58a2 d.17.3.1 (A:2-61) Thiol:disulfide interchange protein DsbG, N-terminal domain {Escherichia coli [TaxId: 562]}
+ELPAPVKAIEKQGITIIKTFDAPGGMKGYLGKYQDMGVTIYLTPDGKHAISGYMYNEKGE
+>d1v6pa_ g.7.1.1 (A:) Cobrotoxin II (ct2) {Taiwan cobra (Naja naja atra) [TaxId: 8656]}
+LECHNQQSSQTPTTTGCSGGETNCYKKRWRDHRGYRTERGCGCPSVKNGIEINCCTTDRCNN
+>d1v74b_ a.24.20.1 (B:) Colicin D immunity protein {Escherichia coli [TaxId: 562]}
+MNKMAMIDLAKLFLASKITAIEFSERICVERRRLYGVKDLSPNILNCGEELFMAAERFEPDADRANYEIDDNGLKVEVRSILEKFKL
+>d1v7za_ c.125.1.1 (A:) Creatininase {Pseudomonas putida [TaxId: 303]}
+KSVFVGELTWKEYEARVAAGDCVLMLPVGALEQHGHHMCMNVDVLLPTAVCKRVAERIGALVMPGLQYGYKSQQKSGGGNHFPGTTSLDGATLTGTVQDIIRELARHGARRLVLMNGHYENSMFIVEGIDLALRELRYAGIQDFKVVVLSYWDFVKDPAVIQQLYPEGFLGWDIEHGGVFETSLMLALYPDLVDLDRVVDHPPATFPPYDVFPVDPARTPAPGTLSSAKTASREKGELILEVCVQGIADAIREEFPP
+>d1v8ca2 d.129.5.1 (A:88-165) MoaD-related protein, C-terminal domain {Thermus thermophilus [TaxId: 274]}
+GFERTFGAFPPWLLERYLEEWGGTREGEGVYRLPGAVVRFREVEPLKVGSLSIPQLRVEVEGEEAERWFERIAFAASR
+>d1v93a_ c.1.23.1 (A:) Methylenetetrahydrofolate reductase {Thermus thermophilus [TaxId: 274]}
+MKIRDLLKARRGPLFSFEFFPPKDPEGEEALFRTLEELKAFRPAFVSITYGAMGSTRERSVAWAQRIQSLGLNPLAHLTVAGQSRKEVAEVLHRFVESGVENLLALRGDPPRGERVFRPHPEGFRYAAELVALIRERYGDRVSVGGAAYPEGHPESESLEADLRHFKAKVEAGLDFAITQLFFNNAHYFGFLERARRAGIGIPILPGIMPVTSYRQLRRFTEVCGASIPGPLLAKLERHQDDPKAVLEIGVEHAVRQVAELLEAGVEGVHFYTLNKSPATRMVLERLGLRPA
+>d1v96a1 c.120.1.1 (A:2-149) Hypothetical protein PH0500 {Pyrococcus horikoshii [TaxId: 53953]}
+PLPPDITFDSLALIKMHSQNMKRILEVTLAKFTVNLSIVTVYRYLTARAYLKKNIEAEFEILKDIYNIVPLLDDIAIKAAQIEANLIKKEITLDMEDIITATTAIYTNSLLVTDDPKRYEPIRRFGLDTMPLDKFIKEVELMVEKELI
+>d1v9ma_ f.40.1.1 (A:) V-type ATP synthase subunit C {Thermus thermophilus [TaxId: 274]}
+FAYLNARVRVRRGTLLKESFFQEALDLSFADFLRLLSETVYGGELAGQGLPDVDRAVLRTQAKLVGDLPRLVTGEAREAVRLLLLRNDLHNLQALLRAKATGRPFEEVLLLPGTLREEVWRQAYEAQDPAGMAQVLAVPGHPLARALRAVLRETQDLARVEALLAKRFFEDVAKAAKGLDQPALRDYLALEVDAENLRTAFKLQGSGLAPDAFFLKGGRFVDRVRFARLMEGDYAVLDELSGTPFSGLSGVRDLKALERGLRCVLLKEAKKGVQDPLGVGLVLAYVKEREWEAVRLRLLARRAYFGLPRAQVEEEVVCP
+>d1vaja1 d.309.1.1 (A:3-205) Hypothetical protein PH0010 {Pyrococcus horikoshii [TaxId: 53953]}
+FKIKDEWGEFLVRLARRAIEEYLKTGKEIEPPKDTPPELWEKMGVFVTLNRYNVPPQTALRGCIGFPTPIYPLVEATIKAAIYSAVDDPRFPPVKLEEMDNLVVEVSVLTPPELIEGPPEERPRKIKVGRDGLIVEKGIYSGLLLPQVPVEWGWDEEEFLAETCWKAGLPPDCWLDEDTKVYKFTAEIFEEEYPRGPIKRKPL
+>d1vbwa_ d.40.1.1 (A:) automated matches {Bitter gourd (Momordica charantia) [TaxId: 3673]}
+SRCQGKSSWPQLVGSTGAAAKAVIERENPRVRAVIIKVGSGATKDFRCDRVRVWVTERGIVARPPTIG
+>d1vcca_ d.121.1.1 (A:) Vaccinia DNA topoisomerase I, 9 kDa N-terminal fragment {Vaccinia virus, strain WR [TaxId: 10245]}
+MRALFYKDGKLFTDNNFLNPVSDDNPAYEVLQHVKIPTHLTDVVVYEQTWEEALTRLIFVGSDSKGRRQYFYGKMHV
+>d1vcla3 d.281.1.1 (A:284-432) Hemolytic lectin CEL-III, C-terminal domain {Cucumaria echinata [TaxId: 40245]}
+DDWEVPTATWNMVGCDQNGKVSQQISNTISFSSTVTAGVAVEVSSTIEKGVIFAKATVSVKVTASLSKAWTNSQSGTTAITYTCDNYDSDEEFTRGCMWQLAIETTEVKSGDLLVWNPQIVKCTRSNTAPGCAPFTKCANEDCTFCTDI
+>d1vcta1 a.7.12.1 (A:9-107) Hypothetical protein PH0236, N-terminal domain {Pyrococcus horikoshii [TaxId: 53953]}
+YEPKSVKEIFIEMKDTVELMVDLAYASLLFGDKEIAEEVLELEERIDLLNYQLMMHSVLAARNVKEAEQVITILQIANAIEDISNAAGDLAKMVLEGVE
+>d1vcta2 d.286.1.1 (A:108-201) Hypothetical protein PH0236, C-terminal domain {Pyrococcus horikoshii [TaxId: 53953]}
+LHPVIKETILEGEEIIGKIQVYPESVIVGKTLGELDLATNTGVWIIAVRRGKRWIFGPNENFKIRAGDVLIGRGTRTSIDHLKEIARGAIRVIG
+>d1vd6a_ c.1.18.3 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+RPLRLGHRGAPLKAKENTLESFRLALEAGLDGVELDVWPTRDGVFAVRHDPDTPLGPVFQVDYADLKAQEPDLPRLEEVLALKEAFPQAVFNVELKSFPGLGEEAARRLAALLRGREGVWVSSFDPLALLALRKAAPGLPLGFLMAEDHSALLPCLGVEAVHPHHALVTEEAVAGWRKRGLFVVAWTVNEEGEARRLLALGLDGLIGDRPEVLLPLGG
+>d1vdda_ e.49.1.1 (A:) Recombination protein RecR {Deinococcus radiodurans [TaxId: 1299]}
+MKYPPSLVSLIRELSRLPGIGPKSAQRLAFHLFEQPREDIERLASALLEAKRDLHVCPICFNITDAEKCDVCADPSRDQRTICVVEEPGDVIALERSGEYRGLYHVLHGVLSPMNGVGPDKLHIKPLLPRVGQGMEVILATGTTVEGDATALYLQRLLEPLGAAISRIAYGVPVGGSLEYTDEVTLGRALTGRQTVSKP
+>d1vf6a_ a.194.1.1 (A:) Associated tight junction protein Pals-1 {Human (Homo sapiens) [TaxId: 9606]}
+VLQVLDRLKMKLQEKGDTSQNEKLSMFYETLKSPLFNQILTLQQSIKQLKGQLNHILE
+>d1vf7a_ f.46.1.1 (A:) Multidrug resistance protein MexA domain {Pseudomonas aeruginosa [TaxId: 287]}
+TLNTELPGRTNAFRIAEVRPQVNGIILKRLFKEGSDVKAGQQLYQIDPATYEADYQSAQANLASTQEQAQRYKLLVADQAVSKQQYADANAAYLQSKAAVEQARINLRYTKVLSPISGRIGRSAVTEGALVTNGQANAMATVQQLDPIYVDVTQPSTALLRLRRELASGQLERAGDNAAKVSLKLEDGSQYPLEGRLEFSEVSVDEGTGSVTIRAVFPNPNNELLPGMFVHAQLQEG
+>d1vh4a_ b.80.6.1 (A:) Stabilizer of iron transporter SufD {Escherichia coli [TaxId: 562]}
+NALQQWHHLFEAEGTKRSPQAQQHLQQLLRTGLPTRKHENWKYTPLEGLINSQFVSIAGEISPQQRDALALTLDSVRLVFVDGRYVPALSDATEGSGYEVSINDDRQGLPDAIQAEVFLHLTESLAQSVTHIAVKRGQRPAKPLLLMHITQGVAGEEVNTAHYRHHLDLAEGAEATVIEHFVSLNDARHFTGARFTINVAANAHLQHIKLAFENPLSHHFAHNDLLLAEDATAFSHSFLLGGAVLRHNTSTQLNGENSTLRINSLAMPVKNEVCDTRTWLEHNKGFCNSRQLHKTIVSDKGRAVFNGLINVAQHAIKTDGQMTNNNLLMGKLAEVDTKPQLEIYADDVKCSHGATVGRIDDEQIFYLRSRGINQQDAQQMIIYAFAAELTEALRDEGLKQQVLARIGQRLPGG
+>d1vi6a_ c.23.15.1 (A:) Ribosomal protein S2 {Archaeoglobus fulgidus [TaxId: 2234]}
+EYEYLVPPDDYLAAGVHIGTQIKTGDMKKFIFKVRQDGLYVLDIRKLDERIRVAAKFLSRYEPSKILLVAARQYAHKPVQMFSKVVGSDYIVGRFIPGTLTNPMLSEYREPEVVFVNDPAIDKQAVSEATAVGIPVVALCDSNNSSADVDLVIPTNNKGRRALAIVYWLLAREIAKIRGQDFTYSIEDFEAEL
+>d1vioa2 d.66.1.5 (A:0-57) Pseudouridine synthase RsuA N-terminal domain {Haemophilus influenzae [TaxId: 727]}
+SLRLDKFIAENVGLTRSQATKAIRQSAVKINGEIVKSGSVQISQEDEIYFEDELLTWI
+>d1vjfa_ d.116.1.1 (A:) Hypothetical protein CC0111 {Caulobacter crescentus [TaxId: 155892]}
+MKTRADLFAFFDAHGVDHKTLDHPPVFRVEEGLEIKAAMPGGHTKNLFLKDAKGQLWLISALGETTIDLKKLHHVIGSGRLSFGPQEMMLETLGVTPGSVTAFGLINDTEKRVRFVLDKALADSDPVNFHPLKNDATTAVSQAGLRRFLAALGVEPMIVDFAAMEVVG
+>d1vjla_ d.257.1.1 (A:) Hypothetical protein TM0160 {Thermotoga maritima [TaxId: 2336]}
+HMRKAWVKTLALDRVSNTPVVILGIEGTNRVLPIWIGACEGHALALAMEKMEFPRPLTHDLLLSVLESLEARVDKVIIHSLKDNTFYATLVIRDLTYTDEEDEEAALIDIDSRPSDAIILAVKTGAPIFVSDNLVEKHSIELEVNERDLIN
+>d1vjua_ d.248.1.1 (A:) Hypothetical protein Lmaj006828 {Leishmania major [TaxId: 5664]}
+HMSLAVEAVKDFLLKLQDDICEALEAEDGQATFVEDKWTREGGGGGRTRVMVDGAVIEKGGVNFSHVYGKGLPMSSTERHPDIAGCNFEAMGVSLVIHPKNPHVPTSHANVRLFVAEREGKEPVWWFGGGFDLTPYYAVEEDCRDFHQVAQDLCKPFGADVYARFKGWCDEYFFIPYRNEARGIGGLFFDDLNEWPFEKCFEFVQAVGKGYMDAYIPIVNRRKNTPYTEQQVEFQEFRRGRYAEFNLVIDRGTKFGLQSGGRTESILISLPPRARWGYNWQPEPGTPEARLTEYFLTKRQWV
+>d1vk1a_ d.268.1.2 (A:) Hypothetical protein PF0380 {Pyrococcus furiosus [TaxId: 2261]}
+IPVKKVEYVFIELDKMKPHEQLVQRELEDFIESVTGSGIFWKPMLLAKIPGTDEYLIVDGHHRWAGLQKLGAKRAPSVILDYFDEGVKVYTWYPAFKGDVNKVIERLKAEGLEVIEDEKAEEKAEKGEIAFALIGEKSFAIPGGLEEQKKVSKVLDEMDQAKEIELVYYGLKEDAKADMEKGEIDYVFIRKAPTKEEVMELVKRGEVFSPKTTRHVLPFIPDKIDVKLEDLF
+>d1vk5a_ a.220.1.1 (A:) Hypothetical protein At3g22680 {Thale-cress (Arabidopsis thaliana) [TaxId: 3702]}
+GSLLRRAEMYQDYMKQVPIPTNRGSLIPFTSWVGLSISMKQLYGQPLHYLTNVLLQRWDQSRFGTDSEEQRLDSIIHPTKAEATIWLVEEIHRLTPSHLHMALLWRSDPMYHSFIDPIFPE
+>d1vkea_ a.152.1.2 (A:) Hypothetical protein TM1620 {Thermotoga maritima [TaxId: 2336]}
+KKFVEARRELNEKVLSRGTLNTKRFFNLDSAVYRPGKLDVKTKELMGLVASTVLRCDDCIRYHLVRCVQEGASDEEIFEALDIALVVGGSIVIPHLRRAVGFLEELREMEKNGETISL
+>d1vkfa_ c.1.29.1 (A:) Glycerol uptake operon antiterminator-related protein TM1436 {Thermotoga maritima [TaxId: 2336]}
+MFKGIIAALWDMDSIGEIEPDVVFLLKSDILNLKFHLKILKDRGKTVFVDMDFVNGLGEGEEAILFVKKAGADGIITIKPKNYVVAKKNGIPAVLRFFALDSKAVERGIEQIETLGVDVVEVLPGAVAPKVARKIPGRTVIAAGLVETEEEAREILKHVSAISTSSRILWKM
+>d1vkma_ c.138.1.1 (A:) Hypothetical protein TM1464 {Thermotoga maritima [TaxId: 2336]}
+KIHHHHHHVIIESRIEKGKPVVGMETTVFVHGLPRKEAIELFRRAKEISREKGFQLAVIGILKGKIVAGMSEEELEAMMREGADKVGTREIPIVVAEGKNAATTVSATIFLSRRIGIEVVVTGGTGGVHPGRVDVSQDLTEMSSSRAVLVSSGIKSILDVEATFEMLETLEIPLVGFRTNEFPLFFSRKSGRRVPRIENVEEVLKIYESMKEMELEKTLMVLNPVPEEYEIPHDEIERLLEKIELEVEGKEVTPFLLKKLVEMTNGRTLKANLALLEENVKLAGEIAVKLKR
+>d1vkya_ e.53.1.1 (A:) Queuosine biosynthesis protein queA {Thermotoga maritima [TaxId: 2336]}
+SEFDYELPPELIAQEPVEPRDASRLMVLHRKTQRIEHRIFREIIEYLEPGDLLVLNVSKVIPARLYARKKTGASIEILLIERLEEGIWKCLVRPGQKVKKGTELVIDEDLSAVCLGRGEDGTRILKFQPQDDRLIFEKGRTPLPPYIKNEVPLERYQTVYAKEEGSVAAPTAGLHFTPELIEKLKKKGVQFAEVVLHVGIGTFRPVKVEEVEKHKMHEEFYQVPKETVRKLRETRERGNRIVAVGTTTVRTLETIARLPEQEEYVGKTDLFIYPPFEFKLVDALVTNFHLPRSTLLMLVAAFAGKDFVMEAYREAVKRRYRFFSFGDAMLIL
+>d1vlpa1 d.41.2.2 (A:1-149) Nicotinate phosphoribosyltransferase, N-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MSEPVIKSLLDTDMYKITMHAAVFTNFPDVTVTYKYTNRSSQLTFNKEAINWLKEQFSYLGNLRFTEEEIEYLKQEIPYLPSAYIKYISSSNYKLHPEEQISFTSEEIEGKPTHYKLKILVSGSWKDTILYEIPLLSLISEAYFKFVDI
+>d1vlpa2 c.1.17.2 (A:150-415) Nicotinate phosphoribosyltransferase, C-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+DWDYENQLEQAEKKAETLFDNGIRFSEFGTRRRRSLKAQDLIMQGIMKAVNGNPDRNKSLLLGTSNILFAKKYGVKPIGTVAHEWVMGVASISEDYLHANKNAMDCWINTFGAKNAGLALTDTFGTDDFLKSFRPPYSDAYVGVRQDSGDPVEYTKKISHHYHDVLKLPKFSKIICYSDSLNVEKAITYSHAAKENGMLATFGIGTNFTNDFRKKSEPQVKSEPLNIVIKLLEVNGNHAIKISDNLGKNMGDPATVKRVKEELGYT
+>d1vlra2 d.246.1.1 (A:39-145) mRNA decapping enzyme DcpS N-terminal domain {Mouse (Mus musculus) [TaxId: 10090]}
+VRLPFSGFRVQKVLRESARDKIIFLHGKVNEDSGDTHGEDAVVILEKTPFQVEHVAQLLTGSPELKLQFSNDIYSTYNLFPPRHLSDIKTTVVYPATEKHLQKYMRQ
+>d1vlya1 b.44.2.1 (A:244-325) Hypothetical protein YgfZ, C-terminal domain {Escherichia coli [TaxId: 562]}
+NKRALWLLAGSASRLPEAGEDLELKMGENWRRTGTVLAAVKLEDGQVVVQVVMNNDMEPDSIFRVRDDANTLHIEPLPYSLE
+>d1vlya2 d.250.1.1 (A:3-243) Hypothetical protein YgfZ, N-terminal domain {Escherichia coli [TaxId: 562]}
+FTPFPPRQPTASARLPLTLMTLDDWALATITGADSEKYMQGQVTADVSQMAEDQHLLAAHCDAKGKMWSNLRLFRDGDGFAWIERRSVREPQLTELKKYAVFSKVTIAPDDERVLLGVAGFQARAALANLFSELPSKEKQVVKEGATTLLWFEHPAERFLIVTDEATANMLTDKLRGEAELNNSQQWLALNIEAGFPVIDAANSGQFIPQATNLQALGGISFKKGCYTGQEMVARAKFRGA
+>d1vmba_ d.58.14.1 (A:) Ribosomal protein S6 {Thermotoga maritima [TaxId: 2336]}
+KERIYESMFIIAPNVPEEERENLVERVKKIIEERVKGKIDKVERMGMRKFAYEIKKFNEGDYTVIYFRCDGQNLQELENFYRVTPEIIRWQTFRRFDLEKKERKAQR
+>d1vmha_ d.273.1.1 (A:) B.subtilis YugU ortolog CAC0907 {Clostridium acetobutylicum [TaxId: 1488]}
+VIEYSLKTSNDDQFIDITNLVKKAVDESGVSDGMAVVFCPHTTAGITINENADPDVTRDILVNLDKVFPKVGDYKHVEGNSHAHIKASLMGSSQQIIIENGKLKLGTWQGIYFTEFDGPRDRKVFVKII
+>d1vmoa_ b.77.1.1 (A:) Vitelline membrane outer protein-I (VMO-I) {Chicken (Gallus gallus) [TaxId: 9031]}
+RTREYTSVITVPNGGHWGKWGIRQFCHSGYANGFALKVEPSQFGRDDTALNGIRLRCLDGSVIESLVGKWGTWTSFLVCPTGYLVSFSLRSEKSQGGGDDTAANNIQFRCSDEAVLVGDGLSWGRFGPWSKRCKICGLQTKVESPQGLRDDTALNNVRFFCCK
+>d1vnsa_ a.111.1.3 (A:) Chloroperoxidase {Curvularia inaequalis [TaxId: 38902]}
+VTPIPLPKIDEPEEYNTNYILFWNHVGLELNRVTHTVGGPLTGPPLSARALGMLHLAIHDAYFSICPPTDFTTFLSPDTENAAYRLPSPNGANDARQAVAGAALKMLSSLYMKPVEQPNPNPGANISDNAYAQLGLVLDRSVLEAPGGVDRESASFMFGEDVADVFFALLNDPRGASQEGYHPTPGRYKFDDEPTHPVVLIPVDPNNPNGPKMPFRQYHAPFYGKTTKRFATQSEHFLADPPGLRSNADETAEYDDAVRVAIAMGGAQALNSTKRSPWQTAQGLYWAYDGSNLIGTPPRFYNQIVRRIAVTYKKEEDLANSEVNNADFARLFALVDVACTDAGIFSWKEKWEFEFWRPLSGVRDDGRPDHGDPFWLTLGAPATNTNDIPFKPPFPAYPSGHATFGGAVFQMVRRYYNGRVGTWKDDEPDNIAIDMMISEELNGVNRDLRQPYDPTAPIEDQPGIVRTRIVRHFDSAWELMFENAISRIFLGVHWRFDAAAARDILIPTTTKDVYAVDNNGATVFQNVEDIRYTTRGTREDEEGLFPIGGVPLGIEIADEIFNNGLKPTPPEIQP
+>d1vp7a_ a.7.13.1 (A:) Exonuclease VII small subunit XseB {Bordetella pertussis [TaxId: 520]}
+ARPLPQDFETALAELESLVSAMENGTLPLEQSLSAYRRGVELARVCQDRLAQAEQQVKVLEGDLLRPL
+>d1vp8a_ c.49.1.2 (A:) Hypothetical protein AF0103 {Archaeoglobus fulgidus [TaxId: 2234]}
+HMEKKIVYFNKPGRENTEETLRLAVERAKELGIKHLVVASSYGDTAMKALEMAEGLEVVVVTYHTGFVREGENTMPPEVEEELRKRGAKIVRQSHILSGLERSISRKLGGVSRTEAIAEALRSLFGHGLKVCVEITIMAADSGAIPIEEVVAVGGRSRGADTAVVIRPAHMNNFFDAEIKEIICMPRNKR
+>d1vpba_ d.283.1.1 (A:) Putative modulator of DNA gyrase BT3649 {Bacteroides thetaiotaomicron [TaxId: 818]}
+MITDENKKLAQWAMDYALKNGCQAAKVLLYSSSNTSFELRDAKMDRLQQASEGGLSLSLYVDGRYGSISTNRLNRKELETFIKNGIDSTRYLAKDEARVLADPSRYYKGGKPDLKLYDAKFASLNPDDKIEMAKAVAEEALGKDERIISVGSSYGDGEDFAYRLISNGFEGETKSTWYSLSADITIRGEGEARPSAYWYESSLYMNDLIKKGIGQKALERVLRKLGQKKVQSGKYTMVVDPMNSSRLLSPMISALNGSALQQKNSFLLNKLNEKIASDRLTLTDEPHLVKASGARYFDNEGIATERRSIFDKGVLNTYFIDTYNAKKMGVDPTISGSSILVMETGDKNLDGLIAGVEKGILVTGFNGGNNNSSTGDFSYGIEGFLIENGKLTQPVSEMNVTGNLITLWNSLVATGNDPRLNSSWRIPSLVFEGVDFSGL
+>d1vpda1 a.100.1.1 (A:164-296) Hydroxyisobutyrate dehydrogenase {Salmonella typhimurium [TaxId: 90371]}
+DIGAGNVTKLANQVIVALNIAAMSEALTLATKAGVNPDLVYQAIRGGLAGSTVLDAKAPMVMDRNFKPGFRIDLHIKDLANALDTSHGVGAQLPLTAAVMEMMQALRADGHGNDDHSALACYYEKLAKVEVTR
+>d1vpqa_ c.1.32.1 (A:) Hypothetical protein TM1631 {Thermotoga maritima [TaxId: 2336]}
+HMVYVGTSGFSFEDWKGVVYPEHLKPSQFLKYYWAVLGFRIVELNFTYYTQPSWRSFVQMLRKTPPDFYFTVKTPGSVTHVLWKEGKDPKEDMENFTRQIEPLIEEQRLKMTLAQFPFSFKFSRKNVEYLEKLRESYPYELAVEFRHYSWDREETYEFLRNHGITFVVVDEPKLPGLFPYRPITTTDYAYFRFHGRNERWFEAEGEERYDYLYSEEELKTLFEDVVELSRRVKETYVFFNNCYKGQAAINALQFKKMLEE
+>d1vpsa_ b.121.6.1 (A:) Polyomavirus coat proteins {Murine polyomavirus, strain small-plaque 16 [TaxId: 10634]}
+GGMEVLDLVTGPDSVTEIEAFLNPRMGQPPTPESLTEGGQYYGWSRGINLATSDTEDSPGNNTLPTWSMAKLQLPMLNEDLTCDTLQMWEAVSVKTEVVGSGSLLDVHGFNKPTDTVNTKGISTPVEGSQYHVFAVGGEPLDLQGLVTDARTKYKEEGVVTIKTITKKDMVNKDQVLNPISKAKLDKDGMYPVEIWHPDPAKNENTRYFGNYTGGTTTPPVLQFTNTLTTVLLDENGVGPLCKGEGLYLSCVDIMGWRVTRNYDVHHWRGLPRYFKITLRKRWVK
+>d1vq811 g.41.8.2 (1:1-56) Ribosomal protein L37e {Haloarcula marismortui [TaxId: 2238]}
+TGAGTPSQGKKNTTTHTKCRRCGEKSYHTKKKVCSSCGFGKSAKRRDYEWQSKAGE
+>d1vq821 a.137.1.1 (2:1-49) Ribosomal protein L39e {Haloarcula marismortui [TaxId: 2238]}
+GKKSKATKKRLAKLDNQNSRVPAWVMLKTDREVQRNHKRRHWRRNDTDE
+>d1vq8h1 d.41.4.1 (H:1-163) Ribosomal protein L10e {Haloarcula marismortui [TaxId: 2238]}
+KPASMYRDIDKPAYTRREYITGIPGSKIAQHKMGRKQKDADDYPVQISLIVEETVQLRHGSLEASRLSANRHLIKELGEEGDYKMTLRKFPHQVLRENKQATGAGADRVSDGMRAAFGKIVGTAARVQAGEQLFTAYCNVEDAEHVKEAFRRAYNKITPSCRI
+>d1vq8l1 c.12.1.1 (L:1-150) Ribosomal protein L15 (L15p) {Haloarcula marismortui [TaxId: 2238]}
+TSKKKRQRGSRTHGGGSHKNRRGAGHRGGRGDAGRDKHEFHNHEPLGKSGFKRPQKVQEEAATIDVREIDENVTLLAADDVAEVEDGGFRVDVRDVVEEADDADYVKVLGAGQVRHELTLIADDFSEGAREKVEGAGGSVELTDLGEERQ
+>d1vq8n1 c.55.4.1 (N:1-186) Ribosomal protein L18 (L18p) {Haloarcula marismortui [TaxId: 2238]}
+ATGPRYKVPMRRRREARTDYHQRLRLLKSGKPRLVARKSNKHVRAQLVTLGPNGDDTLASAHSSDLAEYGWEAPTGNMPSAYLTGLLAGLRAQEAGVEEAVLDIGLNSPTPGSKVFAIQEGAIDAGLDIPHNDDVLADWQRTRGAHIAEYDEQLEEPLYSGDFDAADLPEHFDELRETLLDGDIEL
+>d1vq8p1 a.94.1.1 (P:1-143) Ribosomal protein L19 (L19e) {Haloarcula marismortui [TaxId: 2238]}
+TDLSAQKRLAADVLDVGKNRVWFNPERQGDIADAITREDVRELVDEGAIQAKDKKGNSRGRARERQKKRAYGHQKGAGSRKGKAGARQNSKEDWESRIRAQRTKLRELRDEGTLSSSQYRDLYDKAGGGEFDSVADLERYIDA
+>d1vq8v1 a.2.2.1 (V:1-65) Ribosomal protein L29 (L29p) {Haloarcula marismortui [TaxId: 2238]}
+TVLHVQEIRDMTPAEREAELDDLKTELLNARAVQAAGGAPENPGRIKELRKAIARIKTIQGEEGD
+>d1vq8x1 d.29.1.1 (X:7-88) Ribosomal protein L31e {Haloarcula marismortui [TaxId: 2238]}
+ERVVTIPLRDARAEPNHKRADKAMILIREHLAKHFSVDEDAVRLDPSINEAAWARGRANTPSKIRVRAARFEEEGEAIVEAE
+>d1vq8y1 c.9.2.1 (Y:95-236) Ribosomal protein L32e {Haloarcula marismortui [TaxId: 2238]}
+TELQARGLTEKTPDLSDEDARLLTQRHRVGKPQFNRQDHHKKKRVSTSWRKPRGQLSKQRRGIKGKGDTVEAGFRSPTAVRGKHPSGFEEVRVHNVDDLEGVDGDTEAVRIASKVGARKRERIEEEAEDAGIRVLNPTYVEV
+>d1vqqa2 d.175.1.1 (A:139-327) Penicillin binding protein 2a (PBP2A), middle domain {Staphylococcus aureus [TaxId: 1280]}
+DQSIHIENLKSERGKILDRNNVELANTGTAYEIGIVPKNVSKKDYKAIAKELSISEDYIKQQMDQNWVQDDTFVPLKTVKKMDEYLSDFAKKFHLTTNETESRNYPLEKATSHLLGYVGPINSEELKQKEYKGYKDDAVIGKKGLEKLYDKKLQHEDGYRVTIVDDNSNTIAHTLIEKKKKDGKDIQLT
+>d1vr0a1 c.148.1.1 (A:1-235) 2-phosphosulfolactate phosphatase ComB {Clostridium acetobutylicum [TaxId: 1488]}
+MKIDLIISADDIKEEKVKNKTAVVIDMLRATSVITTALNNGCKRVVPVLTVEEALKKVKEYGKDAILGGERKGLKIEGFDFSNSPMEYTEDVVKGKTLIMTTTNGTRAIKGSETARDILIGSVLNGEAVAEKIVELNNDVVIVNAGTYGEFSIDDFICSGYIINCVMDRMKKLELTDAATTAQYVYKTNEDIKGFVKYAKHYKRIMELGLKKDFEYCCKKDIVKLVPQYTNGEIL
+>d1vr4a1 d.230.5.1 (A:1-103) Hypothetical protein BC1012 {Bacillus cereus [TaxId: 1396]}
+MIVTTTSGIQGKEIIEYIDIVNGEAIMGANIVRDLFASVRDVVGGRAGSYESKLKEARDIAMDEMKELAKQKGANAIVGVDVDYEVVRDGMLMVAVSGTAVRI
+>d1vr7a_ d.156.1.2 (A:) automated matches {Thermotoga maritima [TaxId: 2336]}
+KSLGRHLVAEFYECDREVLDNVQLIEQEMKQAAYESGATIVTSTFHRFLPYGVSGVVVISESHLTIHTWPEYGYAAIDLFTCGEDVDPWKAFEHLKKALKAKRVHVVEHERGRYDEIGIP
+>d1vr8a1 d.312.1.1 (A:25-154) Hypothetical protein TM1622 {Thermotoga maritima [TaxId: 2336]}
+PPEAYSLDTAIFVLETRDYRLSDVKEIDSYGDVEMKGKVAVFETEYGPVFLYVYKGEEAKKIWKKLNGRAGFVSIRSVLDLPNMGKFSTVSNGKKIVAWWRKNWLFIVEGKNGVEEFVKHVYRVYEEMKQ
+>d1vrma1 d.96.2.1 (A:44-352) Hypothetical protein TM1553 {Thermotoga maritima [TaxId: 2336]}
+QYYELRDFALGTSVRIVVSSQKINPRTIAEAILEDMKRITYKFSFTDERSVVKKINDHPNEWVEVDEETYSLIKAACAFAELTDGAFDPTVGRLLELWGFTGNYENLRVPSREEIEEALKHTGYKNVLFDDKNMRVMVKNGVKIDLGGIAKGYALDRARQIALSFDENATGFVEAGGDVRIIGPKFGKYPWVIGVKDPRGDDVIDYIYLKSGAVATSGDYERYFVVDGVRYHHILDPSTGYPARGVWSVTIIAEDATTADALSTAGFVMAGKDWRKVVLDFPNMGAHLLIVLEGGAIERSETFKLFERE
+>d1vyia_ d.293.1.1 (A:) Phosphoprotein M1, C-terminal domain {Rabies virus, strain CVS-11 [TaxId: 11292]}
+WSATNEEDDLSVEAEIAHQIAESFSKKYKFPSRSSGIFLYNFEQLKMNLDDIVKEAKNVPGVTRLAHDGSKIPLRCVLGWVALANSKKFQLLVEADKLSKIMQDDLNRYTS
+>d1vyra_ c.1.4.1 (A:) Pentaerythritol tetranirate reductase {Enterobacter cloacae [TaxId: 550]}
+AEKLFTPLKVGAVTAPNRVFMAPLTRLRSIEPGDIPTPLMGEYYRQRASAGLIISEATQISAQAKGYAGAPGLHSPEQIAAWKKITAGVHAEDGRIAVQLWHTGRISHSSIQPGGQAPVSASALNANTRTSLRDENGNAIRVDTTTPRALELDEIPGIVNDFRQAVANAREAGFDLVELHSAHGYLLHQFLSPSSNQRTDQYGGSVENRARLVLEVVDAVCNEWSADRIGIRVSPIGTFQNVDNGPNEEADALYLIEELAKRGIAYLHMSETDLAGGKPYSEAFRQKVRERFHGVIIGAGAYTAEKAEDLIGKGLIDAVAFGRDYIANPDLVARLQKKAELNPQRPESFYGGGAEGYTDYPSL
+>d1vzma_ g.32.1.0 (A:) automated matches {Argyrosomus regius [TaxId: 172269]}
+KELTLAQTESLREVCETNMACDEMADAQGIVAAYQAFYGPIPF
+>d1vzya1 d.193.1.1 (A:1-233) Heat shock protein 33, Hsp33 {Bacillus subtilis [TaxId: 1423]}
+MDYLVKALAYDGKVRAYAARTTDMVNEGQRRHGTWPTASAALGRTMTASLMLGAMLKGDDKLTVKIEGGGPIGAIVADANAKGEVRAYVSNPQVHFDLNAAGKLDVRRAVGTNGTLSVVKDLGLREFFTGQVEIVSGELGDDFTYYLVSSEQVPSSVGVGVLVNPDNTILAAGGFIIQLMPGTDDETITKIEQRLSQVEPISKLIQKGLTPEEILEEVLGEKPEILETMPVRF
+>d1vzya2 g.81.1.1 (A:234-290) HSP33, C-terminal domain {Bacillus subtilis [TaxId: 1423]}
+HCPCSKERFETAILGLGKKEIQDMIEEDGQAEAVCHFCNEKYLFTKEELEGLRDQTT
+>d1w0na_ b.18.1.28 (A:) Endo-1,4-beta-xylanase D {Paenibacillus polymyxa [TaxId: 1406]}
+ITKVEAENMKIGGTYAGKISAPFDGVALYANADYVSYSQYFANSTHNISVRGASSNAGTAKVDLVIGGVTVGSFNFTGKTPTVQTLSNITHATGDQEIKLALTSDDGTWDAYVDFIEFSL
+>d1w23a_ c.67.1.4 (A:) Phosphoserine aminotransferase, PSAT {Bacillus alcalophilus [TaxId: 1445]}
+VKQVFNFNAGPSALPKPALERAQKELLNFNDTQMSVMELSHRSQSYEEVHEQAQNLLRELLQIPNDYQILFLQGGASLQFTMLPMNLLTKGTIGNYVLTGSWSEKALKEAKLLGETHIAASTKANSYQSIPDFSEFQLNENDAYLHITSNNTIYGTQYQNFPEINHAPLIADMSSDILSRPLKVNQFGMIYAGAQKNLGPSGVTVVIVKKDLLNTKVEQVPTMLQYATHIKSDSLYNTPPTFSIYMLRNVLDWIKDLGGAEAIAKQNEEKAKIIYDTIDESNGFYVGHAEKGSRSLMNVTFNLRNEELNQQFLAKAKEQGFVGLNGHRSVGGCRASIYNAVPIDACIALRELMIQFKENA
+>d1w53a_ a.186.1.2 (A:) Phosphoserine phosphatase RsbU, N-terminal domain {Bacillus subtilis [TaxId: 1423]}
+MDFREVIEQRYHQLLSRYIAELTETSLYQAQKFSRKTIEHQIPPEEIISIHRKVLKELYPSLPEDVFHSLDFLIEVMIGYGMAY
+>d1w66a1 d.104.1.3 (A:1-216) Lipoyltransferase LipB {Mycobacterium tuberculosis [TaxId: 1773]}
+MAGSIRSKLSAIDVRQLGTVDYRTAWQLQRELADARVAGGADTLLLLEHPAVYTAGRRTETHERPIDGTPVVDTDRGGKITWHGPGQLVGYPIIGLAEPLDVVNYVRRLEESLIQVCADLGLHAGRVDGRSGVWLPGRPARKVAAIGVRVSRATTLHGFALNCDCDLAAFTAIVPCGISDAAVTSLSAELGRTVTVDEVRATVAAAVCAALDGVLP
+>d1w6sa_ b.70.1.1 (A:) Methanol dehydrogenase, heavy chain {Methylobacterium extorquens [TaxId: 408]}
+NDKLVELSKSDDNWVMPGKNYDSNNFSDLKQINKGNVKQLRPAWTFSTGLLNGHEGAPLVVDGKMYIHTSFPNNTFALGLDDPGTILWQDKPKQNPAARAVACCDLVNRGLAYWPGDGKTPALILKTQLDGNVAALNAETGETVWKVENSDIKVGSTLTIAPYVVKDKVIIGSSGAELGVRGYLTAYDVKTGEQVWRAYATGPDKDLLLASDFNIKNPHYGQKGLGTGTWEGDAWKIGGGTNWGWYAYDPGTNLIYFGTGNPAPWNETMRPGDNKWTMTIFGRDADTGEAKFGYQKTPHDEWDYAGVNVMMLSEQKDKDGKARKLLTHPDRNGIVYTLDRTDGALVSANKLDDTVNVFKSVDLKTGQPVRDPEYGTRMDHLAKDICPSAMGYHNQGHDSYDPKRELFFMGINHICMDWEPFMLPYKAGQFFVGATLNMYPGPKGDRQNYEGLGQIKAYNAITGDYKWEKMERFAVWGGTMATAGDLVFYGTLDGYLKARDSDTGDLLWKFKIPSGAIGYPMTYTHKGTQYVAIYYGVGGWPGVGLVFDLADPTAGLGAVGAFKKLANYTQMGGGVVVFSLDGKGPYDDPNVGEWKS
+>d1w6sb_ a.137.2.1 (B:) Methanol dehydrogenase, light chain {Methylobacterium extorquens [TaxId: 408]}
+YDGTKCKAAGNCWEPKPGFPEKIAGSKYDPKHDPKELNKQADSIKQMEERNKKRVENFKKTGKFEYDVAKISA
+>d1w7ca1 b.30.2.1 (A:316-775) Lysyl oxidase PplO, domain 3 {Yeast (Pichia pastoris) [TaxId: 4922]}
+HLDDRKSPRLVEPEGRRWAYDGDEEYFSWMDWGFYTSWSRDTGISFYDITFKGERIVYELSLQELIAEYGSDDPFNQHTFYSDISYGVGNRFSLVPGYDCPSTAGYFTTDTFEYDEFYNRTLSYCVFENQEDYSLLRHTGASYSAITQNPTLNVRFISTIGNYDYNFLYKFFLDGTLEVSVRAAGYIQAGYWNPETSAPYGLKIHDVLSGSFHDHVLNYKVDLDVGGTKNRASQYVMKDVDVEYPWAPGTVYNTKQIAREVFENEDFNGINWPENGQGILLIESAEETNSFGNPRAYNIMPGGGGVHRIVKNSRSGPETQNWARSNLFLTKHKDTELRSSTALNTNALYDPPVNFNAFLDDESLDGEDIVAWVNLGLHHLPNSNDLPNTIFSTAHASFMLTPFNYFDSENSRDTTQQVFYTYDDETEESNWEFYGNDWSSCGVEVAEPNFEDYTYGRGTR
+>d1w7ca2 d.17.2.1 (A:43-169) Lysyl oxidase PplO, domains 1 and 2 {Yeast (Pichia pastoris) [TaxId: 4922]}
+AECVSNENVEIEAPKTNIWTSLAKEEVQEVLDLLHSTYNITEVTKADFFSNYVLWIETLKPNKTEALTYLDEDGDLPPRNARTVVYFGEGEEGYFEELKVGPLPVSDETTIEPLSFYNTNGKSKLPF
+>d1w85i_ a.9.1.1 (I:) E3/E1 binding domain of dihydrolipoyl acetyltransferase {Bacillus stearothermophilus [TaxId: 1422]}
+RVIAMPSVRKYAREKGVDIRLVQGTGKNGRVLKEDIDAFLAG
+>d1wb9a1 a.113.1.1 (A:270-566) DNA repair protein MutS, domain III {Escherichia coli [TaxId: 562]}
+DAATRRNLEITQNLAGGAENTLASVLDCTVTPMGSRMLKRWLHMPVRDTRVLLERQQTIGALQDFTAGLQPVLRQVGDLERILARLALRTARPRDLARMRHAFQQLPELRAQLETVDSAPVQALREKMGEFAELRDLLERAIIDTPPVLVRDGGVIASGYNEELDEWRALADGATDYLERLEVRERERTGLDTLKVGFNAVHGYYIQISRGQSHLAPINYMRRQTLKNAERYIIPELKEYEDKVLTSKGKALALEKQLYEELFDLLLPHLEALQQSASALAELDVLVNLAERAYTLN
+>d1wb9a3 c.55.6.1 (A:117-269) DNA repair protein MutS, domain II {Escherichia coli [TaxId: 562]}
+GTISDEALLQERQDNLLAAIWQDSKGFGYATLDISSGRFRLSEPADRETMAAELQRTNPAELLYAEDFAEMSLIEGRRGLRRRPLWEFEIDTARQQLNLQFGTRDLVGFGVENAPRGLCAAGCLLQYAKDTQRTTLPHIRSITMEREQDSIIM
+>d1wb9a4 d.75.2.1 (A:2-116) DNA repair protein MutS, domain I {Escherichia coli [TaxId: 562]}
+SAIENFDAHTPMMQQYLRLKAQHPEILLFYRMGDFYTLFYDDAKRASQLLDISLTKRGASAGEPIPMAGIPYHAVENYLAKLVNQGESVAICEQIGDPATSKGPVERKVVRIVTP
+>d1wbea_ a.224.1.1 (A:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+EHLLRPLPADKQIETGPFLEAVSHLPPFFDCLGSPVFTPIKADISGNITKIKAVYDTNPTKFRTLQNILEVEKEMYGAEWPKVGATLALMWLKRGLRFIQVFLQSICDGERDENHPNLIRVNATKAYEMALKKYHGWIVQKIFQAALYAAPYKSDFLKALSKGQNVTEEECLEKVRLFLVNYTATIDVIYEMYTRMNAELNYKV
+>d1wc2a1 b.52.1.1 (A:1-180) Endoglucanase (CMCase) {Blue mussel (Mytilus edulis) [TaxId: 6550]}
+NQKCSGNPRRYNGKSCASTTNYHDSHKGACGCGPASGDAQFGWNAGSFVAAASQMYFDSGNKGWCGQHCGQCIKLTTTGGYVPGQGGPVREGLSKTFMITNLCPNIYPNQDWCNQGSQYGGHNKYGYELHLDLENGRSQVTGMGWNNPETTWEVVNCDSEHNHDHRTPSNSMYGQCQCAH
+>d1wcwa_ c.113.1.1 (A:) automated matches {Thermus thermophilus [TaxId: 274]}
+AVRVAYAGLRRKEAFKALAEKLGFTPLLFPVQATEKVPVPEYRDQVRALAQGVDLFLATTGVGVRDLLEAGKALGLDLEGPLAKAFRLARGAKAARALKEAGLPPHAVGDGTSKSLLPLLPQGRGVAALQLYGKPLPLLENALAERGYRVLPLMPYRHLPDPEGILRLEEALLRGEVDALAFVAAIQVEFLFEGAKDPKALREALNTRVKALAVGRVTADALREWGVKPFYVDETERLGSLLQGFKRALQKEVA
+>d1wd3a2 b.42.8.1 (A:338-499) Alpha-L-arabinofuranosidase B (AbfB), C-terminal domain {Aspergillus kawachii [TaxId: 40384]}
+LVSGPSFTSGEVVSLRVTTPGYTTRYIAHTDTTVNTQVVDDDSSTTLKEEASWTVVTGLANSQCFSFESVDTPGSYIRHYNFELLLNANDGTKQFHEDATFCPQAALNGEGTSLRSWSYPTRYFRHYENVLYAASNGGVQTFDSKTSFNNDVSFEIETAFAS
+>d1wdda1 c.1.14.1 (A:151-475) Ribulose 1,5-bisphosphate carboxylase-oxygenase {Rice (Oryza sativa) [TaxId: 4530]}
+PPHGIQVERDKLNKYGRPLLGCTIKPKLGLSAKNYGRACYECLRGGLDFTKDDENVNSQPFMRWRDRFVFCAEAIYKSQAETGEIKGHYLNATAGTCEEMIKRAVFARELGVPIVMHDYLTGGFTANTSLAHYCRDNGLLLHIHRAMHAVIDRQKNHGMHFRVLAKALRMSGGDHIHAGTVVGKLEGEREMTLGFVDLLRDDFIEKDRARGIFFTQDWVSMPGVIPVASGGIHVWHMPALTEIFGDDSVLQFGGGTLGHPWGNAPGAAANRVALEACVQARNEGRDLAREGNEIIRSACKWSPELAAACEIWKAIKFEFEPVDKL
+>d1wdda2 d.58.9.1 (A:11-150) Ribulose 1,5-bisphosphate carboxylase-oxygenase {Rice (Oryza sativa) [TaxId: 4530]}
+VGFKAGVKDYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAAESSTGTWTTVWTDGLTSLDRYKGRCYHIEPVVGEDNQYIAYVAYPLDLFEEGSVTNMFTSIVGNVFGFKALRALRLEDLRIPPTYSKTFQG
+>d1wdds_ d.73.1.1 (S:) Ribulose 1,5-bisphosphate carboxylase-oxygenase {Rice (Oryza sativa) [TaxId: 4530]}
+MQVWPIEGIKKFETLSYLPPLTVEDLLKQIEYLLRSKWVPCLEFSKVGFVYRENHRSPGYYDGRYWTMWKLPMFGCTDATQVLKELEEAKKAYPDAFVRIIGFDNVRQVQLISFIAYKPPGC
+>d1weha_ c.129.1.1 (A:) Hypothetical protein TT1887 (TTHA0294) {Thermus thermophilus [TaxId: 274]}
+MRLLAVFVSSRLSPEDPLYARWVRYGEVLAEEGFGLACGGYQGGMEALARGVKAKGGLVVGVTAPAFFPERRGPNPFVDLELPAATLPQRIGRLLDLGAGYLALPGGVGTLAELVLAWNLLYLRRGVGRPLAVDPYWLGLLKAHGEIAPEDVGLLRVVADEEDLRRFLRSL
+>d1whia_ b.39.1.1 (A:) Ribosomal protein L14 {Bacillus stearothermophilus [TaxId: 1422]}
+MIQQESRLKVADNSGAREVLVIKVLGGSGRRYANIGDVVVATVKDATPGGVVKKGQVVKAVVVRTKRGVRRPDGSYIRFDENACVIIRDDKSPRGTRIFGPVARELRDKDFMKIISLAPEVI
+>d1whza_ d.50.3.2 (A:) Hypothetical protein TTHA1913 {Thermus thermophilus [TaxId: 274]}
+MWMPPRPEEVARKLRRLGFVERMAKGGHRLYTHPDGRIVVVPFHSGELPKGTFKRILRDAGLTEEEFHNL
+>d1wj9a1 d.58.53.1 (A:1-87) Hypothetical protein TTHB192 {Thermus thermophilus [TaxId: 274]}
+MWLTKLVLNPASRAARRDLANPYEMHRTLSKAVSRALEEGRERLLWRLEPARGLEPPVVLVQTLTEPDWSVLDEGYAQVFPPKPFHP
+>d1wjxa_ b.111.1.1 (A:) Small protein B (SmpB) {Thermus thermophilus [TaxId: 274]}
+VLENRRARHDYEILETYEAGIALKGTEVKSLRAGKVDFTGSFARFEDGELYLENLYIAPYEKGSYANVDPRRKRKLLLHKHELRRLLGKVEQKGLTLVPLKIYFNERGYAKVLLGLARGK
+>d1wkaa1 b.51.1.1 (A:195-337) Valyl-tRNA synthetase (ValRS) {Thermus thermophilus [TaxId: 274]}
+GKLYTLRYEVEGGGFIEIATVRPETVFADQAIAVHPEDERYRHLLGKRARIPLTEVWIPILADPAVEKDFGTGALKVTPAHDPLDYEIGERHGLKPVSVINLEGRMEGERVPEALRGLDRFEARRKAVELFREAGHLVKEEDY
+>d1wlga_ b.152.1.1 (A:) Flagellar hook protein flgE {Salmonella typhimurium [TaxId: 90371]}
+GLDVAISQNGFFRLVDSNGSVFYSRNGQFKLDENRNLVNMQGMQLTGYPATGTPPTIQQGANPAPITIPNTLMAAKSTTTASMQINLNSTDPVPSKTPFSVSDADSYNKKGTVTVYDSQGNAHDMNVYFVKTKDNEWAVYTHDSSDPAATAPTTASTTLKFNENGILESGGTVNITTGTINGATAATFSLSFLNSMQQNTGANNIVATNQNGYKPGDLVSYQINNDGTVVGNYSNEQEQVLGQIVLANFANNEGLASQGDNVWAATQASGVALLGTAGSGNFGKLTNGALEAS
+>d1wmib1 a.137.13.1 (B:7-67) Hypothetical protein PHS014 {Pyrococcus horikoshii [TaxId: 53953]}
+GDVLKELERLKVEIQRLEAMLMPEERDEDITEEEIAELLELARDEDPENWIDAEELPEPED
+>d1wn2a_ c.131.1.0 (A:) automated matches {Pyrococcus horikoshii [TaxId: 70601]}
+MFKYKQVIVARADLKLSKGKLAAQVAHGAVTAAFEAYKKKREWFEAWFREGQKKVVVKVESEEELFKLKAEAEKLGLPNALIRDAGLTEIPPGTVTVLAVGPAPEEIVDKVTGNLKLL
+>d1wnaa_ d.319.1.1 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+MVRVGMRAAPRVSLEALKAALGGLKLSEAKVYLITDWQDKRDQARYALLLHTGKKDLLVPDAFGPAFPGGEEALSELVGLLLAQGARRFYEAVVSPGEMTALLDLPPEELLKRVMAIANPTDPGIYL
+>d1wp5a_ b.68.10.1 (A:) Topoisomerase IV subunit A, ParC, C-terminal domain {Bacillus stearothermophilus [TaxId: 1422]}
+MVASEDVIVTVTKDGYVKRTSLRSYAASNGQDFAMKDTDRLLAMLEMNTKDVLLLFTNKGNYLYCPVHELPDIRWKDLGQHIANIIPIDRDEEIIKAIPINDFELNGYFLFVTRNGMVKKTELKHYKAQRYSKPLTGINLKNDDQVVDVHLTDGMNELFLVTHNGYALWFDESEVSIVGVRAAGVKGMNLKEGDYIVSGQLITSKDESIVVATQRGAVKKMKLTEFEKATRAKRGVVILRELKANPHRISGFVVAQDSDTIYLQTEKSFIETIKVGDIRFSDRYSNGSFVLDEEENGRVISVWKVEAEDKTEKLAAALEHHHH
+>d1wpba_ a.233.1.1 (A:) Hypothetical protein YfbU {Escherichia coli [TaxId: 562]}
+QESTMEMTNAQRLILSNQYKMMTMLDPANAERYRRLQTIIERGYGLQMRELDREFGELKEETCRTIIDIMEMYHALHVSWSNLQDQQSIDERRVTFLGFDAATEARYLGYVRFMVNVEGRYTHFDAGTHGFNAQTPMWEKYQRMLNVWHACPRQYHLSANEINQIINA
+>d1wpga1 b.82.7.1 (A:125-239) Calcium ATPase, transduction domain A {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+EMGKVYRADRKSVQRIKARDIVPGDIVEVAVGDKVPADIRILSIKSTTLRVDQSILTGESVSVIKHTEPVPDPRAVNQDKKNMLFSGTNIAAGKALGIVATTGVSTEIGKIRDQM
+>d1wpga3 d.220.1.1 (A:361-599) Calcium ATPase {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+MSVCKMFIIDKVDGDFCSLNEFSITGSTYAPEGEVLKNDKPIRSGQFDGLVELATICALCNDSSLDFNETKGVYEKVGEATETALTTLVEKMNVFNTEVRNLSKVERANACNSVIRQLMKKEFTLEFSRDRKSMSVYCSPAKSSRAAVGNKMFVKGAPEGVIDRCNYVRVGTTRVPMTGPVKEKILSVIKEWGTGRDTLRCLALATRDTPPKREEMVLDDSSRFMEYETDLTFVGVVGM
+>d1wpna_ c.107.1.1 (A:) Manganese-dependent inorganic pyrophosphatase (family II) {Bacillus subtilis [TaxId: 1423]}
+EKILIFGHQNPDTDTICSAIAYADLKNKLGFNAEPVRLGQVNGETQYALDYFKQESPRLVETAANEVNGVILVDHNERQQSIKDIEEVQVLEVIDHHRIANFETAEPLYYRAEPVGCTATILNKMYKENNVKIEKEIAGLMLSAIISDSLLFKSPTCTDQDVAAAKELAEIAGVDAEEYGLNMLKAG
+>d1wpua_ d.275.1.1 (A:) automated matches {Bacillus subtilis [TaxId: 1423]}
+TLHKERRIGRLSVLLLLNEAEESTQVEELERDGWKVCLGKVGSMDAHKVIAAIETASKKSGVIQSEGYRESHALYHATMEALHGVTRGEMLLGSLLRTVGLRFAVLRGNPYESEAEGDWIAVSLYGTIGAPIKGLEHETFGVGINHI
+>d1wqga_ d.67.3.1 (A:) automated matches {Mycobacterium tuberculosis [TaxId: 1773]}
+IDEALFDAEEKMEKAVAVARDDLSTIRTGRANPGMFSRITIDYYGAATPITQLASINVPEARLVVIKPYEANQLRAIETAIRNSDLGVNPTNDGALIRVAVPQLTEERRRELVKQAKHKGEEAKVSVRNIRRKAMEELHRIRKEGEAGEDEVGRAEKDLDKTTHQYVTQIDELVKHKEGELLEV
+>d1wqjb1 g.3.9.1 (B:3-82) Insulin-like growth factor-binding protein 4 {Human (Homo sapiens) [TaxId: 9606]}
+AIHCPPCSEEKLARCRPPVGCEELVREPGCGCCATCALGLGMPCGVYTPRCGSGLRCYPPRGVEKPLHTLMHGQGVCMEL
+>d1wu9a1 a.245.1.1 (A:191-249) Microtubule-associated protein EB1, C-terminal dimerization domain {Human (Homo sapiens) [TaxId: 9606]}
+DEAAELMQQVNVLKLTVEDLEKERDFYFGKLRNIELICQENEGENDPVLQRIVDILYAT
+>d1wuba_ b.61.6.1 (A:) Polyisoprenoid-binding protein TTHA0802 (TT1927B) {Thermus thermophilus [TaxId: 274]}
+MKWNLDPSHTSIDFKVRHMGIASVRGSLKVLSGSVETDEAGRPIQVEAVIDAASIATGEPQRDGHLRSADFLHAEQYPEIRFVSTQIEPLGGNRYRIQGNLTIRDITKPVTLEAEVSAPIKDPWGMQRVAASASGQINRKDWNLTWNQVLELGALLVGEEVKFNLEVEAVAPAPVA
+>d1wuil_ e.18.1.1 (L:) automated matches {Desulfovibrio vulgaris [TaxId: 883]}
+SSYSGPIVVDPVTRIEGHLRIEVEVENGKVKNAYSSSTLFRGLEIILKGRDPRDAQHFTQRTCGVCTYTHALASTRCVDNAVGVHIPKNATYIRNLVLGAQYLHDHIVHFYHLHALDFVDVTAALKADPAKAAKVASSISPRKTTAADLKAVQDKLKTFVETGQLGPFTNAYFLGGHPAYYLDPETNLIATAHYLEALRLQVKAARAMAVFGAKNPHTQFTVVGGVTCYDALTPQRIAEFEALWKETKAFVDEVYIPDLLVVAAAYKDWTQYGGTDNFITFGEFPKDEYDLNSRFFKPGVVFKRDFKNIKPFDKMQIEEHVRHSWYEGAEARHPWKGQTQPKYTDLHGDDRYSWMKAPRYMGEPMETGPLAQVLIAYSQGHPKVKAVTDAVLAKLGVGPEALFSTLGRTAARGIETAVIAEYVGVMLQEYKDNIAKGDNVICAPWEMPKQAEGVGFVNAPRGGLSHWIRIEDGKIGNFQLVVPSTWTLGPRCDKNKLSPVEASLIGTPVADAKRPVEILRTVHSFDPCIACGVH
+>d1wuis_ e.19.1.1 (S:) automated matches {Desulfovibrio vulgaris [TaxId: 883]}
+LMGPRRPSVVYLHNAECTGCSESVLRAFEPYIDTLILDTLSLDYHETIMAAAGDAAEAALEQAVNSPHGFIAVVEGGIPTAANGIYGKVANHTMLDICSRILPKAQAVIAYGTCATFGGVQAAKPNPTGAKGVNDALKHLGVKAINIAGCPPNPYNLVGTIVYYLKNKAAPELDSLNRPTMFFGQTVHEQCPRLPHFDAGEFAPSFESEEARKGWCLYELGCKGPVTMNNCPKIKFNQTNWPVDAGHPCIGCSEPDFWDAMTPFYQN
+>d1wvfa1 d.58.32.1 (A:243-521) Flavoprotein subunit of p-cresol methylhydroxylase {Pseudomonas putida [TaxId: 303]}
+PVFKPFEVIFEDEADIVEIVDALRPLRMSNTIPNSVVIASTLWEAGSAHLTRAQYTTEPGHTPDSVIKQMQKDTGMGAWNLYAALYGTQEQVDVNWKIVTDVFKKLGKGRIVTQEEAGDTQPFKYRAQLMSGVPNLQEFGLYNWRGGGGSMWFAPVSEARGSECKKQAAMAKRVLHKYGLDYVAEFIVAPRDMHHVIDVLYDRTNPEETKRADACFNELLDEFEKEGYAVYRVNTRFQDRVAQSYGPVKRKLEHAIKRAVDPNNILAPGRSGIDLNNDF
+>d1wvqa_ d.256.1.0 (A:) automated matches {Pyrobaculum aerophilum [TaxId: 13773]}
+SIKFELIDVPIPQGTNVIIGQAHFIKTVEDLYEALVTSVPGVKFGIAFCEASGKRLVRHEANDEELRNLAIDLCKKIAAGHVFVIYIRNAWPINVLNAIKNVPEVVRIFAATANPLKVIVAEVEPERRGVVGVVDGHSPLGVETEKDREERKKFLREVVKYKL
+>d1wy5a2 d.229.1.1 (A:217-311) TilS-like protein Aq_1887 {Aquifex aeolicus [TaxId: 63363]}
+ENLEDTFLKMVKVLRAEREFLEEEAQKLYKEVKKGNCLDVKKLKEKPLALQRRVIRKFIGEKDYEKVELVRSLLEKGGEVNLGKGKVLKRKERWL
+>d1wy6a_ a.118.20.1 (A:) Hypothetical protein ST1625 {Sulfolobus tokodaii [TaxId: 111955]}
+EIIRKLMDAKKFLLDGYIDEGVKIVLEITKSSTKSEYNWFICNLLESIDCRYMFQVLDKIGSYFDLDKCQNLKSVVECGVINNTLNEHVNKALDILVIQGKRDKLEEIGREILKNNEVSASILVAIANALRRVGDERDATTLLIEACKKGEKEACNAVNTL
+>d1wzua1 c.145.1.1 (A:1-298) Quinolinate synthetase A, NadA {Pyrococcus horikoshii [TaxId: 53953]}
+MDLVEEILRLKEERNAIILAHNYQLPEVQDIADFIGDSLELARRATRVDADVIVFAGVDFMAETAKILNPDKVVLIPSREATCAMANMLKVEHILEAKRKYPNAPVVLYVNSTAEAKAYADVTVTSANAVEVVKKLDSDVVIFGPDKNLAHYVAKMTGKKIIPVPSKGHCYVHQKFTLDDVERAKKLHPNAKLMIHPECIPEVQEKADIIASTGGMIKRACEWDEWVVFTEREMVYRLRKLYPQKKFYPAREDAFCIGMKAITLKNIYESLKDMKYKVEVPEEIARKARKAIERMLEM
+>d1x2ia1 a.60.2.5 (A:2-69) ATP-dependent RNA helicase PF2015 {Pyrococcus furiosus [TaxId: 2261]}
+ALTLAERQRLIVEGLPHVSATLARRLLKHFGSVERVFTASVAELMKVEGIGEKIAKEIRRVITAPYIE
+>d1x38a2 c.23.11.1 (A:389-602) Beta-D-glucan exohydrolase, C-terminal domain {Barley (Hordeum vulgare) [TaxId: 4513]}
+LVLLKNGKTSTDAPLLPLPKKAPKILVAGSHADNLGYQCGGWTIEWQGDTGRTTVGTTILEAVKAAVDPSTVVVFAENPDAEFVKSGGFSYAIVAVGEHPYTETKGDNLNLTIPEPGLSTVQAVCGGVRCATVLISGRPVVVQPLLAASDALVAAWLPGSEGQGVTDALFGDFGFTGRLPRTWFKSVDQLPMNVGDAHYDPLFRLGYGLTTNAT
+>d1x3la_ c.118.1.0 (A:) automated matches {Pyrococcus horikoshii [TaxId: 70601]}
+MIAMDIREIGLRLVGEAIKAADPYRAVLNAVKVSDDKIIVQGKEFEIKGKVYVIALGKAACEMARAIEDILDVEDGVAVTKYGYGKELKRIKVIEAGHPIPDEKSILGAKEALSILNRARENDIVFILISGGGSALFELPEEGISLEDLKLTTDLLLKSGAKIHEINTVRKHISKVKGGKLAKMIKGTGIVLIISDVVGDNLEAIASGPTVKDPTTFEDAKRILELYDIWEKVPESVRLHIERGLRGEVEETLKEDLPNVHNFLIASNSISCEAIAREAQRLGFKAYIMTTTLEGEAKDAGLFIGSIVQEIAERGRPFEPPVVLVFGGETTVTIEGKGGKGGPNQEIALSATRKISDLEALIVAFDTDGTDGPTDAAGGIVDGTTYKKLREKGIDVEKVLKEHNSYEALKKVGGLLFTGPTGTNVNSIVIAIVTSK
+>d1x6oa1 b.34.5.2 (A:19-86) Eukaryotic initiation translation factor 5a (eIF5a) {Leishmania infantum [TaxId: 5671]}
+KTYPLAAGALKKGGYVCINGRPCKVIDLSVSKTGKHGHAKVSIVATDIFTGNRLEDQAPSTHNVEVPF
+>d1x6za_ d.24.1.1 (A:) automated matches {Pseudomonas aeruginosa [TaxId: 287]}
+GTEFARSEGASALASVNPLKTTVEEALSRGWSVKSGTGTEDATKKEVPLGVAADANKLGTIALKPDPADGTADITLTFTMGGAGPKNKGKIITLTRTAADGLWKCTSDQDEQFIPKGCSR
+>d1x8qa_ b.60.1.1 (A:) Nitrophorin 4 {Rhodnius prolixus [TaxId: 13249]}
+ACTKNAIAQTGFNKDKYFNGDVWYVTDYLDLEPDDVPKRYCAALAAGTASGKLKEALYHYDPKTQDTFYDVSELQVESLGKYTANFKKVDKNGNVKVAVTAGNYYTFTVMYADDSSALIHTCLHKGNKDLGDLYAVLNRNKDAAAGDKVKSAVSAATLEFSKFISTKENNCAYDNDSLKSLLTK
+>d1x91a_ a.29.6.1 (A:) Pectin methylesterase inhibitor 1, PMEI1 {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+SSEMSTICDKTLNPSFCLKFLNTKFASANLQALAKTTLDSTQARATQTLKKLQSIIDGGVDPRSKLAYRSCVDEYESAIGNLEEAFEHLASGDGMGMNMKVSAALDGADTCLDDVKRLRSVDSSVVNNSKTIKNLCGIALVISNMLPRN
+>d1x9da1 a.102.2.1 (A:245-697) Class I alpha-1;2-mannosidase, catalytic domain {Human (Homo sapiens) [TaxId: 9606]}
+HLNYRQKGVIDVFLHAWKGYRKFAWGHDELKPVSRSFSEWFGLGLTLIDALDTMWILGLRKEFEEARKWVSKKLHFEKDVDVNLFESTIRILGGLLSAYHLSGDSLFLRKAEDFGNRLMPAFRTPSKIPYSDVNIGTGVAHPPRWTSDSTVAEVTSIQLEFRELSRLTGDKKFQEAVEKVTQHIHGLSGKKDGLVPMFINTHSGLFTHLGVFTLGARADSYYEYLLKQWIQGGKQETQLLEDYVEAIEGVRTHLLRHSEPSKLTFVGELAHGRFSAKMDHLVCFLPGTLALGVYHGLPASHMELAQELMETCYQMNRQMETGLSPEIVHFNLYPQPGRRDVEVKPADRHNLLRPETVESLFYLYRVTGDRKYQDWGWEILQSFSRFTRVPSGGYSSINNVQDPQKPEPRDKMESFFLGETLKYLFLLFSDDPNLLSLDAYVFNTEAHPLPIWT
+>d1x9za_ d.292.1.1 (A:) DNA mismatch repair protein MutL {Escherichia coli [TaxId: 562]}
+QSFGRVLTIVHSDCALLERDGNISLLSLPVAERWLRQAQLTPGEAPVCAQPLLIPLRLKVSAEEKSALEKAQSALAELGIDFQSDAQHVTIRAVPLPLRQQNLQILIPELIGYLAKQSVFEPGNIAQWIARNLMSEHAQWSMAQAITLLADVERLCPQLVKTPPGGLLQSVDLHPAIKALKD
+>d1xaka_ b.1.24.1 (A:) Accessory protein X4 (ORF8, ORF7a) {SARS coronavirus [TaxId: 227859]}
+CELYHYQECVRGTTVILKEPCPSGTYEGNSPFHPLADNKFALTCTSTHFAFACADGTRHTYQLRARSV
+>d1xbia1 d.79.3.1 (A:2-116) Ribosomal protein L7ae {Methanococcus jannaschii [TaxId: 2190]}
+AVYVKFKVPEEIQKELLDAVAKAQKIKKGANEVTKAVERGIAKLVIIAEDVKPEEVVAHLPYLCEEKGIPYAYVASKQDLGKAAGLEVAASSVAIINEGDAEELKVLIEKVNVLK
+>d1xdna_ d.142.2.4 (A:) RNA editing ligase MP52 {Trypanosome (Trypanosoma brucei) [TaxId: 5691]}
+QSDFSPYIEIDLPSESRIQSLHKSGLAAQEWVACEKVHGTNFGIYLINQGDHEVVRFAKRSGIMDPNENFFGYHILIDEFTAQIRILNDLLKQKYGLSRVGRLVLNGELFGAKYKHPLVPKSEKWCTLPNGKKFPIAGVQIQREPFPQYSPELHFFAFDIKYSVSGAEEDFVLLGYDEFVEFSSKVPNLLYARALVRGTLDECLAFDVENFMTPLPALLGLGNYPLEGNLAEGVVIRHVRRGDPAVEKHNVSTIIKLRCSSFMEL
+>d1xeoa_ d.167.1.1 (A:) Peptide deformylase {Escherichia coli [TaxId: 562]}
+SVLQVLHIPDERLRKVAKPVEEVNAEIQRIVDDMFETMYAEEGIGLAATQVDIHQRIIVIDVSENRDERLVLINPELLEKSGETGIEEGCLSIPEQRALVPRAEKVKIRALDRDGKPFELEADGLLAICIQHEMDHLVGKLFMDYLSPLKQQRIRQKVEKLDRLK
+>d1xfia_ e.50.1.1 (A:) Hypothetical protein At2g17340 {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+EMVPFPQLPMPIENNYRACTIPYRFPSDDPKKATPNEISWINVFANSIPSFKKRAESDITVPDAPARAEKFAERYAGILEDLKKDPESHGGPPDGILLCRLREQVLRELGFRDIFKKVKDEENAKAISLFPQVVSLSDAIEDDGKRLENLVRGIFAGNIFDLGSAQLAEVFSRDGMSFLASCQNLVPRPWVIDDLENFQAKWINKSWKKAVIFVDNSGADIILGILPFARELLRRGAQVVLAANELPSINDITCTELTEILSQLKDENGQLLGVDTSKLLIANSGNDLPVIDLSRVSQELAYLSSDADLVIVEGMGRGIETNLYAQFKCDSLKIGMVKHLEVAEFLGGRLYDCVFKFNEV
+>d1xg0a_ d.184.1.1 (A:) Phycoerythrin 545 alpha-subunits {Cryptophyte (Rhodomonas sp. CS24) [TaxId: 79257]}
+AMDKSAKAPQITIFDHRGCSRAPKESTGGKAGGQDDEMMVKVASTKVTVSESDAAKKLQEFITFEKGIDGPFTSKN
+>d1xkpb1 d.198.1.1 (B:2-122) Chaperone protein SycN {Yersinia pestis [TaxId: 632]}
+SWIEPIISHFCQDLGVPTSSPLSPLIQLEMAQSGTLQLEQHGATLTLWLARSLAWHRCEDAMVKALTLTAAQKSGALPLRAGWLGESQLVLFVSLDERSLTLPLLHQAFEQLLRLQQEVLA
+>d1xkra_ d.252.1.1 (A:) Chemotaxis protein CheC {Thermotoga maritima [TaxId: 2336]}
+HMKISERQKDLLKEIGNIGAGNAATAISYMINKKVEISVPNVEIVPISKVIFIAKDPEEIVVGVKMPVTGDIEGSVLLIMGTTVVKKILEILTGRAPDNLLNLDEFSASALREIGNIMCGTYVSALADFLGFKIDTLPPQLVIDMISAIFAEASIEELEDNSEDQIVFVETLLKVEEEEEPLTSYMMMIPKPGYLVKIFERMGIQ
+>d1xksa_ b.69.14.1 (A:) Nuclear pore complex protein Nup133 {Human (Homo sapiens) [TaxId: 9606]}
+ESVNYDVKTFGSSLPVKVMEALTLAEVDDQLTINIDEGGWACLVCKEKLIIWKIALSPITKLSVCKELQLPPSDFHWSADLVALSYSSPSGEAHSTQAVAVMVATREGSIRYWPSLAGEDTYTEAFVDSGGDKTYSFLTAVQGGSFILSSSGSQLIRLIPESSGKIHQHILPQGQGMLSGIGRKVSSLFGILSPSSDLTLSSVLWDRERSSFYSLTSSNISKWELDDSSEKHAYSWDINRALKENITDAIWGSESNYEAIKEGVNIRYLDLKQNCDGLVILAAAWHSADNPCLIYYSLITIEDNGCQMSDAVTVEVTQYNPPFQSEDLILCQLTVPNFSNQTAYLYNESAVYVCSTGTGKFSLPQEKIVFNAQGDSVLGAGACGGVPIIFSRNSGLVSITSRE
+>d1xlya_ a.232.1.1 (A:) RNA-binding protein She2p {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+DIKVTPGTSELVEQILALLSRYLSSYIHVLNKFISHLRRVATLRFERTTLIKFVKKLRFYNDSVLSYNASEFINEGKNELDPEADSFDKVILPIASMFVKSVETFDLLNYYLTQSLQKEILSKTLNEDLTLTAESILAIDDTYNHFVKFSQWMIESLRIGSNLLDLEVVQFAIKSADEDGTNIGETDNIFLQEILPVNSEEEFQTLSAAWHSILDGKLSALDEEFDVVATKW
+>d1xm3a_ c.1.31.1 (A:) Thiazole biosynthesis protein ThiG {Bacillus subtilis [TaxId: 1423]}
+SMLTIGGKSFQSRLLLGTGKYPSFDIQKEAVAVSESDILTFAVRRMNIFEASQPNFLEQLDLSKYTLLPNTAGASTAEEAVRIARLAKASGLCDMIKVEVIGCSRSLLPDPVETLKASEQLLEEGFIVLPYTSDDVVLARKLEELGVHAIMPGASPIGSGQGILNPLNLSFIIEQAKVPVIVDAGIGSPKDAAYAMELGADGVLLNTAVSGADDPVKMARAMKLAVEAGRLSYEAGRIPLKQYGTASSPGE
+>d1xmka1 a.4.5.19 (A:294-366) Z-alpha domain of dsRNA-specific adenosine deaminase, ADAR1 {Human (Homo sapiens) [TaxId: 9606]}
+LDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIK
+>d1xmta_ d.108.1.1 (A:) Hypothetical protein AT1g77540 {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+PPKIVWNEGKRRFETEDHEAFIEYKMRNNGKVMDLVHTYVPSFKRGLGLASHLCVAAFEHASSHSISIIPSCSYVSDTFLPRNPSWKPLIHSEVF
+>d1xppa_ d.74.3.2 (A:) DNA-directed RNA polymerase subunit L, RpoL {Thermoplasma acidophilum [TaxId: 2303]}
+AESSLRVISKEKNSITVEMINYDNTLLRTLVEEILKDDQVDEARYYIKHPVIDNPQIYVRVKSGKPQSAIKRAVRKLSKLYEDLGTQFQKEFQRYESDH
+>d1xqoa_ a.96.1.6 (A:) 8-oxoguanine DNA glycosylase, AgoG {Pyrobaculum aerophilum [TaxId: 13773]}
+AAESQLKRVIETLRRLGIEEVLKLERRDPQYRAVCNVVKRHGETVGSRLAMLNALISYRLTGKGEEHWEYFGKYFSQLEVIDLCRDFLKYIETSPFLKIGVEARKKRALKACDYVPNLEDLGLTLRQLSHIVGARREQKTLVFTIKILNYAYMCSRGVNRVLPFDIPIPVDYRVARLTWCAGLIDFPPEEALRRYEAVQKIWDAVARETGIPPLHLDTLLWLAGRAVLYGENLHGVPKEVIALFQWRGGCRPP
+>d1xsva_ a.4.13.3 (A:) Hypothetical protein SAV1236 {Staphylococcus aureus, strain Mu50 / ATCC 700699 [TaxId: 1280]}
+DLVKTLRMNYLFDFYQSLLTNKQRNYLELFYLEDYSLSEIADTFNVSRQAVYDNIRRTGDLVEDYEKKLELYQKFEQRREIYDEMKQHLSNPEQIQRYIQQLEDLE
+>d1xsza2 d.129.9.1 (A:198-354) RalF, C-terminal domain {Legionella pneumophila [TaxId: 446]}
+KTSPGYELTSTTLNKDSTFKKLDSFLHSTDVNINTVFPGIGDNVKTTVDQPKSWLSFFTGYKGTITLTDNKTSAQATIQVYTPNIFSKWLFGEQPRVIIQPGQTKESIDLAAKAAADFSSPVKNFKATYDYEVGDLIKAYDNQKKLITIERNLALKA
+>d1xu1r_ g.24.1.2 (R:) Tumor necrosis factor receptor superfamily member 13B, TACI {Human (Homo sapiens) [TaxId: 9606]}
+SLSCRKEQGKFYDHLLRDCISCASICGQHPKQCAYFCE
+>d1xuba1 d.21.1.2 (A:1-128) Phenazine biosynthesis protein PhzF {Pseudomonas fluorescens [TaxId: 294]}
+MHNYVIIDAFASVPLEGNPVAVFFDADDLPPAQMQRIAREMNLSESTFVLKPRNGGDALIRIFTPVNELPFAGAPLLGTAIALGAHTDNHRLYLETQMGTIAFELERQNGSVIAASMDQPIPTWTALG
+>d1xvsa_ b.1.23.1 (A:) ApaG {Vibrio cholerae [TaxId: 666]}
+MDVSLPCIKIQVQTRYIEEQSNPEYQRFVFAYLITIKNLSSQTVQLMSRRWLITDADGKQTVVEGDGVVGEQPRIKANDEYTYSSGTALDTPVGVMQGQYLMIDEQGESFTVEIEPFRLAVPHV
+>d1y02a1 a.140.2.1 (A:71-114) Rififylin (FYVE-RING finger protein Sakura) {Human (Homo sapiens) [TaxId: 9606]}
+FQREELMKMKVKDLRDYLSLHDISTEMCREKEELVLLVLGQQPV
+>d1y0na_ d.291.1.1 (A:) Hypothetical UPF0270 protein PA3463 {Pseudomonas aeruginosa [TaxId: 287]}
+GHMLIPHDLLEADTLNNLLEDFVTREGTDNGDETPLDVRVERARHALRRGEAVILFDPESQQCQLMLRSEVPAELLRD
+>d1y0pa3 d.168.1.1 (A:362-504) Flavocytochrome c3 (respiratory fumarate reductase) {Shewanella frigidimarina [TaxId: 56812]}
+IQAHPTLSVKGGVMVTEAVRGNGAILVNREGKRFVNEITTRDKASAAILAQTGKSAYLIFDDSVRKSLSKIDKYIGLGVAPTADSLVKLGKMEGIDGKALTETVARYNSLVSSGKDTDFERPNLPRALNEGNYYAIEVTPGVH
+>d1y0ya1 b.49.3.1 (A:73-163) Frv operon protein FrvX {Pyrococcus horikoshii [TaxId: 53953]}
+GLMVTHIEKNGFLRVAPIGGVDPKTLIAQRFKVWIDKGKFIYGVGASVPPHIQKPEDRKKAPDWDQIFIDIGAESKEEAEDMGVKIGTVIT
+>d1y12a1 b.157.1.1 (A:2-162) Hemolysin-corregulated protein 1, Hcp1 {Pseudomonas aeruginosa [TaxId: 287]}
+AVDMFIKIGDVKGESKDKTHAEEIDVLAWSWGMSQSGSMHMGGGGGAGKVNVQDLSFTKYIDKSTPNLMMACSSGKHYPQAKLTIRKAGGENQVEYLIITLKEVLVSSVSTGGSGGEDRLTENVTLNFAQVQVDYQPQKADGAKDGGPVKYGWNIRQNVQA
+>d1y2oa1 a.238.1.3 (A:1-248) BAP2/IRSp53 N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+MSLSRSEEMHRLTENVYKTIMEQFNPSLRNFIAMGKNYEKALAGVTYAAKGYFDALVKMGELASESQGSKELGDVLFQMAEVHRQIQNQLEEMLKSFHNELLTQLEQKVELDSRYLSAALKKYQTEQRSKGDALDKCQAELKKLRKKSQGSKNPQKYSDKELQYIDAISNKQGELENYVSDGYKTALTEERRRFCFLVEKQCAVAKNSAAYHSKGKELLAQKLPLWQQACADPSKIPERAVQLMQQVA
+>d1y5ic1 f.21.3.1 (C:1-225) Respiratory nitrate reductase 1 gamma chain {Escherichia coli [TaxId: 562]}
+MQFLNMFFFDIYPYIAGAVFLIGSWLRYDYGQYTWRAASSQMLDRKGMNLASNLFHIGILGIFVGHFFGMLTPHWMYEAWLPIEVAQKMAMFAGGASGVLCLIGGVLLLKRRLFSPRVRATTTGADILILSLLVIQCALGLLTIPFSAQHMDGSEMMKLVGWAQSVVTFHGGASQHLDGVAFIFRLHLVLGMTLFLLFPFSRLIHIWSVPVEYLTRKYQLVRARH
+>d1y6xa1 a.204.1.4 (A:7-93) Phosphoribosyl-ATP pyrophosphatase HisE {Mycobacterium tuberculosis [TaxId: 1773]}
+VKTFEDLFAELGDRARTRPADSTTVAALDGGVHALGKKLLEEAGEVWLAAEHESNDALAEEISQLLYWTQVLMISRGLSLDDVYRKL
+>d1y71a1 b.34.16.1 (A:4-127) Kinase-associated protein B {Bacillus cereus [TaxId: 1396]}
+TFEIGEIVTGIYKTGKYIGEVTNSRPGSYVVKVLAVLKHPVQGDLHNVKQANVPFFHERRALAFREQTNIPEQMVKKYEGEIPDYTESLKLALETQMNSFSEDDSPFAERSLETLQQLKKDYKL
+>d1y7ma1 b.160.1.1 (A:49-164) Hypothetical protein YkuD, C-terminal domain {Bacillus subtilis [TaxId: 1423]}
+PDPYTIPYHIAVSIGAKTLTLSLNNRVMKTYPIAVGKILTQTPTGEFYIINRQRNPGGPFGAYWLSLSAAHYGIHGTNNPASIGKAVSKGCIRMHNKDVIELASIVPNGTRVTINR
+>d1y7ma2 d.7.1.1 (A:1-48) Hypothetical protein YkuD, N-terminal domain {Bacillus subtilis [TaxId: 1423]}
+MLTYQVKQGDTLNSIAADFRISTAALLQANPSLQAGLTAGQSIVIPGL
+>d1y9ia_ a.195.1.1 (A:) Low temperature requirement C protein, LtrC {Listeria monocytogenes [TaxId: 1639]}
+KQSALESKARSWLIERGVEIDDIAELVLFLQQKYHPGLELDICRQNVEHVLRKREVQNAVLTGIQLDVMAEKGELVQPLQNIISADEGLYGVDEILALSIVNVYGSIGFTNYGYIDKVKPGILAKLNEHDGIAVHTFLDDIVGAIAAAAASRLAHSYHD
+>d1yaro_ a.24.8.1 (O:) automated matches {Trypanosome (Trypanosoma brucei) [TaxId: 5691]}
+KRAALIQNLRDSYTETSSFAVIEEWAAGTLQEIEGIAKAAAEAHGVIRNSTYGRAQAEKSPEQLLGVLQRYQDLCHNVYCQAETIRTVIAIRIPEHKEEDNLGVAVQHAVLKIIDELEIKTLGSGEKSGSGGAPTPIGMYALREYLSARSTVEDKLLGSVDAESGKTKGGSQSPSLLLELRQIDADFMLKVELATTHLSTMVRAVINAYLLNWKKLIQPRTGSDHMVS
+>d1yb3a1 d.296.1.2 (A:2-167) Hypothetical protein PF0168 {Pyrococcus furiosus [TaxId: 2261]}
+MLKEVHELLNRIWGDIFELREELKEELKGFTVEEVSEVFNAYLYIDGKWEEMKYPHPAFAVKPGGEVGATPQGFYFVFAFPKEELSKEFIEDVIRAFEKLFIYGAENFLEDFYNFEHPISGDEVWDRIVNSDEEMINFEVDLGFDKEEVKREIKRFIELARRYNLL
+>d1yfqa_ b.69.4.2 (A:) Cell cycle arrest protein BUB3 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MQIVQIEQAPKDYISDIKIIPSKSLLLITSWDGSLTVYKFDIQAKNVDLLQSLRYKHPLLCCNFIDNTDLQIYVGTVQGEILKVDLIGSPSFQALTNNEANLGICRICKYGDDKLIAASWDGLIEVIDPRNYGDGVIAVKNLNSNNTKVKNKIFTMDTNSSRLIVGMNNSQVQWFRLPLCEDDNGTIEESGLKYQIRDVALLPKEQEGYACSSIDGRVAVEFFDDQGDDYNSSKRFAFRCHRLNLKDTNLAYPVNSIEFSPRHKFLYTAGSDGIISCWNLQTRKKIKNFAKFNEDSVVKIACSDNILCLATSDDTFKTNAAIDQTIELNASSIYIIFDYENP
+>d1yfsa1 a.203.1.1 (A:237-457) Putative anticodon-binding domain of alanyl-tRNA synthetase (AlaRS) {Aquifex aeolicus [TaxId: 63363]}
+EIDIIFPLIQFGEEVSGKKYGEKFETDVALRVIADHLRAITFAISDGVIPSNEGRGYVIRRILRRAMRFGYKLGIENPFLYKGVDLVVDIMKEPYPELELSREFVKGIVKGEEKRFIKTLKAGMEYIQEVIQKALEEGRKTLSGKEVFTAYDTYGFPVDLIDEIAREKGLGIDLEGFQCELEEQRERARKHFKVEAKKVKPVYSHLKELGKTSAFVGAAAL
+>d1yk4a_ g.41.5.1 (A:) Rubredoxin {Pyrococcus abyssi [TaxId: 29292]}
+AKLSCKICGYIYDEDEGDPDNGISPGTKFEDLPDDWVCPLCGAPKSEFERIE
+>d1ylxa1 d.82.5.1 (A:1-100) Hypothetical protein, GK1464 ortholog {Bacillus stearothermophilus [TaxId: 1422]}
+MEFAPRSVVIEEFIDTLEPMMEAYGLDQVGIFEEHGEGNRYYVGYTINKDDEMITIHMPFVKNERGELALEKQEWTVRKDGREKKGFHSLQEAMEEVIHS
+>d1yo3a_ d.39.1.1 (A:) automated matches {Plasmodium falciparum [TaxId: 36329]}
+GSVVKNVDMTEEMQIDAIDCANQALQKYNVEKDIAAHIKKEFDRKYDPTWHCVVGRNFGSYVTHETKNFIYFYIGQVAILLFKSG
+>d1yoza1 a.253.1.1 (A:11-124) Hypothetical protein AF0941 {Archaeoglobus fulgidus [TaxId: 2234]}
+MLYINSFLDRMGEIIRGEKSVEEADKLLDQKNIFEMFRSDCEEILNLYKSGKAEKEEVQRNFYLLKTYVVSQLSIHFERLKEFAESKGFKIEKKLDPEVINEIALYIDRVEKEV
+>d1yt3a1 a.60.8.3 (A:194-294) Ribonuclease D {Escherichia coli [TaxId: 562]}
+VAPEDAWRDITNAWQLRTRQLACLQLLADWRLRKARERDLAVNFVVREEHLWSVARYMPGSLGELDSLGLSGSEIRFHGKTLLALVEKAQTLPEDALPQPM
+>d1yu0a1 b.163.1.1 (A:5-170) Major tropism determinant (Mtd), N-terminal domain {Bordetella phage bpp-1 [TaxId: 194699]}
+VQFRGGTTAQHATFTGAAREITVDTDKNTVVVHDGATAGGFPLARHDLVKTAFIKADKSAVAFTRTGNATASIKAGTIVEVNGKLVQFTADTAITMPALTAGTDYAIYVCDDGTVRADSNFSAPTGYTSTTARKVGGFHYAPGSNAAAQAGGNTTAQINEYSLWDI
+>d1yu5x_ a.14.1.1 (X:) Villin {Chicken (Gallus gallus) [TaxId: 9031]}
+PTKLETFPLDVLVNTAAEDLPRGVDPSRKENHLSDEDFKAVFGMTRSAFANLPLWKQQNLKKEKGLF
+>d1yvra1 a.118.25.1 (A:5-363) 60-kda SS-aARo ribonucleoprotein {African clawed frog (Xenopus laevis) [TaxId: 8355]}
+MDQTQPLNEKQVPNSEGCYVWQVSDMNRLRRFLCFGSEGGTYYIEEKKLGQENAEALLRLIEDGKGCEVVQEIKTFSQEGRAAKQEPTLFALAVCSQCSDIKTKQAAFRAVPEVCRIPTHLFTFIQFKKDLKEGMKCGMWGRALRKAVSDWYNTKDALNLAMAVTKYKQRNGWSHKDLLRLSHIKPANEGLTMVAKYVSKGWKEVQEAYKEKELSPETEKVLKYLEATERVKRTKDELEIIHLIDEYRLVREHLLTIHLKSKEIWKSLLQDMPLTALLRNLGKMTADSVLAPASSEVSSVCERLTNEKLLKKARIHPFHILVALETYKKGHGNRGKLRWIPDTSIVEALDNAFYKSFKL
+>d1yzya1 c.146.1.1 (A:1-412) Hypothetical protein HI1011 {Haemophilus influenzae [TaxId: 727]}
+LGVIADDFTGASDIASFLVENGLSTVQMNGVPTQSLNSKVDAIVISLKSRSNPVNEAIEQSLRAYQWLKENGCTQFYFKYCSTFDSTAKGNIGPVTDALLDELNEDFTVITPALPVNGRTIFNGYLFVGDVLLSESGMKNHPITPMVDANLMRLMDAQAKGKTGLVAYADVIKGASRVQECFAELKAQGYRYAVVDAVDNSQLEVLAEAVADFKLVTGGSGLGAYMAARLSGGKKGTNAFTPTKGKTVVLSGSCSVMTNKQVEKYREKAPHFQLDVEQAIHNENYIEQLYQWVIANLDSEFAPMVYATVPPDALKAIQHQFGVDQASHAIENTFAKLAAKLKQYGVTNFITAGGETSSIVVQELGFTGFHIGKQIAPGVPWLKAVEEDIFLALKSGNFGKEDFFEYAQGMFL
+>d1z0jb1 a.2.19.1 (B:734-784) FYVE finger-containing Rab5 effector protein rabenosyn-5 {Human (Homo sapiens) [TaxId: 9606]}
+IEEELLLQQIDNIKAYIFDAKQCGRLDEVEVLTENLRELKHTLAKQKGGTD
+>d1z0pa1 a.2.18.1 (A:1-77) Hypothetical protein SPy1572 {Streptococcus pyogenes [TaxId: 1314]}
+MSYEKEFLKDFEDWVKTQIQVNQLAMATSQEVAQEDGDERAKDAFIRYESKLDAYEFLLGKFDNYKNGKAFHDIPDE
+>d1z0sa1 e.52.1.1 (A:1-249) Inorganic polyphosphate/ATP-NAD kinase PpnK {Archaeoglobus fulgidus [TaxId: 2234]}
+MRAAVVYKTDGHVKRIEEALKRLEVEVELFNQPSEELENFDFIVSVGGDGTILRILQKLKRCPPIFGINTGRVGLLTHASPENFEVELKKAVEKFEVERFPRVSCSAMPDVLALNEIAVLSRKPAKMIDVALRVDGVEVDRIRCDGFIVATQIGSTGYAFSAGGPVVEPYLECFILIPIAPFRFGWKPYVVSMERKIEVIAEKAIVVADGQKSVDFDGEITIEKSEFPAVFFKNEKRFRNLFGKVRSIG
+>d1z21a1 a.243.1.2 (A:42-145) Yop proteins translocation protein H, YscH (IcrP) {Yersinia pestis [TaxId: 632]}
+SAEKTREVLWQQYYASNPPDHAVLEVLATPVREALLARFGQHQGSVVPAIDLPELRSVLQQFDSFGKRWEAILLQVLEGIKPNESQVGLPYLSELINKELMILL
+>d1z2ua1 d.20.1.1 (A:1-147) Ubiquitin conjugating enzyme, UBC {Caenorhabditis elegans, E2 2 [TaxId: 6239]}
+MALKRIQKELQDLGRDPPAQCSAGPVGDDLFHWQATIMGPPESPYQGGVFFLTIHFPTDYPFKPPKVAFTTRIYHPNINSNGSICLDILRSQWSPALTISKVLLSICSLLCDPNPDDPLVPEIARIYKTDRERYNQLAREWTQKYAM
+>d1z3eb1 a.60.3.1 (B:245-311) C-terminal domain of RNA polymerase alpha subunit {Bacillus subtilis [TaxId: 1423]}
+KEKVLEMTIEELDLSVRSYNCLKRAGINTVQELANKTEEDMMKVRNLGRKSLEEVKAKLEELGLGLR
+>d1z3xa2 a.261.1.1 (A:88-235) GUN4-like protein Ycf53 {Thermosynechococcus elongatus [TaxId: 146786]}
+IPLRSDRGVDYQELAKLLVAEKFEAADRLTTQKLCELAGPLAQKRRWLYFTEVEQLPIPDLQTIDQLWLAFSLGRFGYSVQRQLWLGCGQNWDRLWEKIGWRQGKRWPRYPNEFIWDLSAPRGHLPLTNQLRGVQVLNALLNHPAWTA
+>d1z67a1 a.259.1.1 (A:3-131) Hypothetical protein YidB {Shigella flexneri [TaxId: 623]}
+LFDEVVGAFLKGDAGKYQAILSWVEEQGGIQVLLEKLQSGGLGAILSTWLSNQQRNQSVSGEQLESALGTNAVSDLGQKLGVDTSTASSLLAEQLPKIIDALSPQGEVSAQANNDLLSAGMELLKGKLF
+>d1z70x_ d.169.1.7 (X:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+LAHSKMVPIPAGVFTMGTDDPQIKQDGEAPARRVTIDAFYMDAYEVSNTEFEKFVNSTGYLTEAEKFGDSFVFEGMLSEQVKTNIQQAVAAAPWWLPVKGANWRHPEGPDSTILHRPDHPVLHVSWNDAVAYCTWAGKRLPTEAEWEYSCRGGLHNRLFPWGNKLQPKGQHYANIWQGEFPVTNTGEDGFQGTAPVDAFPPNGYGLYNIVGNAWEWTSDWWTVHHSVEETLNPKGPPSGKDRVKKGGSYMCHRSYCYRYRCAARSQNTPDSSASNLGFRCAADRLP
+>d1z8ga2 d.170.1.2 (A:50-159) Hepsin, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+PLYPVQVSSADARLMVFDKTEGTWRLLCSSRSNARVAGLSCEEMGFLRALTHSELDVRTAGAAGTSGFFCVDEGRLPHTQRLLEVISVCDCPRGRFLAAICQDCGRRKLP
+>d1z8ua_ a.7.11.1 (A:) Alpha-hemoglobin stabilizing protein AHSP {Human (Homo sapiens) [TaxId: 9606]}
+ALLKANKDLISAGLKEFSVLLNQQVFNDALVSEEDMVTVVEDWMNFYINYYRQQVTGEPQERDKALQELRQELNTLANPFLAKYRDFLKS
+>d1z9ta_ d.194.1.2 (A:) Hypothetical protein yfiH {Escherichia coli [TaxId: 562]}
+SKLIVPQWPQPKGVAACSSTRIGGVSLPPYDSLNLGAHCGDNPDHVEENRKRLFAAGNLPSKPVWLEQVHGKDVLKLTGEPYASKRADASYSNTPGTVCAVMTADCLPVLFCNRAGTEVAAAHAGWRGLCAGVLEETVSCFADNPENILAWLGPAIGPRAFEVGGEVREAFMAVDAKASAAFIQHGDKYLADIYQLARQRLANVGVEQIFGGDRCTYTENETFFSYRRDKTTGRMASFIWLI
+>d1zata2 d.335.1.1 (A:217-338) L,D-transpeptidase, pre-catalytic domain {Enterococcus faecium [TaxId: 1352]}
+KEQLASMNAIANVKATYSINGETFQIPSSDIMSWLTYNDGKVDLDTEQVRQYVTDLGTKYNTSTNDTKFKSTKRGEVTVPVGTYSWTIQTDSETEALKKAILAGQDFTRSPIVQGGTTADHP
+>d1zava1 d.58.62.1 (A:1-177) Ribosomal protein L10 {Thermotoga maritima [TaxId: 2336]}
+MLTRQQKELIVKEMSEIFKKTSLILFADFLGFTVADLTELRSRLREKYGDGARFRVVKNTLLNLALKNAEYEGYEEFLKGPTAVLYVTEGDPVEAVKIIYNFYKDKKADLSRLKGGFLEGKKFTAEEVENIAKLPSKEELYAMLVGRVKAPITGLVFALSGILRNLVYVLNAIKEKK
+>d1zbpa1 e.61.1.1 (A:2-265) Hypothetical protein VPA1032 {Vibrio parahaemolyticus [TaxId: 670]}
+TQWKNALSEGQLQQALELLIEAIKASPKDASLRSSFIELLCIDGDFERADEQLMQSIKLFPEYLPGASQLRHLVKAAQARKDFAQGAATAKVLGENEELTKSLVSFNLSMVSQDYEQVSELALQIEELRQEKGFLANDTSFSDVRDIDDRLGGYIELFSTAGNYFLVPIASINTLEIKSATSLLESVWRPVEFDIDGLGEGEGHMPMTYVDSESDAQKLGRETDWKQIADKEVYLGLGLKCWLVGEMALPISDLQNLQVIKELA
+>d1zbxb1 d.339.1.1 (B:485-613) Regulatory protein SIR1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+TEEEYVSPRFLVADGFLIDLAEEKPINPKDPRLLTLLKDHQRAMIDQMNLVKWNDFKKYQDPIPLKAKTLFKFCKQIKKKFLRGADFKLHTLPTEANLKYEPERMTVLCSCVPILLDDQTVQYLYDDSL
+>d1zcea1 b.122.1.8 (A:2-147) Hypothetical protein Atu2648 {Agrobacterium tumefaciens [TaxId: 358]}
+ANYWLYKSEPFKWSWEMQKAKGETGEEWTGVRNYQARNNMRAMKIGDKGFFYHSNEGLDVVGIVEVCALSHPDSTAEGDLKWDCVDIRAVCDMPQPVSLKDVKANPKLEKMSLVTSMRLSVQPVTEEEYLEVCRMGGLANPPKSPD
+>d1zd0a1 d.329.1.1 (A:9-144) Hypothetical protein PF0523 {Pyrococcus furiosus [TaxId: 2261]}
+LEIRTKVGEICISKVWLTDEQINKLFDRFKGDYQVVNAECADKVIFATIIAIKAVKEGRSIAKTVPGEILVRLSGNRQIKEAIKKVGAKEGENYIVTFGENASALLQKILSTLEIKELELERCDLEYAKKAFEDIA
+>d1zdya_ d.313.1.1 (A:) Aromatic prenyltransferase {Streptomyces sp. CL190 [TaxId: 93372]}
+EAADVERVYAAMEEAAGLLGVACARDKIYPLLSTFQDTLVEGGSVVVFSMASGRHSTELDFSISVPTSHGDPYATVVEKGLFPATGHPVDDLLADTQKHLPVSMFAIDGEVTGGFKKTYAFFPTDNMPGVAELSAIPSMPPAVAENAELFARYGLDKVQMTSMDYKKRQVNLYFSELSAQTLEAESVLALVRELGLHVPNELGLKFCKRSFSVYPTLNWETGKIDRLCFAVISNDPTLVPSSDEGDIEKFHNYATKAPYAYVGEKRTLVYGLTLSPKEEYYKLGAYYHITDVQRGLLKAFD
+>d1zela2 d.377.1.1 (A:83-294) Hypothetical protein Rv2827c {Mycobacterium tuberculosis [TaxId: 1773]}
+PYLPLRSWLARDQNAGFMLAGASAAWHLGYLDRQPDGRIPIWLPPAKRLPDGLASYVSVVRIPWNAADTALLAPRPALLVRRRLDLVAWATGLPALGPEALLVQIATRPASFGPWADLVPHLDDLVADCSDERLERLLSGRPTSAWQRASYLLDSGGEPARGQALLAKRHTEVMPVTRFTTAHSRDRGESVWAPEYQLVDELVVPLLRVIGK
+>d1zgka1 b.68.11.1 (A:322-609) Kelch-like ECH-associated protein 1, KEAP1 {Human (Homo sapiens) [TaxId: 9606]}
+PKVGRLIYTAGGYFRQSLSYLEAYNPSNGTWLRLADLQVPRSGLAGCVVGGLLYAVGGRNNSPDGNTDSSALDCYNPMTNQWSPCAPMSVPRNRIGVGVIDGHIYAVGGSHGCIHHNSVERYEPERDEWHLVAPMLTRRIGVGVAVLNRLLYAVGGFDGTNRLNSAECYYPERNEWRMITAMNTIRSGAGVCVLHNCIYAAGGYDGQDQLNSVERYDVETETWTFVAPMKHRRSALGITVHQGRIYVLGGYDGHTFLDSVECYDPDTDTWSEVTRMTSGRSGVGVAVT
+>d1zhxa_ d.338.1.1 (A:) Oxysterol-binding protein homolog 4, KES1 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MDPSQYASSSSWTSFLKSIASFNGDLSSLSAPPFILSPISLTEFSQYWAEHPELFLEPSFINDDNYKEHCLIDPEVESPELARMLAVTKWFISTLKSQYCSRNESLGSEKKPLNPFLGELFVGKWENKEHPEFGETVLLSEQVSHHPPVTAFSIFNDKNKVKLQGYNQIKASFTKSLMLTVKQFGHTMLDIKDESYLVTPPPLHIEGILVASPFVELEGKSYIQSSTGLLCVIEFSGRGYFSGKKNSFKARIYKDSKDSKDKEKALYTISGQWSGSSKIIKANKKEESRLFYDAARIPAEHLNVKPLEEQHPLESRKAWYDVAGAIKLGDFNLIAKTKTELEETQRELRKEEEAKGISWQRRWFKDFDYSVTPEEGALVPEKDDTFLKLASALNLSTKNAPSGTLVGDKEDRKEDLSSIHWRFQRELWDEEKEIVL
+>d1zina2 g.41.2.1 (A:126-160) Microbial and mitochondrial ADK, insert "zinc finger" domain {Bacillus stearothermophilus [TaxId: 1422]}
+GRRICRNCGATYHLIFHPPAKPGVCDKCGGELYQR
+>d1zjca1 e.60.1.1 (A:3-415) Aminopeptidase S, AMPS {Staphylococcus aureus [TaxId: 1280]}
+NYKEKLQQYAELLVKVGMNVQPKQPVFIRSSVETLELTHLIVEEAYHCGASDVRVVYSDPTLKRLKFENESVEHFANHEIKSYDVEARMDYVKRGAANLALISEDPDLMDGIDSQKLQAFQQQNARAFKGYMESVQKNQFPWVVAAFPSKAWAKRVYPELSVEEAYIKFIDEVFDIVRIDGNDPVENWRQHIANLSVYAQKLQQKNYHALHYVSEGTDLTVGLAKNHIWEDATSYVNGKEQAFIANIPTEEVFTAPDRNRVDGYVTNKLPLSYNGTIIDQFKLMFKDGEIIDFSAEKGEAVLKDLINTDEGSRRLGEVALVPDDSPISNRNTIFYNTLFDENAACHLAIGSAYAFNIQGGTEMTVEEKIASGLNDSNVHVDFMIGSSDLTIYGIFEDGSKELVFENGNWASTF
+>d1zkea1 a.30.6.1 (A:1-79) Hypothetical protein HP1531 {Helicobacter pylori [TaxId: 210]}
+MFEKIRKILADIEDSQNEIEMLLKLANLSLGDFIEIKRGSMDMPKGVNEAFFTQLSEEVERLKELINALNKIKKGLLVF
+>d1zl0a1 c.8.10.1 (A:170-307) LD-carboxypeptidase A, C-terminal domain {Pseudomonas aeruginosa [TaxId: 287]}
+HELPVQHLGGHKQRVEGALIGGNLTALACMAGTLGGLHAPAGSILVLEDVGEPYYRLERSLWQLLESIDARQLGAICLGSFTDCPRKEVAHSLERIFGEYAAAIEVPLYHHLPSGHGAQNRAWPYGKTAVLEGNRLRW
+>d1zmec1 g.38.1.1 (C:31-66) PUT3 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+SVACLSCRKRHIKCPGGNPCQKCVTSNAICEYLEPS
+>d1zoqc_ a.153.1.1 (C:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SALQDLLRTLKSPSSPQQQQQVLNILKSNPQLMAAFIKQRTAKYVAN
+>d1zpsa1 b.168.1.1 (A:8-131) Phosphoribosyl-AMP cyclohydrolase HisI {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+VNILLNFRHNINGEDLIIAVAQDHETGEVLMVAYMNREALRRTLETGTAHYWSTSRGKLWLKGESSGHVQRVKDVLVDCDGDAVVLKVEQEGGACHTGYRSCFYRSIDGDELKVREDAVKVFDP
+>d1zsoa1 b.166.1.1 (A:1-156) Hypothetical protein MAL13P1.257 {Malaria parasite (Plasmodium falciparum) [TaxId: 5833]}
+MKNTVVRIKAELENVKRLFCDDEYLWIFNIRDSTSSLTRDNIQFRKTDILEIPNSRGTANFMIKWTEYPKYSTINFVNTKNSCSYEEVNNNEWRDFASFECRGIELIDFFPSNNFIVEDTKGKLYYDVNLSDQNWCDYNEEHEMCVGIYNLEYEVN
+>d1zt3a_ g.28.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+WKEPCRIELYRVVESLAKAQETSGEEISKFYLPNCNKNGFYHSRQCETSMDGEAGLCWCVYPWNGKRIPGSPEIRGDPNC
+>d1zxxa_ c.89.1.0 (A:) automated matches {Lactobacillus delbrueckii [TaxId: 1585]}
+MKRIGILTSGGDAPGMNAAVRAVTRVAIANGLEVFGIRYGFAGLVAGDIFPLESEDVAHLINVSGTFLYSARYPEFAEEEGQLAGIEQLKKHGIDAVVVIGGDGSYHGALQLTRHGFNSIGLPGTIDNDIPYTDATIGYDTACMTAMDAIDKIRDTASSHHRVFIVNVMGRNCGDIAMRVGVACGADAIVIPERPYDVEEIANRLKQAQESGKDHGLVVVAEGVMTADQFMAELKKYGDFDVRANVLGHMQRGGTPTVSDRVLASKLGSEAVHLLLEGKGGLAVGIENGKVTSHDILDLFDESHRGDYDLLKLNADLSR
+>d1zyma1 a.60.10.1 (A:22-144) Enzyme I of the PEP:sugar phosphotransferase system HPr-binding (sub)domain {Escherichia coli [TaxId: 562]}
+DEIVIDRKKISADQVDQEVERFLSGRAKASAQLETIKTKAGETFGEEKEAIFEGHIMLLEDEELEQEIIALIKDKHMTADAAAHEVIEGQASALEELDDEYLKERAADVRDIGKRLLRNILGL
+>d1zzka1 d.51.1.1 (A:11-85) HnRNP K, KH3 {Human (Homo sapiens) [TaxId: 9606]}
+GPIITTQVTIPKDLAGSIIGKGGQRIKQIRHESGASIKIDEPLEGSEDRIITITGTQDQIQNAQYLLQNSVKQYS
+>d2a1va1 d.198.3.1 (A:4-134) Hypothetical protein DR2400 {Deinococcus radiodurans [TaxId: 1299]}
+QTPMQTVDDLRSVCDELPHSLETFPFDDETLVFKVGYLSKSRMYALTDITQDPLRLSLKVDPERGEELRQAHPQSIAPGYHLNKKHWVTVTLDGTVPAELLGELLRGSYLLVTKKGFTKAERKELGLPDSL
+>d2a26a1 a.2.16.1 (A:1-47) Calcyclin-binding protein, CacyBP {Human (Homo sapiens) [TaxId: 9606]}
+MASEELQKDLEEVKVLLEKATRKRVRDALTAEKSKIETEIKNKMQQK
+>d2a2la1 d.110.9.1 (A:4-145) DhaI homolog {Klebsiella pneumoniae [TaxId: 573]}
+MNKSQQVQTITLAAAQQMAAAVEKKATEINVAVVFSVVDRGGNTLLIQRMDEAFVSSCDISLNKAWSACSLKQGTHEITSAVQPGQSLYGLQLTNQQRIIIFGGGLPVIFNEQVIGAVGVSGGTVEQDQLLAQCALDCFSAL
+>d2a65a1 f.54.1.1 (A:5-513) Na(+):neurotransmitter symporter homologue LeuT {Aquifex aeolicus [TaxId: 63363]}
+REHWATRLGLILAMAGNAVGLGNFLRFPVQAAENGGGAFMIPYIIAFLLVGIPLMWIEWAMGRYGGAQGHGTTPAIFYLLWRNRFAKILGVFGLWIPLVVAIYYVYIESWTLGFAIKFLVGLVPEPPPNATDPDSILRPFKEFLYSYIGVPKGDEPILKPSLFAYIVFLITMFINVSILIRGISKGIERFAKIAMPTLFILAVFLVIRVFLLETPNGTAADGLNFLWTPDFEKLKDPGVWIAAVGQIFFTLSLGFGAIITYASYVRKDQDIVLSGLTAATLNEKAEVILGGSISIPAAVAFFGVANAVAIAKAGAFNLGFITLPAIFSQTAGGTFLGFLWFFLLFFAGLTSSIAIMQPMIAFLEDELKLSRKHAVLWTAAIVFFSAHLVMFLNKSLDEMDFWAGTIGVVFFGLTELIIFFWIFGADKAWEEINRGGIIKVPRIYYYVMRYITPAFLAVLLVVWAREYIPKIMEETHWTVWITRFYIIGLFLFLTFLVFLAERRRNHESA
+>d2a6sa_ d.298.1.1 (A:) Toxin YoeB {Escherichia coli [TaxId: 562]}
+MKLIWSEESWDDYLYWQETDKRIVKKINELIKDTRRTPFEGKGKPEPLKHNLSGFWSRRITEEHRLVYAVTDDSLLIAACRYH
+>d2a90a1 d.289.1.1 (A:43-131) Deltex (Dx) {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+AHAVSVWEFESRGKWLPYSPAVSQHLERAHAKKLTRVMLSDADPSLEQYYVNVRTMTQESEAETAGSGLLTIGVRRMFYAPSSPAGKGT
+>d2a9da2 d.176.1.1 (A:95-343) Sulfite oxidase, middle catalytic domain {Chicken (Gallus gallus) [TaxId: 9031]}
+DPFAGDPPRHPGLRVNSQKPFNAEPPAELLAERFLTPNELFFTRNHLPVPAVEPSSYRLRVDGPGGRTLSLSLAELRSRFPKHEVTATLQCAGNRRSEMSRVRPVKGLPWDIGAISTARWGGARLRDVLLHAGFPEELQGEWHVCFEGLDADPGGAPYGASIPYGRALSPAADVLLAYEMNGTELPRDHGFPVRVVVPGVVGARSVKWLRRVAVSPDESPSHWQQNDYKGFSPCVDWDTVDYRTAPAIQ
+>d2a9sa1 c.51.5.1 (A:1-167) Competence/damage-inducible protein CinA {Agrobacterium tumefaciens [TaxId: 358]}
+MSLFPGDIEELARRIITDFTPLGLMVSTAESCTGGLIAGALTEIAGSSAVVDRGFVTYTNDAKRDMLGVGTETLTTFGAVSRQTALQMAHGALYRSRANFAVAVTGIAGPGGGSAEKPVGLVHLATKARNGNVLHHEMRYGDIGRTEIRLATVRTALEMLIALNQAG
+>d2a9ua1 a.118.23.1 (A:6-139) Ubiquitin carboxyl-terminal hydrolase 8, USH8 {Human (Homo sapiens) [TaxId: 9606]}
+SVPKELYLSSSLKDLNKKTEVKPEKISTKSYVHSALKIFKTAEECRLDRDEERAYVLYMKYVTVYNLIKKRPDFKQQQDYFHSILGPGNIKKAVEEAERLSESLKLRYEEAEVRKKLEEKDRQEEAQRLQQKRQ
+>d2absa1 c.72.1.1 (A:10-359) Adenosine kinase {Toxoplasma gondii [TaxId: 5811]}
+TGPMRVFAIGNPILDLVAEVPSSFLDEFFLKRGDATLATPEQMRIYSTLDQFNPTSLPGGSALNSVRVVQKLLRKPGSAGYMGAIGDDPRGQVLKELCDKEGLATRFMVAPGQSTGVCAVLINEKERTLCTHLGACGSFRLPEDWTTFASGALIFYATAYTLTATPKNALEVAGYAHGIPNAIFTLNLSAPFCVELYKDAMQSLLLHTNILFGNEEEFAHLAKVHNLVAAEKTALSTANKEHAVEVCTGALRLLTAGQNTSATKLVVMTRGHNPVIAAEQTADGTVVVHEVGVPVVAAEKIVDTNGAGDAFVGGFLYALSQGKTVKQCIMCGNACAQDVIQHVGFSLSFT
+>d2aeba_ c.42.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SRTIGIIGAPFSKGQPRGGVEEGPTVLRKAGLLEKLKEQECDVKDYGDLPFADIPNDSPFQIVKNPRSVGKASEQLAGKVAEVKKNGRISLVLGGDHSLAIGSISGHARVHPDLGVIWVDAHTDINTPLTTTSGNLHGQPVSFLLKELKGKIPDVPGFSWVTPCISAKDIVYIGLRDVDPGEHYILKTLGIKYFSMTEVDRLGIGKVMEETLSYLLGRKKRPIHLSFDVDGLDPSFTPATGTPVVGGLTYREGLYITEEIYKTGLLSGLDIMEVNPSLGKTPEEVTRTVNTAVAITLACFGLAREGNHKPIDYL
+>d2ag4a_ b.95.1.1 (A:) Ganglioside M2 (gm2) activator {Human (Homo sapiens) [TaxId: 9606]}
+HMSSFSWDNCDEGKDPAVIRSLTLEPDPIVVPGNVTLSVVGSTSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCHCPFKEGTYSLPKSEFVVPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI
+>d2ahma1 a.8.9.1 (A:6-78) Nonstructural protein 7, NSP7 {SARS coronavirus [TaxId: 227859]}
+SKMSDVKCTSVVLLSVLQQLRVESSSKLWAQCVQLHNDILLAKDTTEAFEKMVSLLSVLLSMQGAVDINRLCE
+>d2ahme1 d.302.1.1 (E:43-197) Nonstructural protein 8, NSP8 {SARS coronavirus [TaxId: 227859]}
+LKKSLNVAKSEFDRDAAMQRKLEKMADQAMTQMYKQARSEDKRAKVTSAMQTMLFTMLRKLDNDALNNIINNARDGCVPLNIIPLTTAAKLMVVVPDYGTYKNTCDGNTFTYASALWEIQQVVDADSKIVQLSEINMDNSPNLAWPLIVTALRAN
+>d2aiba_ a.134.1.1 (A:) beta-cinnamomin {Fungus (Phytophthora cinnamomi) [TaxId: 4785]}
+TACTATQQTAAYKTLVSILSESSFSQCSKDSGYSMLTATALPTNAQYKLMCASTACNTMIKKIVALNPPDCDLTVPTSGLVLDVYTYANGFSSKCASL
+>d2aj7a1 b.158.1.1 (A:1-148) Hypothetical protein BH3618 {Bacillus halodurans [TaxId: 86665]}
+MKVIETKYSGKLEVAEDRLIAFDQGIPAFEDEKEFVLLPFAAGTPYYTLQSTKTVDLAFIIVNPFSFFPEYRVKLPEATIAQLNITNENDVAIFSLLTVKEPFSETTVNLQAPIVINANKQMGKQLVLGDTAYNRKQPLFQKELVLAK
+>d2ap3a1 a.24.27.1 (A:12-196) Hypothetical protein MW0975 (SA0943) {Staphylococcus aureus [TaxId: 1280]}
+TTDKKEIKAYLKQVDKIKDDEEPIKTVGKKIAELDEKKKKLTEDVNSKDTAVRGKAVKDLIKNADDRLKEFEKEEDAIKKSEQDFKKAKSHVDNIDNDVKRKEVKQLDDVLKEKYKLHSDYAKAYKKAVNSEKTLFKYLNQNDATQQGVNEKSKAIEQNYKKLKEVSDKYTKVLNKVQKEKQDVD
+>d2apla1 a.258.1.1 (A:2-150) Hypothetical protein PG0816 {Porphyromonas gingivalis [TaxId: 837]}
+KSTEKKELSHFRLKLETYLNEHFPEMSGNNPFITARSDEALTAYCDAVAQGFSHPEAESMASEVLYQGLHFSRYDTLVSVLEREFEQELPSPLPERLAPILLKNKAIQSVFAKYDLTDDFEASPEYEHLYTELTGTIVLLIESNHLPTI
+>d2apob_ g.41.16.1 (B:) Ribosome biogenesis protein Nop10 {Methanococcus jannaschii [TaxId: 2190]}
+EMRMKKCPKCGLYTLKEICPKCGEKTVIPKPPKFSLEDRWGKYRRMLKRALKNKN
+>d2arca_ b.82.4.1 (A:) Regulatory protein AraC {Escherichia coli [TaxId: 562]}
+DPLLPGYSFNAHLVAGLTPIEANGYLDFFIDRPLGMKGYILNLTIRGQGVVKNQGREFVCRPGDILLFPPGEIHHYGRHPEAREWYHQWVYFRPRAYWHEWLNWPSIFANTGFFRPDEAHQPHFSDLFGQIINAGQGEGRYSELLAINLLEQLLLRRMEAI
+>d2asba2 d.52.3.1 (A:184-262) Transcription factor NusA, C-terminal domains {Mycobacterium tuberculosis [TaxId: 1773]}
+THPNLVRKLFSLEVPEIADGSVEIVAVAREAGHRSKIAVRSNVAGLNAKGACIGPMGQRVRNVMSELSGEKIDIIDYDD
+>d2au5a1 a.244.1.1 (A:1-132) Hypothetical protein EF2947 {Enterococcus faecalis [TaxId: 1351]}
+MLILSTEKEPNFEYEEITRSFLSNMLAFTRGHFTGDISHFSPIVLAEMEKDPNWLEEAAGGMQGVIVQSLLEDENFSSVEQLKGELARLIRLYFALAKDNLTENQESLYVDLFDKFTFLLLCSDEFIMYLDS
+>d2auwa2 d.331.1.1 (A:4-87) Hypothetical protein NE0471 N-terminal domain {Nitrosomonas europaea [TaxId: 915]}
+YFFPKLTAVEALAPYRLRTTWSTGEVLEVDVGDILRKIPDLAPILDPEAFARVHIAEWEGSVEWFDTEFGRDNVYAWAKEQAGE
+>d2axwa1 b.2.3.2 (A:1-121) Invasin AfaD {Escherichia coli [TaxId: 562]}
+AELHLESRGGSGTQLRDGAKVATGRIICREAHTGFHVWMNERQVDGRAERYVVQSKDGRHELRVRTGGDGWSPVKGEGGKGVSRPGQEEQVFFDVMADGNQDIAPGEYRFSVGGACVVPQE
+>d2ayda_ g.79.1.0 (A:) automated matches {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+SRIVVHTQTLFDIVNDGYRWRKYGQKSVKGSPYPRSYYRCSSPGCPVKKHVERSSHDTKLLITTYEGKHDHDMPPG
+>d2b0aa1 c.8.8.1 (A:1-186) Hypothetical protein MJ0783 {Methanococcus jannaschii [TaxId: 2190]}
+EILDLTQTLINFPRPGDPELRIIEKKIDGFIVSEIIMGSHLCTHIDYPKHVGLENRIPFKDGIIKGKGYCISLDDFPGNKLPACDILLIYTGFSKYWGRDEYFEKIPEIPFLDDIIKSNIKCVGIDACTIGGFEEHKRLLSNNILIIENLNENLKNLVGKSFYFLGLPLKIFDIDASPIRCIAILE
+>d2b1ea_ a.118.17.2 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+TLNSVASVKDLANEASKYEIILQKGINQVGLKQYTQVVHKLDDMLEDIQSGQANREENSEFHGILTHLEQLIKRSEAQLRVYFISILNSIKPFDPQINITKKMPFPYYEDQQLGALSWILDYFHGNSEGSIIQDILVGERSKLILKCMAFLEPFAKEISTAKNAPYEKGSSGMNSYTEALLGFIANEKSLVDDLYSQYTESKPHVLSQILSPLISAYAKLFGANLKIVRSNLENFGFFSFELVESINDVKKSLRGKELQNYNLLQDCTQEVRQVTQSLFRDAIDRIIKKANSISTIPSNNGVTEATVDTMSRLRKFSEYKNGCLGAMDNITRENWLPSNYKEKEYTLQNEALNWEDHNVLLSCFISDCIDTLAVNLERKAQIALMPNQEPDVANPNSSKNKHKQRIGFFILMNLTLVEQIVEKSELNLMLAGEGHSRLERLKKRYISYMVSDWRDLTANLMDSVFIDSSGKKSKDKEQIKEKFRKFNEGFEDLVSKTKQYKLSDPSLKVTLKSEIISLVMPMYERFYSRYKDSFKNPRKHIKYTPDELTTVLNQLVR
+>d2b1ya1 b.156.1.1 (A:4-104) Hypothetical protein Atu1913 {Agrobacterium tumefaciens [TaxId: 358]}
+PNFRYTHYDLKELRAGTTLEISLSSVNNVRLMTGANFQRFTELLDFKYLGGVAKKSPIRIAVPETMHWHLIIDAEGHSGLAESSVKMLPAQPQATLTRKAS
+>d2b4jc1 a.48.4.1 (C:346-426) PC4 and SFRS1-interacting protein, PSIP1 {Human (Homo sapiens) [TaxId: 9606]}
+SSMDSRLQRIHAEIKNSLKIDNLDVNRCIEALDELASLQVTMQQAQKHTEMITTLKKIRRFKVSQVIMEKSTMLYNKFKNM
+>d2b59b2 b.3.2.2 (B:8-103) Cellulosomal scaffolding protein A {Clostridium thermocellum [TaxId: 1515]}
+GYKVSGYILPDFSFDATVAPLVKAGFKVEIVGTELYAVTDANGYFEITGVPANASGYTLKISRATYLDRVIANVVVTGDTSVSTSQAPIMMWVGDI
+>d2b97a_ b.138.1.1 (A:) Hydrophobin II, HfbII {Trichoderma reesei [TaxId: 51453]}
+AVCPTGLFSNPLCCATNVLDLIGVDCKTPTIAVDTGAIFQAHCASKGSKPLCCVAPVADQALLCQKAIGT
+>d2b9da1 g.91.1.1 (A:42-93) E7 oncoprotein {Human papillomavirus type 1a [TaxId: 10583]}
+MKQPYAVVASCAYCEKLVRLTVLADHSAIRQLEEMLLRSLNIVCPLCTLQRQ
+>d2baya_ g.44.1.2 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MLCAISGKVPRRPVLSPKSRTIFEKSLLEQYVKDTGNDPITNEPLSIEEIVEIVPS
+>d2bbha1 d.328.1.1 (A:13-244) Magnesium transport protein CorA, soluble domain {Thermotoga maritima [TaxId: 2336]}
+PPGTLVYTGKYREDFEIEVMNYSIEEFREFKTTDVESVLPFRDSSTPTWINITGIHRTDVVQRVGEFFGTHPLVLEDILNVHQRPKVEFFENYVFIVLKMFTYDKNLHELESEQVSLILTKNCVLMFQEKIGDVFDPVRERIRYNRGIIRKKRADYLLYSLIDALVDDYFVLLEKIDDEIDVLEEEVLERPEKETVQRTHQLKRNLVELRKTIWPLREVLSSLYRDVPPLIE
+>d2bbkh_ b.69.2.1 (H:) Methylamine dehydrogenase, H-chain {Paracoccus denitrificans [TaxId: 266]}
+DEPRILEAPAPDARRVYVNDPAHFAAVTQQFVIDGEAGRVIGMIDGGFLPNPVVADDGSFIAHASTVFSRIARGERTDYVEVFDPVTLLPTADIELPDAPRFLVGTYPWMTSLTPDGKTLLFYQFSPAPAVGVVDLEGKAFKRMLDVPDCYHIFPTAPDTFFMHCRDGSLAKVAFGTEGTPEITHTEVFHPEDEFLINHPAYSQKAGRLVWPTYTGKIHQIDLSSGDAKFLPAVEALTEAERADGWRPGGWQQVAYHRALDRIYLLVDQRDEWRHKTASRFVVVLDAKTGERLAKFEMGHEIDSINVSQDEKPLLYALSTGDKTLYIHDAESGEELRSVNQLGHGPQVITTADMG
+>d2bfdb2 c.48.1.2 (B:205-342) Branched-chain alpha-keto acid dehydrogenase {Human (Homo sapiens) [TaxId: 9606]}
+PYNIPLSQAEVIQEGSDVTLVAWGTQVHVIREVASMAKEKLGVSCEVIDLRTIIPWDVDTICKSVIKTGRLLISHEAPLTGGFASEISSTVQEECFLNLEAPISRVCGYDTPFPHIFEPFYIPDKWKCYDALRKMINY
+>d2bgra1 b.70.3.1 (A:39-508) Dipeptidyl peptidase IV/CD26, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+SRKTYTLTDYLKNTYRLKLYSLRWISDHEYLYKQENNILVFNAEYGNSSVFLENSTFDEFGHSINDYSISPDGQFILLEYNYVKQWRHSYTASYDIYDLNKRQLITEERIPNNTQWVTWSPVGHKLAYVWNNDIYVKIEPNLPSYRITWTGKEDIIYNGITDWVYEEEVFSAYSALWWSPNGTFLAYAQFNDTEVPLIEYSFYSDESLQYPKTVRVPYPKAGAVNPTVKFFVVNTDSLSSVTNATSIQITAPASMLIGDHYLCDVTWATQERISLQWLRRIQNYSVMDICDYDESSGRWNCLVARQHIEMSTTGWVGRFRPSEPHFTLDGNSFYKIISNEEGYRHICYFQIDKKDCTFITKGTWEVIGIEALTSDYLYYISNEYKGMPGGRNLYKIQLSDYTKVTCLSCELNPERCQYYSVSFSKEAKYYQLRCSGPGLPLYTLHSSVNDKGLRVLEDNSALDKMLQNVQ
+>d2bhua2 b.71.1.1 (A:531-602) Glycosyltrehalose trehalohydrolase {Deinococcus radiodurans [TaxId: 1299]}
+QRENLTTGHDGDVLWVRTVTGAGERVLLWNLGQDTRAVAEVKLPFTVPRRLLLHTEGREDLTLGAGEAVLVG
+>d2bjka_ c.82.1.1 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+MTVEPFRNEPIETFQTEEARRAMREALRRVREEFGRHYPLYIGGEWVDTKERMVSLNPSAPSEVVGTTAKAGKAEAEAALEAAWKAFKTWKDWPQEDRSRLLLKAAALMRRRKRELEATLVYEVGKNWVEASADVAEAIDFIEYYARAALRYRYPAVEVVPYPGEDNESFYVPLGAGVVIAPWNFPVAIFTGMIVGPVAVGNTVIAKPAEDAVVVGAKVFEIFHEAGFPPGVVNFLPGVGEEVGAYLVEHPRIRFINFTGSLEVGLKIYEAAGRLAPGQTWFKRAYVETGGKDAIIVDETADFDLAAEGVVVSAYGFQGQKCSAASRLILTQGAYEPVLERVLKRAERLSVGPAEENPDLGPVVSAEQERKVLSYIEIGKNEGQLVLGGKRLEGEGYFIAPTVFTEVPPKARIAQEEIFGPVLSVIRVKDFAEALEVANDTPYGLTGGVYSRKREHLEWARREFHVGNLYFNRKITGALVGVQPFGGFKLSGTNAKTGALDYLRLFLEMKAVAERF
+>d2bjqa1 b.169.1.1 (A:175-344) Sperm motility protein MFP2 {Pig roundworm (Ascaris suum), isoform A [TaxId: 6253]}
+GIKIYDDTWLDLKYRDPFPAARNPIAAGGRKVKSDDGTEMFQYVALWYEHGQPVFGRAYPDSADKTLANFGWGGQENAGAEIGSFQMLVVPDPDILGFEYKWIPYKEAKAGGPFKPLHVGECTPCLLKDANGTERLGNLHMGMEKATAGLAGKDSAVSGPAVGDFLVLCR
+>d2bkya_ d.68.6.1 (A:) automated matches {Sulfolobus solfataricus [TaxId: 273057]}
+SNVVLIGKKPVMNYVLAALTLLNQGVSEIVIKARGRAISKAVDTVEIVRNRFLPDKIEIKEIRVGSQVVTSQDGRQSRVSTIEIAIRKK
+>d2bl8a1 a.29.8.2 (A:4-103) Enterocine A immunity protein, EntA-Im {Enterococcus faecium [TaxId: 1352]}
+NAKQIVHELYNDISISKDPKYSDILEVLQKVYLKLEKQKYELDPSPLINRLVNYLYFTAYTNKIRFTEYQEELIRNLSEIGRTAGINGLYRADYGDKSQF
+>d2blna1 b.46.1.1 (A:204-304) Polymyxin resistance protein ArnA, domain 2 {Escherichia coli [TaxId: 562]}
+DDSFLEWHKPASVLHNMVRAVADPWPGAFSYVGNQKFTVWSSRVHPHASKAQPGSVISVAPLLIACGDGALEIVTGQAGDGITMQGSQLAQTLGLVQGSRL
+>d2blna2 c.65.1.1 (A:1-203) Polymyxin resistance protein ArnA, N-terminal domain {Escherichia coli [TaxId: 562]}
+MKTVVFAYHDMGCLGIEALLAAGYEISAIFTHTDNPGEKAFYGSVARLAAERGIPVYAPDNVNHPLWVERIAQLSPDVIFSFYYRHLIYDEILQLAPAGAFNLHGSLLPKYRGRAPLNWVLVNGETETGVTLHRMVKRADAGAIVAQLRIAIAPDDIAITLHHKLCHAARQLLEQTLPAIKHGNILEIAQRENEATCFGRRTP
+>d2bmoa2 d.129.3.3 (A:153-439) Nitrobenzene dioxygenase alpha subunit, NBDO-alpha {Comamonas sp. JS765 [TaxId: 58226]}
+EAPPLIDYLGDAAWYLEPTFKYSGGLELVGPPGKVVVKANWKSFAENFVGDGYHVGWTHAAALRAGQSVFSSIAGNAKLPPEGAGLQMTSKYGSGMGVFWGYYSGNFSADMIPDLMAFGAAKQEKLAKEIGDVRARIYRSFLNGTIFPNNSFLTGSAAFRVWNPIDENTTEVWTYAFVEKDMPEDLKRRVADAVQRSIGPAGFWESDDNENMETMSQNGKKYQSSNIDQIASLGFGKDVYGDECYPGVVGKSAIGETSYRGFYRAYQAHISSSNWAEFENASRNWHI
+>d2bmwa1 b.43.4.2 (A:9-141) Ferredoxin reductase (flavodoxin reductase) N-terminal domain {Anabaena sp., pcc 7119 [TaxId: 1167]}
+DVPVNLYRPNAPFIGKVISNEPLVKEGGIGIVQHIKFDLTGGNLKYIEGQSIGIIPPGVDKNGKPEKLRLYSIASTRHGDDVDDKTISLCVRQLEYKHPESGETVYGVCSTYLTHIEPGSEVKITGPVGKEML
+>d2bmwa2 c.25.1.1 (A:142-303) Ferredoxin reductase (flavodoxin reductase) {Anabaena sp., pcc 7119 [TaxId: 1167]}
+LPDDPEANVIMLAGGTGITPMRTYLWRMFKDAERAANPEYQFKGFSWLVFGVPTTPNILYKEELEEIQQKYPDNFRLTYAISREQKNPQGGRMYIQDRVAEHADQLWQLIKNQKTHTYICGPPPMEEGIDAALSAAAAKEGVTWSDYQKDLKKAGRWHVETY
+>d2bogx_ c.6.1.1 (X:) Cellulase E2 {Thermobifida fusca YX [TaxId: 269800]}
+NDSPFYVNPNMSSAEWVRNNPNDPRTPVIRDRIASVPQGTWFAHHNPGQITGQVDALMSAAQAAGKIPILVVSNAPGRDCGNHSSGGAPSHSAYRSWIDEFAAGLKNRPAYIIVEPDLISLMSSCMQHVQQEVLETMAYAGKALKAGSSQARIYFDAGHSAWHSPAQMASWLQQADISNSAHGIATNTSNYRWTADEVAYAKAVLSAIGNPSLRAVIDTSRNGNGPAGNEWCDPSGRAIGTPSTTNTGDPMIDAFLWIKLPGEADGCIAGAGQFVPQAAYEMAIAA
+>d2bopa_ d.58.8.1 (A:) Papillomavirus-1 E2 protein {Bovine papillomavirus type 1 [TaxId: 10559]}
+SCFALISGTANQVKCYRFRVKKNHRHRYENCTTTWFTVADNGAERQGQAQILITFGSPSQRQDFLKHVPLPPGMNISGFTASLDF
+>d2brfa1 b.26.1.2 (A:8-108) Polynucleotide kinase 3'-phosphatase {Human (Homo sapiens) [TaxId: 9606]}
+GRLWLESPPGEAPPIFLPSDGQALVLGRGPLTQVTDRKCSRTQVELVADPETRTVAVKQLGVNPSTTGTQELKPGLEGSLGVGDTLYLVNGLHPLTLRWEE
+>d2brja1 b.159.1.1 (A:15-188) Allene oxide cyclase, AOC {Thale cress (Arabidopsis thaliana), chloroplast AOC2 [TaxId: 3702]}
+KVQELSVYEINELDRHSPKILKNAFSLMFGLGDLVPFTNKLYTGDLKKRVGITAGLCVVIEHVPEKKGERFEATYSFYFGDYGHLSVQGPYLTYEDSFLAITGGAGIFEGAYGQVKLQQLVYPTKLFYTFYLKGLANDLPLELTGTPVPPSKDIEPAPEAKALEPSGVISNYTN
+>d2bs2c_ f.21.2.1 (C:) automated matches {Wolinella succinogenes [TaxId: 844]}
+MTNESILESYSGVTPERKKSRMPAKLDWWQSATGLFLGLFMIGHMFFVSTILLGDNVMLWVTKKFELDFIFEGGKPIVVSFLAAFVFAVFIAHAFLAMRKFPINYRQYLTFKTHKDLMRHGDTTLWWIQAMTGFAMFFLGSVHLYIMMTQPQTIGPVSSSFRMVSEWMWPLYLVLLFAVELHGSVGLYRLAVKWGWFDGETPDKTRANLKKLKTLMSAFLIVLGLLTFGAYVKKGLEQTDPNIDYKYFDYKRTHE
+>d2btia_ b.151.1.1 (A:) automated matches {Yersinia enterocolitica [TaxId: 630]}
+SMLILTRRVGETLMIGDEVTVTVLGVKGNQVRIGVNAPKEVSVHREEIYQRIQAEKSQP
+>d2bv4a_ b.115.1.0 (A:) automated matches {Chromobacterium violaceum [TaxId: 536]}
+AQQGVFTLPARINFGVTVLVNSAATQHVEIFVDNEPRAAFSGVGTGDNNLGTKVINSGSGNVRVQITANGRQSDLVSSQLVLANKLNLAVVGSEDGTDMDYNDSIVILNWPLG
+>d2bvca1 d.15.9.1 (A:5-104) Glutamine synthetase, N-terminal domain {Mycobacterium tuberculosis [TaxId: 1773]}
+TPDDVFKLAKDEKVEYVDVRFCDLPGIMQHFTIPASAFDKSVFDDGLAFDGSSIRGFQSIHESDMLLLPDPETARIDPFRAAKTLNINFFVHDPFTLEPY
+>d2bw3a1 a.270.1.1 (A:79-162) Transposase Hermes, dimerisation domain {House fly (Musca domestica) [TaxId: 7370]}
+QSRELKTVSADCKKEAIEKCAQWVVRDCRPFSAVSGSGFIDMIKFFIKVKAEYGEHVNVEELLPSPITLSRKVTSDAKEKKALI
+>d2bz1a1 c.144.1.1 (A:1-174) GTP cyclohydrolase II, RibA {Escherichia coli [TaxId: 562]}
+MQLKRVAEAKLPTPWGDFLMVGFEELATGHDHVALVYGDISGHTPVLARVHSECLTGDALFSLRCDCGFQLEAALTQIAEEGRGILLYHRQEGRNIGLLNKIRAYALQDQGYDTVEANHQLGFAADERDFTLCADMFKLLGVNEVRLLTNNPKKVEILTEAGINIVERVPLIVG
+>d2bzva_ b.21.1.0 (A:) automated matches {Human adenovirus type 41 [TaxId: 10524]}
+SLTTIWSISPTPNCSIYETQDANLFLCLTKNGAHVLGTITIKGLKGALREMHDNALSLKLPFDNQGNLLNCALESSTWRYQETNAVASNALTFMPNSTVYPRNKTAHPGNMLIQISPNITFSVVYNEINSGYAFTFKWSAEPGKPFHPPTAVFCYITEQG
+>d2c0ga1 a.71.1.1 (A:1146-1251) Windbeutel, C-terminal domain {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+RDGCIKEFNEVLKNYANIPDAEQLKLIEKLQAKQEQLTDPEQQQNARAYLIYMRKIHEVGYDFLEEETKRLLRLKAGKVTEAKKEELLRKLNILEVFRVHKVTKTA
+>d2c1ia2 d.341.1.1 (A:46-267) Peptidoglycan GlcNAc deacetylase {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+FEQKIESLKKEKDDQLSEGNQKEHFRQGQAEVIAYYPLQGEKVISSVRELINQDVKDKLESKDNLVFYYTEQEESGLKGVVNRNVTKQIYDLVAFKIEETEKTSLGKVHLTEDGQPFTLDQLFSDASKAKEQLIKELTSFIEDKKIEQDQSEQIVKNFSDQDLSAWNFDYKDSQIILYPSPVVENLEEIALPVSAFFDVIQSSYLLEKDAALYQSYFDKKHQ
+>d2c2aa1 a.30.2.1 (A:232-320) Sensor histidine kinase TM0853 {Thermotoga maritima [TaxId: 2336]}
+MENVTESKELERLKRIDRMKTEFIANISHELRTPLTAIKAYAETIYNSLGELDLSTLKEFLEVIIDQSNHLENLLNELLDFSRLERKSL
+>d2c42a4 c.64.1.1 (A:416-668) Pyruvate-ferredoxin oxidoreductase, PFOR, domain III {Desulfovibrio africanus [TaxId: 873]}
+GTIQCQFWGLGADGTVGANKQAIKIIGDNTDLFAQGYFSYDSKKSGGITISHLRFGEKPIQSTYLVNRADYVACHNPAYVGIYDILEGIKDGGTFVLNSPWSSLEDMDKHLPSGIKRTIANKKLKFYNIDAVKIATDVGLGGRINMIMQTAFFKLAGVLPFEKAVDLLKKSIHKAYGKKGEKIVKMNTDAVDQAVTSLQEFKYPDSWKDAPAETKAEPMTNEFFKNVVKPILTQQGDKLPVSAFEADGRFPLG
+>d2c60a1 d.15.2.2 (A:43-122) Mitogen-activated protein kinase kinase kinase 3, MEKK 3 {Human (Homo sapiens) [TaxId: 9606]}
+SDVRIKFEHNGERRIIAFSRPVKYEDVEHKVTTVFGQPLDLHYMNNELSILLKNQDDLDKAIDILDRSSSMKSLRILLLS
+>d2c71a1 c.6.2.3 (A:480-683) Xylanase XynA C-terminal domain {Clostridium thermocellum [TaxId: 1515]}
+KLVALTFDDGPDNVLTARVLDKLDKYNVKATFMVVGQRVNDSTAAIIRRMVNSGHEIGNHSWSYSGMANMSPDQIRKSIADTNAVIQKYAGTTPKFFRPPNLETSPTLFNNVDLVFVGGLTANDWIPSTTAEQRAAAVINGVRDGTIILLHDVQPEPHPTPEALDIIIPTLKSRGYEFVTLTELFTLKGVPIDPSVKRMYNSVP
+>d2c78a1 b.43.3.1 (A:213-312) Elongation factor Tu (EF-Tu), domain 2 {Thermus thermophilus [TaxId: 274]}
+PVRDVDKPFLMPVEDVFTITGRGTVATGRIERGKVKVGDEVEIVGLAPETRKTVVTGVEMHRKTLQEGIAGDNVGVLLRGVSREEVERGQVLAKPGSITP
+>d2c78a2 b.44.1.1 (A:313-405) Elongation factor Tu (EF-Tu) {Thermus thermophilus [TaxId: 274]}
+HTKFEASVYVLKKEEGGRHTGFFSGYRPQFYFRTTDVTGVVQLPPGVEMVMPGDNVTFTVELIKPVALEEGLRFAIREGGRTVGAGVVTKILE
+>d2c9wa1 a.271.1.1 (A:149-198) Suppressor of cytokine signaling 2, SOCS-2 {Human (Homo sapiens) [TaxId: 9606]}
+HLYLTKPLYTSAPSLQHLCRLTINKCTGAIWGLPLPTRLKDYLEEYKFQV
+>d2ca5a1 a.2.20.1 (A:20-78) MxiH needle protein {Shigella flexneri [TaxId: 623]}
+DDGTQTLQGELTLALDKLAKNPSNPQLLAEYQSKLSEYTLYRNAQSNTVKVIKDVDAAI
+>d2cara1 c.51.4.1 (A:1-194) Inosine triphosphate pyrophosphatase, ITPase {Human (Homo sapiens) [TaxId: 9606]}
+MAASLVGKKIVFVTGNAKKLEEVVQILGDKFPCTLVAQKIDLPEYQGEPDEISIQKCQEAVRQVQGPVLVEDTCLCFNALGGLPGPYIKWFLEKLKPEGLHQLLAGFEDKSAYALCTFALSTGDPSQPVRLFRGRTSGRIVAPRGCQDFGWDPCFQPDGYEQTYAEMPKAEKNAVSHRFRALLELQEYFGSLAA
+>d2cb8a_ a.11.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SQAEFEKAAEEVRHLKTKPSDEEMLFIYGHYKQATVGDINTERPGMLDFTGKAKWDAWNELKGTSKEDAMKAYINKVEELKKKYGI
+>d2cc6a_ d.230.2.1 (A:) automated matches {Halobacterium salinarum [TaxId: 478009]}
+VFKKVLLTGTSEESFTAAADDAIDRAEDTLDNVVWAEVVDQGVEIGAVEERTYQTEVQVAFELD
+>d2ccqa1 d.314.1.1 (A:11-109) N-glycanase 1, N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+GSASPAVAELCQNTPETFLEASKLLLTYADNILRNPNDEKYRSIRIGNTAFSTRLLPVRGAVECLFEMGFEEGETHLIFPKKASVEQLQKIRDLIAIER
+>d2ccva1 b.154.1.1 (A:1-99) Agglutinin HPA {Roman snail (Helix pomatia) [TaxId: 6536]}
+RVQSGKIDCGDDAGWAKVPSDDPGRDNTRELAKNITFASPYCRPPVVLLSITQLDVEQSQNLRVIARLYSVSPSGFKASCYTWHNTKVYSMSISWISIE
+>d2ce7a1 a.269.1.1 (A:411-603) Cell division protein FtsH, C-terminal domain {Thermotoga maritima [TaxId: 2336]}
+LISPAEKRIIAYHEAGHAVVSTVVPNGEPVHRISIIPRGYKALGYTLHLPEEDKYLVSRNELLDKLTALLGGRAAEEVVFGDVTSGAANDIERATEIARNMVCQLGMSEELGPLAWGKEEQEVFLGKEITRLRNYSEEVASKIDEEVKKIVTNCYERAKEIIRKYRKQLDNIVEILLEKETIEGDELRRILSE
+>d2cg7a1 g.27.1.1 (A:109-151) Fibronectin {Human (Homo sapiens) [TaxId: 9606]}
+RCHEGGQSYKIGDTWRRPHETGGYMLECVCLGNGKGEWTCKPI
+>d2choa1 a.246.1.1 (A:437-590) Glucosaminidase GH84 post-catalytic domain {Bacteroides thetaiotaomicron [TaxId: 818]}
+REESMDIQPAAERFLKAFKEGKNYDKADFETLQYTFERMKESADILLMNTENKPLIVEITPWVHQFKLTAEMGEEVLKMVEGRNESYFLRKYNHVKALQQQMFYIDQTSNQNPYQPGVKTATRVIKPLIDRTFATVVKFFNQKFNAHLDATTDY
+>d2ci1a_ d.126.1.0 (A:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+ATFGRATHVVVRALPESLAQQALRRTKGDEVDFARAERQHQLYVGVLGSKLGLQVVQLPADESLPDCVFVEDVAVVCEETALITRPGAPSRRKEADMMKEALEKLQLNIVEMKDENATLDGGDVLFTGREFFVGLSKRTNQRGAEILADTFKDYAVSTVPVVDALHLKSFCSMAGPNLIAIGSSESAQKALKIMQQMSDHRYDKLTVPDDTAANCIYLNIPSKGHVLLHRTPEEYPESAKVYEKLKDHMLIPVSNSELEKVDGLLTMSSVLINKK
+>d2ciwa1 a.39.3.1 (A:0-119) Cloroperoxidase {Fungus (Caldariomyces fumago) [TaxId: 5474]}
+EEPGSGIGYPYDNNTLPYVAPGPTDSRAPCPALNALANHGYIPHDGRAISRETLQNAFLNHMGIANSVIELALTNAFVVCEYVTGSDCGDSLVNLTLLAEPHAFEHDHSFSRKDYKQGVA
+>d2cnqa_ d.143.1.1 (A:) SAICAR synthase {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+SITKTELDGILPLVARGKVRDIYEVDAGTLLFVATDRISAYDVIMENSIPEKGILLTKLSEFWFKFLSNDVRNHLVDIAPGKTIFDYLPAKLSEPKYKTQLEDRSLLVHKHKLIPLEVIVRGYITGSAWKEYVKTGTVHGLKQPQGLKESQEFPEPIFTPSTKAEQGEHDENISPAQAAELVGEDLSRRVAELAVKLYSKCKDYAKEKGIIIADTKFEFGIDEKTNEIILVDEVLTPDSSRFWNGASYKVGESQDSYDKQFLRDWLTANKLNGVNGVKMPQDIVDRTRAKYIEAYETLTGSKWS
+>d2cs7a1 d.9.2.1 (A:0-54) Pneumococcal histidine triad protein A, PhtA {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+QGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAFLSG
+>d2csba5 a.267.1.1 (A:3-293) Topoisomerase V, catalytic domain {Methanopyrus kandleri [TaxId: 2320]}
+LVYDAEFVGSEREFEEERETFLKGVKAYDGVLATRYLMERSSSAKNDEELLELHQNFILLTGSYACSIDPTEDRYQNVIVRGVNFDERVQRLSTGGSPARYAIVYRRGWRAIAKALDIDEEDVPAIEVRAVKRNPLQPALYRILVRYGRVDLMPVTVDEVPPEMAGEFERLIERYDVPIDEKEERILEILRENPWTPHDEIARRLGLSVSEVEGEKDPESSGIYSLWSRVVVNIEYDERTAKRHVKRRDRLLEELYEHLEELSERYLRHPLTRRWIVEHKRDIMRRYLEQR
+>d2cu2a1 b.81.4.1 (A:269-335) Putative mannose-1-phosphate guanylyl transferase (GDP)/mannose-6-phosphate isomerase TTHA1750 {Thermus thermophilus [TaxId: 274]}
+DPHENVVLGEGRHVALDTFGCVVYADRGVVATLGVSGLVVAKVGDEVLVVPKDWAREVREVVKRLEA
+>d2cvea2 d.58.11.2 (A:125-191) Hypothetical protein TTHA1053, C-terminal domain {Thermus thermophilus [TaxId: 274]}
+VERVGLAFLVPFAEVGRVYALLEARALKAEETYTPEGVRFALLLPKPEREGFLRALLDATRGQVALE
+>d2cwya1 a.246.2.1 (A:1-94) Hypothetical protein TTHA0068 {Thermus thermophilus [TaxId: 274]}
+MVPDWEEVLGLWRAGRYYEVHEVLEPYWLKATGEERRLLQGVILLAAALHQRRLGRPGLRNLRKAEARLEGLPCPLMGLDWRSLLQEARRRLGA
+>d2cx1a2 d.17.6.4 (A:1-90) Hypothetical protein APE0525, N-terminal domain {Aeropyrum pernix [TaxId: 56636]}
+MLWARLVGLARLEARALSKKERRSLLERLKPYYTRIPFSEKADLRLVKARTDSGEYEIITVDGVPCLFEWSDGRIYPTLQCLKAFGVDWL
+>d2cxha1 c.51.1.2 (A:13-192) Probable ribosomal biogenesis protein {Aeropyrum pernix [TaxId: 56636]}
+GYRILVTTSRRPSPRIRSFVKDLSATIPGAFRFTRGHYSMEELAREAIIRGADRIVVVGERRGNPGIIRVYAVEGPERPDNIVSFIVKGVSLSRERRWGLPSLRGGEVLVARPLDSGVAVEFADAFVIAFHARLKPPEAAGYVEAVIESLDARTVAVTFRYGGAPVGPMLRLGKPAEMVK
+>d2cxya_ a.4.3.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GEKITKVYELGNEPERKLWVDRYLTFMEERGSPVSSLPAVGKKPLDLFRLYVCVKEIGGLAQVNKNKKWRELATNLNVGTSSSAASSLKKQYIQYLFAFECKIERGEEPPPEVF
+>d2cyja1 c.103.1.1 (A:1-118) Hypothetical protein PH1505 {Pyrococcus horikoshii [TaxId: 53953]}
+MKIEEVRFGLVKIDGKEFDHDIVIYPSGRIERRMKEISKKKHGTSHKLDPEELEKYLVEDFDVLLVGTGIYGMLSLLPESKKLVEDKEVIEKPTKEALKLLEELWGKKRILAIIHVTC
+>d2czra1 c.52.4.1 (A:1-218) TBP-interacting protein {Thermococcus kodakaraensis [TaxId: 311400]}
+MYAELSPGTKKVYTQVRYLDDYHWEIEGSTITGIHKKSNVKVVIDVAKNREEADSLAGKDVNGIHIVAIPDNGVFYIKNGSFVLTYRYLKATLADINDHIVWSGFKVVEDNGKLVQEDVYEYLGAALVNHIKNNALAGQDYIFWQFYKCEECGKYVDIENLEAHLREHGIKLHEKSEEHYEVFELNFREGKVFDKFGGEVPMDKFSSEAREFIKEVLS
+>d2czvc1 d.58.59.1 (C:3-120) RNase P protein component 2, Rnp2 {Pyrococcus horikoshii [TaxId: 53953]}
+RKLKTLPPTLRDKNRYIAFEIISDGDFTKDEVKELIWKSSLEVLGETGTAIVKPWLIKFDPNTKTGIVRSDREYVEYLRFALMLVSEFNGKRLIIRTLGVSGTIKRLKRKFLAKYGWK
+>d2d00a1 c.149.1.1 (A:6-109) V-type ATP synthase subunit F, AtpF {Thermus thermophilus [TaxId: 274]}
+MAVIADPETAQGFRLAGLEGYGASSAEEAQSLLETLVERGGYALVAVDEALLPDPERAVERLMRGRDLPVLLPIAGLKEAFQGHDVEGYMRELVRKTIGFDIKL
+>d2d0oa1 c.8.6.1 (A:93-254) Diol dehydratase-reactivating factor large subunit DdrA {Klebsiella oxytoca [TaxId: 571]}
+ITESTMIGHNPKTPGGAGLGTGITITPQELLTRPADAPYILVVSSAFDFADIASVINASLRAGYQITGVILQRDDGVLVSNRLEKPLPIVDEVLYIDRIPLGMLAAIEVAVPGKVIETLSNPYGIATVFNLSPEETKNIVPMARALIGNRSAVVVKTPSGDV
+>d2d1sa_ e.23.1.1 (A:) Luciferase {Luciola cruciata [TaxId: 7051]}
+DENIVVGPKPFYPIEEGSAGTQLRKYMERYAKLGAIAFTNAVTGVDYSYAEYLEKSCCLGKALQNYGLVVDGRIALCSENCEEFFIPVIAGLFIGVGVAPTNEIYTLRELVHSLGISKPTIVFSSKKGLDKVITVQKTVTTIKTIVILDSKVDYRGYQCLDTFIKRNTPPGFQASSFKTVEVDRKEQVALIMNSSGSTGLPKGVQLTHENIVTRFSHARDPIYGNQVSPGTAVLTVVPFHHGFGMFTTLGYLICGFRVVMLTKFDEETFLKTLQDYKCTSVILVPTLFAILNKSELLNKYDLSNLVEIASGGAPLSKEVGEAVARRFNLPGVRQGYGLTETTSAIIITPEGDDKPGASGKVVPLFKAKVIDLDTKKSLGPNRRGEVCVKGPMLMKGYVNNPEATKELIDEEGWLHTGDIGYYDEEKHFFIVDRLKSLIKYKGYQVPPAELESVLLQHPSIFDAGVAGVPDPVAGELPGAVVVLESGKNMTEKEVMDYVASQVSNAKRLRGGVRFVDEVPKGLTGKIDGRAIREILKKPV
+>d2d28c1 d.52.10.1 (C:1-149) Type II secretion ATPase XpsE {Xanthomonas campestris [TaxId: 339]}
+MEQRSAETRIVEALLERRRLKDTDLVRARQLQAESGMGLLALLGRLGLVSERDHAETCAEVLGLPLVDARQLGDTPPEMLPEVQGLSLRFLKQFHLCPVGERDGRLDLWIADPYDDYAIDAVRLATGLPLLLHVGLRSEIDDLIERWYG
+>d2d8da1 a.130.1.1 (A:3-82) Chorismate mutase domain of P-protein {Thermus thermophilus [TaxId: 274]}
+ERIQALRKEVDRVNREILRLLSERGRLVQEIGRLQTELGLPHYDPKREEEMLAYLTAENPGPFPDETIRKLFKEIFKASL
+>d2d9ra1 b.129.2.1 (A:20-104) Hypothetical protein PG0164 {Porphyromonas gingivalis [TaxId: 837]}
+SPIEFDAIIRQVPDMDAAYVEIPFDVKTVYGKGRVRVNATFDGYPYTGYIVRMGLPCHILGLRQDIRRAIGKQPGDSVYVTLLPL
+>d2db7a1 a.273.1.1 (A:3-57) Hairy/enhancer-of-split related with YRPW motif protein 1; HESR-1 {Human (Homo sapiens) [TaxId: 9606]}
+GYFDAHALAMDYRSLGFRECLAEVARYLSIIEGLDASDPLRVRLVSHLNNYASQR
+>d2dbsa1 d.374.1.1 (A:7-86) Hypothetical protein TTHC002 {Thermus thermophilus [TaxId: 274]}
+RLAELDGVLMQYLLEADLLRELPPTYRLVLLPLDEPEVAAQALAWAMEAPNPEGWPSVYALFLQGRPIRLLLLGKEVEVA
+>d2dc4a_ d.63.1.2 (A:) automated matches {Pyrococcus horikoshii [TaxId: 53953]}
+MEIEVKFRVNFEDIKRKIEGLGAKFFGIEEQEDVYFELPSPKLLRVRKINNTGKSYITYKEILDKRNEEFYELEFEVQDPEGAIELFKRLGFKVQGVVKKRRWIYKLNNVTFELNRVEKAGDFLDIEVITSNPEEGKKIIWDVARRLGLKEEDVEPKLYIELIN
+>d2dewx1 b.2.9.1 (X:113-293) Peptidylarginine deiminase Pad4, middle domain {Human (Homo sapiens) [TaxId: 9606]}
+VEISLCADITRTGKVKPTRAVKDQRTWTWGPCGQGAILLVNCDRDNLESSAMDCEDDEVLDSEDLQDMSLMTLSTKTPKDFFTNHTLVLHVARSEMDKVRVFQATRGKLSSKCSVVLGPKWPSHYLMVPGGKHNMDFYVEALAFPDTDFPGLITLTISLLDTSNLELPEAVVFQDSVVFRV
+>d2djfa_ b.61.5.1 (A:) Dipeptidyl peptidase I (cathepsin C), exclusion domain {Human (Homo sapiens) [TaxId: 9606]}
+DTPANCTYLDLLGTWVFQVGSSGSQRDVNCSVMGPQEKKVVVYLQKLDTAYDDLGNSGHFTIIYNQGFEIVLNDYKWFAFFKYKEEGSKVTTYCNETMTGWVHDVLGRNWACFTGKKV
+>d2dlba1 b.174.1.1 (A:2002-2071) Uncharacterized protein YopT {Bacillus subtilis [TaxId: 1423]}
+AGYLNNIALNLEIVLKNKADSPEVSETLVTRICENLLLSKEVSFLKADGSVENFKLSDMEYEITNTEELP
+>d2dm9a1 d.81.4.1 (A:81-198) V-type ATP synthase subunit E {Pyrococcus horikoshii [TaxId: 53953]}
+EIISSVLEEVKRRLETMSEDEYFESVKALLKEAIKELNEKKVRVMSNEKTLGLIASRIEEIKSELGDVSIELGETVDTMGGVIVETEDGRIRIDNTFEARMERFEGEIRSTIAKVLFG
+>d2dpfa_ b.78.1.0 (A:) automated matches {Curculigo latifolia [TaxId: 4676]}
+DNVLLSGQTLHADHSLQAGAYTLTIQNKCNLVKYQNGRQIWASNTDRRGSGCRLTLLSDGNLVIYDHNNNDVWGSACWGDNGKYALVLQKDGRFVIYGPVLWSLGPNGCRR
+>d2dsya1 d.304.1.2 (A:3-82) Hypothetical protein TTHA0281 {Thermus thermophilus [TaxId: 274]}
+GMGTLTRYLEEAMARARYELIADEEPYYGEIPDLPGVWATGKSLKECEANLQAALEDWLLFLLSRGETPPPLGEVRIELP
+>d2dt8a_ c.119.1.0 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+MRITLVTDSTSDLPQDLRGRLGVRVVPLYVNLSGAIYRDWEEITPTEIFQKVREGAAFPTTSQPSPEDFARVYREALEEADHVLSLHISGKLSGTVQSAELAAQEFPGRVTVVDTQAASLGVGMMVLRAKELLEEGQSLEAVLAELERLRRDHFVRFSVATLEFLKRGGRIGGAQAFLGTLLNLKPVLTLKEGRVEAAGRARGEKKAREEILKAFRAWAEGRKRIRAYFLYSGDEDAVAALRQEVLASGLPVEEALVNELGAVIASHTGPGTYGFYAYSL
+>d2dwka_ a.256.1.1 (A:) automated matches {Mouse (Mus musculus) [TaxId: 10090]}
+MANERMNLMNMAKLSIKGLIESALNLGRTLDSDYAPLQQFFVVMEHCLKHGLKAKKTFLGQNKSFWGPLELVEKLVPEAAEITASVKDLPGLKTPVGRGRAWLRLALMQKKLSEYMKALINKKELLSEFYEVNALMMEEEGAIIAGLLVGLNVIDANFCMKGEDLDSQV
+>d2dyrb2 f.17.2.1 (B:1-90) Mitochondrial cytochrome c oxidase, subunit II {Cow (Bos taurus) [TaxId: 9913]}
+MAYPMQLGFQDATSPIMEELLHFHDHTLMIVFLISSLVLYIISLMLTTKLTHTSTMDAQEVETIWTILPAIILILIALPSLRILYMMDEI
+>d2e2aa_ a.7.2.1 (A:) Enzyme IIa from lactose specific PTS, IIa-lac {Lactococcus lactis [TaxId: 1358]}
+MNREEMTLLGFEIVAYAGDARSKLLEALKAAENGDFAKADSLVVEAGSCIAEAHSSQTGMLAREASGEELPYSVTMMHGQLHLMTTILLKDVIHHLIELYKRGA
+>d2e3ha1 b.34.10.1 (A:212-282) CLIP-115 {Human (Homo sapiens) [TaxId: 9606]}
+LKIGDRVLVGGTKAGVVRFLGETDFAKGEWCGVELDEPLGKNDGAVAGTRYFQCQPKYGLFAPVHKVTKIG
+>d2e50a1 d.305.1.1 (A:1-222) Protein SET {Human (Homo sapiens) [TaxId: 9606]}
+MSAQAAKVSKKELNSNHDGADETSEKEQQEAIEHIDEVQNEIDRLNEQASEEILKVEQKYNKLRQPFFQKRSELIAKIPNFWVTTFVNHPQVSALLGEEDEEAMHYLTRVEVTEFEDIKSGYRIDFYFDENPYFENKVLSKEFHMNESGDPSSKSTEIKWKSGKDMTKRSSQTQNKASRKRQHEEPESFFTWFTDHSDAGADELGEVIKDDIWPNPLQYYLV
+>d2e64a1 b.34.1.1 (A:189-235) Biotin--[acetyl-CoA-carboxylase] ligase C-terminal domain {Pyrococcus horikoshii [TaxId: 53953]}
+GVRVKILGDGSFEGIAEDIDDFGRLIIRLDSGEVKKVIYGDVSLRFL
+>d2e9xa1 a.278.1.1 (A:1-144) DNA replication complex GINS protein PSF1 {Human (Homo sapiens) [TaxId: 9606]}
+MFCEKAMELIRELHRAPEGQLPAFNEDGLRQVLEEMKALYEQNQSDVNEAKSGGRSDLIPTIKFRHCSLLRNRRCTVAYLYDRLLRIRALRWEYGSVLPNALRFHMAAEEMEWFNNYKRSLATYMRSLGGDEGLDITQDMKPPK
+>d2e9xb2 d.344.1.2 (B:1-61) DNA replication complex GINS protein PSF2 {Human (Homo sapiens) [TaxId: 9606]}
+MDAAEVEFLAEKELVTIIPNFSLDKIYLIGGDLGPFNPGLPVEVPLWLAINLKQRQKCRLL
+>d2ebfx1 a.296.1.1 (X:575-874) Dermonecrotic toxin, ToxA {Pasteurella multocida [TaxId: 747]}
+LGGSPYSPFRIGLEGVWTPEVLKARASVIGKPIGESYKRILAKLQRIHNSNILDERQGLMHELMELIDLYEESQPSSERLNAFRELRTQLEKALYLPEMEALKKQILQIPNKGSGAARFLLRTAMNEMAGKTSESTADLIRFALQDTVISAPFRGYAGAIPEAIDFPVKYVIEDISVFDKIQTNYWELPAYESWNEGSNSALLPGLLRESQSKGMLSKCRIIENSLYIGHSYEEMFYSISPYSNQVGGPYELYPFTFFSMLQEVQGDLGFEQAFATRNFFNTLVSDRLSLMENTMLLTES
+>d2ebsa1 b.69.13.1 (A:4-430) Oligoxyloglucan reducing end-specific cellobiohydrolase {Yeast (Geotrichum sp. M128) [TaxId: 203496]}
+YEFKNVAIGGGGYITGIVAHPKTKDLLYARTDIGGAYRWDAGTSKWIPLNDFIEAQDMNIMGTESIALDPNNPDRLYLAQGRYVGDEWAAFYVSEDRGQSFTIYESPFPMGANDMGRNNGERLAVNPFNSNEVWMGTRTEGIWKSSDRAKTWTNVTSIPDAFTNGIGYTSVIFDPERNGTIYASATAPQGMYVTHDGGVSWEPVAGQPSSWLNRTTGAFPDKKPASIAPQPMKVALTPNFLYVTYADYPGPWGVTFGEVWRQNRTSGAWDDITPRVGNSSPAPYNNQTFPAGGFCGLSVDATNPNRLVVITLDRDPGPALDSIYLSTDAGATWKDVTQLSSPSNLEGNWGHPTNAARYKDGTPVPWLDFNNGPQWGGYGAPHGTPGLTKFGWWMSAVLIDPFNPEHLMYGTGATIWATDTLSRVEKD
+>d2ed6a1 b.170.1.1 (A:32-201) Envelope protein VP28 {White spot syndrome virus, WSSV [TaxId: 92652]}
+TVTKTIETHTDNIETNMDENLRIPVTAEVGSGYFKMTDVSFDSDTLGKIKIRNGKSDAQMKEEDADLVITPVEGRALEVTVGQNLTFEGTFKVWNNTSRKINITGMQMVPKINPSKAFVGSSNTSSFTPVSIDEDEVGTFVCGTTFGAPIAATAGGNLFDMYVHVTYSGT
+>d2eiya_ e.17.1.0 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+QIKAGLIWMNGAFVPQEEAKTSVLSHALHYGTSVFEGIRAYETAKGPAIFRLKEHVKRFYNSAKVLRMEIPFAPEELEEAIKEVVRRNGYRSCYIRPLAWMGAKALGVNPLPNNPAEVMVAAWEWGAYLGEEAVRKGARLITSSWARFPANVMPGKAKVGGNYVNSALAKMEAVAAGADEALLLDEEGYVAEGSGENLFFVRDGVIYALEHSVNLEGITRDSVIRIAKDLGYEVQVVRATRDQLYMADEVFMTGTAAEVTPVSMIDWRPIGKGTAGPVALRLREVYLEAVTGRRPEYEGWLTYVN
+>d2elca1 a.46.2.1 (A:1-52) Anthranilate phosphoribosyltransferase (TrpD) {Thermus thermophilus [TaxId: 274]}
+MDAVKKAILGEVLEEEEAYEVMRALMAGEVSPVRAAGLLVALSLRGERPHEI
+>d2elca2 c.27.1.1 (A:66-329) Anthranilate phosphoribosyltransferase (TrpD) {Thermus thermophilus [TaxId: 274]}
+LRVHRRPLLDIVGTGGDGKGLMNLSTLAALVAAAGGVAVAKHGNRAASSRAGSADLLEALGVDLEAPPERVGEAIEELGFGFLFARVFHPAMRHVAPVRAELGVRTVFNLLGPLTNPAGADAYVLGVFSPEWLAPMAEALERLGARGLVVHGEGADELVLGENRVVEVGKGAYALTPEEVGLKRAPLEALKGGGPEENAALARRLLKGEEKGPLADAVALAAGAGFYAAGKTPSLKEGVALAREVLASGEAYLLLERYVAFLRA
+>d2enda_ a.18.1.1 (A:) T4 endonuclease V {Bacteriophage T4 [TaxId: 10665]}
+TRINLTLVSELADQHLMAEYRELPRVFGAVRKHVANGKRVRDFKISPTFILGAGHVTFFYDKLEFLRKRQIELIAECLKRGFNIKDTTVQDISDIPQEFRGDYIPHEASIAISQARLDEKIAQRPTWYKYYGKAIYA
+>d2erla_ a.10.1.1 (A:) ER-1 {Euplotes raikovi [TaxId: 5938]}
+DACEQAAIQCVESACESLCTEGEDRTGCYMYIYSNCPPYV
+>d2es4d1 a.137.15.1 (D:53-332) Lipase chaperone LifO (LipB) {Burkholderia glumae [TaxId: 337]}
+MPLPAALPGALAGSHAPRLPLAAGGRLARTRAVREFFDYCLTAQGELTPAALDALVRREIAAQLDGSPAQAEALGVWRRYRAYFDALAQLPGDGAVLGDKLDPAAMQLALDQRAALADRTLGEWAEPFFGDEQRRQRHDLERIRIANDTTLSPEQKAARLAALDAQLTPDERAQQAALHAQQDAVTKIADLQKAGATPDQMRAQIAQTLGPEAAARAAQMQQDDEAWQTRYQAYAAERDRIAAQGLAPQDRDARIAQLRQQTFTAPGEAIRAASLDRGAG
+>d2es9a1 a.247.1.1 (A:11-107) Hypothetical protein YoaC {Salmonella typhimurium [TaxId: 90371]}
+TAIEKALDFIGGMNTSASVPHSMDESTAKGILKYLHDLGVPVSPEVVVARGEQEGWNPEFTKKVAGWAEKVASGNRILIKNPEYFSTYMQEQLKELV
+>d2etda1 a.29.9.1 (A:35-183) Hypothetical protein TM0961 {Thermotoga maritima [TaxId: 2336]}
+LVSLEQEVQEKYSQIQNQLQRRADLIPNLVETVKGYAAHEKEILEEIANARAKLIGAKTPQESAQADAELSSALSRLLAIAENYPNLKADANFRQLMDELAGTENRIAVARRDYNEAVKKYNTAIKKFPGVIFAKMFGFEEKQYFEAKP
+>d2euca1 a.249.1.1 (A:1-113) Hypothetical protein YfmB {Bacillus subtilis [TaxId: 1423]}
+MQYFSPEQQYNAWIVSDLVKQIFHKRAGCSPGIHELAVFAEEHFHIDIDFVFSIIMNIGDIEFALTDEIEKKLSGYLSTLLPYVTADMFETSKANAHAFLSRRHGNAAYHLFV
+>d2evra1 b.34.11.3 (A:13-86) Cell wall-associated hydrolase Spr N-terminal domain {Nostoc punctiforme [TaxId: 272131]}
+KLGEYQCLADLNLFDSPECTRLATQSASGRHLWVTSNHQNLAVEVYLCEDDYPGWLSLSDFDSLQPATVPYQAA
+>d2ew0a1 d.310.1.1 (A:5-179) Hypothetical protein ACIAD0353 {Acinetobacter sp. ADP1 [TaxId: 62977]}
+YLTHRCLIAPPEMADDFFANTVIYLARHDEEGAQGIIINRPAGIQIKELLNDLDIDADNVNPHEVLQGGPLRPEAGFVLHTGQPTWHSSIAVGENVCITTSKDILDAIAHNEGVGRYQIALGYASWGKNQLEDEIARGDWLICDADMDLIFNLPYDDRWDAAYKKIGVDRTWLAS
+>d2ewha1 d.58.56.1 (A:6-98) Major carboxysome shell protein 1A, CsoS1A {Halothiobacillus neapolitanus [TaxId: 927]}
+GIALGMIETRGLVPAIEAADAMTKAAEVRLVGRQFVGGGYVTVLVRGETGAVNAAVRAGADACERVGDGLVAAHIIARVHSEVENILPKAPQA
+>d2f01a_ b.61.1.1 (A:) Streptavidin {Streptomyces avidinii [TaxId: 1895]}
+EAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAESRYVLTGRYDSAPATDGSGTALGWTVAWKNNYRNAHSATTWSGQYVGGAEARINTQWLLTSGTTEANAWKSTLVGHDTFTKVK
+>d2f0ca2 b.108.1.4 (A:17-62) Baseplate protein (bpp), N-terminal domain {Lactococcus phage tp901-1 [TaxId: 35345]}
+TINDDLEAINSELTSGGNVVHKTGDETIAGKKTFTGNVEVNGSLTL
+>d2f22a1 a.213.1.2 (A:1-141) Hypothetical protein BH3987 {Bacillus halodurans [TaxId: 86665]}
+MDTNGVLYAANMTNALAKEIPESKWDIQLIPELGTLRKLFIHIVRVRDVYRDGLKTGSIKFPGRLASDEHRLLDELERSMEELVFEFKQTTFNSIKMGENYLSIMELLGTVIQHEGIHQGQYYVALKQSGINLPKQWVQDW
+>d2f23a1 a.2.1.1 (A:3-77) GreA transcript cleavage protein, N-terminal domain {Thermus thermophilus [TaxId: 274]}
+REVKLTKAGYERLMQQLERERERLQEATKILQELMESSDDYDDSGLEAAKQEKARIEARIDSLEDILSRAVILEE
+>d2f2ba_ f.19.1.0 (A:) automated matches {Methanothermobacter marburgensis [TaxId: 79929]}
+MVSLTKRCIAEFIGTFILVFFGAGSAAVTLMIASGGTSPNPFNIGIGLLGGLGDWVAIGLAFGFAIAASIYALGNISGCHINPAVTIGLWSVKKFPGREVVPYIIAQLLGAAFGSFIFLQCAGIGAATVGGLGATAPFPGISYWQAMLAEVVGTFLLMITIMGIAVDERAPKGFAGIIIGLTVAGIITTLGNISGSSLNPARTFGPYLNDMIFAGTDLWNYYSIYVIGPIVGAVLAALTYQYLTS
+>d2f2ha1 b.150.1.1 (A:666-773) Putative glucosidase YicI, C-terminal domain {Escherichia coli [TaxId: 562]}
+NTLLALGNNDQRPDYVWHEGTAFHLFNLQDGHEAVCEVPAADGSVIFTLKAARTGNTITVTGAGEAKNWTLCLRNVVKVNGLQDGSQAESEQGLVVKPQGNALTITLH
+>d2f4ia1 b.40.11.1 (A:39-214) Hypothetical protein TM0957 {Thermotoga maritima [TaxId: 2336]}
+FDPKRYARELWFKLQDMMNEGLGYDAVEVLNTLDENPELAHQKFAKVVGVSNYRYYIIQGVGEIVEIKDDGILVKVRENRKVPDLFLSNHIFGNGIVNATGIAKMEDFDRIIDFNLTATELNKIVKEEVVNSFLKQLSKGAGSVGSLVRFIAVFTLLKDEEIKYPIEAIPLYLEIQ
+>d2f4mb_ a.189.1.1 (B:) automated matches {Mouse (Mus musculus) [TaxId: 10090]}
+GHPLEFLRNQPQFQQMRQIIQQNPSLLPALLQQIGRENPQLLQQISQHQEHFIQMLNEPVG
+>d2f5tx1 b.38.5.1 (X:247-338) Transcriptional regulator TrmB {Thermococcus litoralis [TaxId: 2265]}
+NPKDIRFFAMFHAVDFVKNHLKNRNIYAEITGKNLESGRLETLTGRVVGYTLSLREAVNNIHLETENGVVKVGGMFAVIEDYESTEIKFIMG
+>d2f69a1 b.76.2.1 (A:116-193) Histone H3 K4-specific methyltransferase SET7/9 N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+HGVCWIYYPDGGSLVGEVNEDGEMTGEKIAYVYPDERTALYGKFIDGEMIEGKLATLMSTEEGRPHFELMPGNSVYHF
+>d2f69a2 b.85.7.1 (A:194-364) Histone H3 K4-specific methyltransferase SET7/9 catalytic domain {Human (Homo sapiens) [TaxId: 9606]}
+DKSTSSCISTNALLPDPYESERVYVAESLISSAGEGLFSKVAVGPNTVMSFYNGVRITHQEVDSRDWALNGNTLSLDEETVIDVPEPYNHVSKYCASLGHKANHSFTPNCIYDMFVHPRFGPIKCIRTLRAVEADEELTVAYGYDHSPPGKSGPEAPEWYQVELKAFQATQ
+>d2f6ma_ a.2.17.1 (A:) Vacuolar protein sorting-associated protein 23, VPS23 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MTDGLNQLYNLVAQDYALTDTIEALSRMLHRGTIPLDTFVKQGRELARQQFLVRWHIQRITSPLS
+>d2f8ya_ d.211.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+AVISDFIYQGASLHNQTDRTGETALHLAARYSRSDAAKRLLEASADANIQDNMGRTPLHAAVSADAQGVFQILIRNRATDLDARMHDGTTPLILAARLAVEGMLEDLINSHADVNAVDDLGKSALHWAAAVNNVDAAVVLLKNGANKDMQNNREETPLFLAAREGSYETAKVLLDHFANRDITDHMDRLPRDIAQERMHHDIVRLLDEYNLVRSP
+>d2f9ha1 b.161.1.1 (A:3-123) PTS system, IIa component (PTSIIA) {Enterococcus faecalis [TaxId: 1351]}
+WKMQATVTEIGKHAIDDSEKMIILFGETATDTLKQHAVIQSFPEKDQVTLAEGDHLKIGDTNYTITKVGSFANSNLQSIAHSTLIFADAPTDEDDVIRNGVYLTPHQLPKITIGTTIDYLV
+>d2fb5a1 d.320.1.1 (A:5-205) Hypothetical protein BC4920 (YojJ) {Bacillus cereus [TaxId: 1396]}
+MHEWGLSEELKIQTKQMIEIAEKELSIMRNAIDKEDECILCKMEDIHHMLANVQTLAATYYIQAYLSPYTESSSFITTAIQHLSARKHGALIVVERNETLEALIQTGTTLNAHLTAPLLESIFYPGNPLHDGAVLVKNNHIVSAANILPLTKSTEVDPELGTRHRAAIGLSEKSDALILVVSEETGRTSFALNGILYTISL
+>d2fcja1 c.136.1.1 (A:1-114) Hypothetical protein RBSTP2199 {Bacillus stearothermophilus [TaxId: 1422]}
+MRRVEKVIIVEGRSDKQKVAAVLNEPVVIVCTNGTISDARLEELADELEGYDVYLLADADEAGEKLRRQFRRMFPEAEHLYIDRAYREVAAAPIWHLAQVLLRARFDVRIESLM
+>d2fcla1 d.218.1.11 (A:1-157) Hypothetical protein TM1012 {Thermotoga maritima [TaxId: 2336]}
+MIRPEYLRVLRKIYDRLKNEKVNWVVTGSLSFALQGVPVEVHDIDIQTDEEGAYEIERIFSEFVSKKVRFSSTEKICSHFGELIIDGIKVEIMGDIRKRLEDGTWEDPVDLNKYKRFVETHGMKIPVLSLEYEYQAYLKLGRVEKAETLRKWLNERK
+>d2fcwa1 a.13.1.1 (A:216-320) alpha-2-Macroglobulin receptor associated protein (RAP) {Human (Homo sapiens) [TaxId: 9606]}
+AEFEEPRVIDLWDLAQSANLTDKELEAFREELKHFEAKIEKHNHYQKQLEIAHEKLRHAESVGDGERVSRSREKHALLEGRTKELGYTVKKHLQDLSGRISRARH
+>d2fcwb1 g.12.1.1 (B:86-124) Ligand-binding domain of low-density lipoprotein receptor {Human (Homo sapiens) [TaxId: 9606]}
+KTCSQAEFRCHDGKCISRQFVCDSDRDCLDGSDEASCPV
+>d2fdoa1 d.337.1.1 (A:1-92) Hypothetical protein AF2331 {Archaeoglobus fulgidus [TaxId: 2234]}
+MPAYVFSKESFLKFLEGHLEDDVVVVVSSDVTDFCKKLSESMVGEKEYCFAEFAFPADIFDADEDEIDEMMKYAIVFVEKEKLSEAGRNAIR
+>d2fefa1 a.29.11.1 (A:6-129) Hypothetical protein PA2201 {Pseudomonas aeruginosa [TaxId: 287]}
+LTLDNRLAEALPLWRNLARTDRAPRRNIDLADWKADWRELIAALDRFSRSHGYRQPFAAQGHAALENAWAWGQAAENASTLLLKAIDRGLAGAELRSIYLETAALWLDYSRLLGAARDSLREQG
+>d2fefa2 a.254.1.1 (A:135-293) Hypothetical protein PA2201 {Pseudomonas aeruginosa [TaxId: 287]}
+TAPALAPRTGQYPFALQLLAMGVLLDAQELIPALVEEVLQFDTDRLLDYLGAAALGLTSASEETFHPRPFGQLRAFFEEADGSDAQALAPYLQSQYREFFQLSPKAQKKTRRLTGPYAWGWWAMEVSALGVLYGWDDGVLRASPHYLGDLVDYARARGD
+>d2ffga1 d.317.1.1 (A:2-79) Hypothetical protein YkuJ {Bacillus subtilis [TaxId: 1423]}
+SQLMGIITRLQSLQETAEAANEPMQRYFEVNGEKICSVKYFEKNQTFELTVFQKGEKPNTYPFDNIDMVSIEIFELLQ
+>d2fg1a_ c.50.1.2 (A:) automated matches {Bacteroides thetaiotaomicron [TaxId: 226186]}
+NAMEILYIKGDATAPIGSGVKVITHICNDIGGWGKGFVLALSKKWKMPEEAYRQWYKSQEEFTLGAVQFVNVENKLYVANMIGQHGIYKDSKGLPPIRYDAVRQCLKEVALFTIAHKASVHMPRIGCGLAGGKWELMEQIIKEELITKEIAVTVYDL
+>d2fgga1 d.50.5.1 (A:4-87) Hypothetical protein Rv2632c/MT2708 {Mycobacterium tuberculosis [TaxId: 1773]}
+SEHVGKTCQIDVLIEEHDERTRAKARLSWAGRQMVGVGLARLDPADEPVAQIGDELAIARALSDLANQLFALTSSDIEASTHQP
+>d2fgqx_ f.4.3.1 (X:) automated matches {Delftia acidovorans [TaxId: 80866]}
+SVTLFGIVDTNVAYVNKDAAGDSRYGLGTSGASTSRLGLRGTEDLGGGLKAGFWLEGEIFGDDGNASGFNFKRRSTVSLSGNFGEVRLGRDLVPTSQKLTSYDLFSATGIGPFMGFRNWAAGQGADDNGIRANNLISYYTPNFGGFNAGFGYAFDEKQTIGTADSVGRYIGGYVAYDNGPLSASLGLAQQKTAVGGLATDRDEITLGASYNFGVAKLSGLLQQTKFKRDIGGDIKTNSYMLGASAPVGGVGEVKLQYALYDQKAIDSKAHQITLGYVHNLSKRTALYGNLAFLKNKDASTLGLQAKGVYAGGVQAGESQTGVQVGIRHAF
+>d2fhza1 d.311.1.1 (A:27-109) Colicin E5 immunity protein ImmE5 {Escherichia coli [TaxId: 562]}
+MKLSPKAAIEVCNEAAKKGLWILGIDGGHWLNPGFRIDSSASWTYDMPEEYKSKIPENNRLAIENIKDDIENGYTAFIITLKM
+>d2fhzb_ d.243.1.2 (B:) Colicin E5 {Escherichia coli [TaxId: 562]}
+LKIDQKIRGQMPERGWTEDDIKNTVSNGATGTSFDKRSPKKTPPDYLGRNDPATVYGSPGKYVVVNDRTGEVTQISDKTDPGWVDDSRIQWGN
+>d2fi0a1 a.248.1.1 (A:3-81) Hypothetical protein SPr0485/SP0561 {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+VVMDNIIDVSIPVAEVVDKHPEVLEILVELGFKPLANPLMRNTVGRKVSLKQGSKLAGTPMDKIVRTLEANGYEVIGLD
+>d2fiya1 e.59.1.1 (A:19-308) FdhE homolog PA4809 {Pseudomonas aeruginosa [TaxId: 287]}
+PHLHQPSRDLFARRGERLLQLAEGHPMGDYLRLVAGLCRLQQALLDNPPALAPLDPERLRKSREHGMPPLAYDLLVREGAWLPWLDALLAGYPAPANAAVGAALEQLREAEEGQRKAWAIALLSGQFDLLPAALVPFLGAALQVAWSHWLLGLEEGAVVETESRTLCPACGSPPMAGMIRQGGKETGLRYLSCSLCACEWHYVRIKCSHCEESKHLAYLSLEHDGQPAEKAVLRAETCPSCQGYLKQFYLEFDRHADALADDLASLALDMRLAEDGYLRRSPNLLLAPGG
+>d2fj8a1 g.3.13.1 (A:64-122) Bowman-Birk inhibitor, BBI {Barley (Hordeum vulgare) [TaxId: 4513]}
+RPWECCDKAICTRSNPPTCRCVDEVKKCAPTCKTCLPSRSRPSRRVCIDSYFGPVPPRC
+>d2fl7a_ b.34.12.0 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+LDGWQVIITDDQGRVIDDNNRRRSRKRGGENVFLKRISDGLSFGKGESVIFNDNVTETYSVYLIHEIRLNTLNNVVEIWVFSYLRWFELKPKLYYEQFRPDLIKEDHPLEFYKDKFFNEVNKSELYLTAELSEIWLKDFIAVGQILPESQWNDSSIDKIEDRDFLVRYACEPTAEKFVPIDIFQIIRRVKEMEPKQSDEYLKRVSVPV
+>d2fm9a1 a.257.1.1 (A:49-263) Cell invasion protein SipA, N-terminal domain {Salmonella typhimurium [TaxId: 90371]}
+PQLEDFPALIKQASLDALFKCGKDAEALKEVFTNSNNVAGKKAIMEFAGLFRSALNATSDSPEAKTLLMKVGAEYTAQIIKDGLKEKSAFGPWLPETKKAEAKLENLEKQLLDIIKNNTGGELSKLSTNLVMQEVMPYIASCIEHNFGCTLDPLTRSNLTHLVDKAAAKAVEALDMCHQKLTQEQGTSVGREARHLEMQTLIPLLLRNVFAQIPA
+>d2fmaa_ d.230.3.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+EACKFLHQERMDVCETHLHWHTVAKETCSEKSTNLHDYGMLLPCGIDKFRGVEFVCCPL
+>d2fmpa1 a.60.6.1 (A:10-91) DNA polymerase beta, N-terminal (8 kD)-domain {Human (Homo sapiens) [TaxId: 9606]}
+TLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIRQD
+>d2fmpa2 a.60.12.1 (A:92-148) DNA polymerase beta {Human (Homo sapiens) [TaxId: 9606]}
+DTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYFGDFEK
+>d2fpna1 d.129.10.1 (A:1-214) Hypothetical protein YwmB {Bacillus subtilis [TaxId: 1423]}
+LTPLAQMAEGMERQDVSIDKWTLHAKQNLSLTEKEFYQKVQRLKQEYRQYDWVIAREDKMIKAIGTYTDKKNRTSFRLQLVTTLKKHNPTSYLLYEQMSLETPDSWNDTYEQFERETLGIFQEKVVIFTCLNGHLDDNMNIVLQKKANQLLNEFQARSVEHVVEPNFVSISAFTDEWEEYIMTSKHKMNLQIALRSAGMGGKHTVTVGTPIVTT
+>d2fqma1 d.378.1.1 (A:107-171) Phosphoprotein P (M1) {Vesicular stomatitis indiana virus [TaxId: 11277]}
+DWKQPELESDEHGKTLRLTLPEGLSGEQKSQWMLTIKAVVQSAKHWNLAECTFEASGEGVIIKKR
+>d2fsqa1 d.61.1.4 (A:6-237) Putative phosphoesterase Atu0111 {Agrobacterium tumefaciens [TaxId: 358]}
+VSKDLDYISTANHDQPPRHLGSRFSAEGEFLPEPGNTVVCHLVEGSQTESAIVSTRQRFLDMPEASQLAFTPVSSLHMTVFQGVIESRRALPYWPQTLPLDTPIDAVTDYYRDRLSTFPTLPAFNMRVTGLRPVGMVMKGATAEDDSIVALWRDTFADFFGYRHPDHDTYEFHITLSYIVSWFEPECLPRWQAMLDEELEKLRVAAPVIQMRPPAFCEFKDMNHFKELVVFD
+>d2fsua1 c.67.2.1 (A:12-194) Phosphonate metabolism protein PhnH {Escherichia coli [TaxId: 562]}
+QDAQHSFRRLLKAMSEPGVIVALHQLKRGWQPLNIATTSVLLTLADNDTPVWLSTPLNNDIVNQSLRFHTNAPLVSQPEQATFAVTDEAISSEQLNALSTGTAVAPEAGATLILQVASLSGGRMLRLTGAGIAEERMIAPQLPECILHELTERPHPFPLGIDLILTCGERLLAIPRTTHVEVC
+>d2ftxa1 d.300.1.1 (A:133-221) Kinetochore protein Spc25 {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+NDAAEVALYERLLQLRVLPGASDVHDVRFVFGDDSRCWIEVAMHGDHVIGNSHPALDPKSRATLEHVLTVQGDLAAFLVVARDMLLASL
+>d2fupa1 a.47.5.1 (A:1-130) Hypothetical protein PA3352 {Pseudomonas aeruginosa [TaxId: 287]}
+MPDSPTLLDLFAEDIGHANQLLQLVDEEFQALERRELPVLQQLLGAKQPLMQQLERNGRARAEILREAGVSLDREGLARYARERADGAELLARGDELGELLERCQQANLRNGRIIRANQASTGSLLNILR
+>d2fvva1 d.113.1.1 (A:8-142) Diphosphoinositol polyphosphate phosphohydrolase {Human (Homo sapiens) [TaxId: 9606]}
+QTRTYDGDGYKKRAACLCFRSESEEEVLLVSSSRHPDRWIVPGGGMEPEEEPSVAAVREVCEEAGVKGTLGRLVGIFENQERKHRTYVYVLIVTEVLEDWEDSVNIGRKREWFKIEDAIKVLQYHKPVQASYFET
+>d2fvya_ c.93.1.1 (A:) Galactose/glucose-binding protein {Escherichia coli [TaxId: 562]}
+DTRIGVTIYKYDDNFMSVVRKAIEQDAKAAPDVQLLMNDSQNDQSKQNDQIDVLLAKGVKALAINLVDPAAAGTVIEKARGQNVPVVFFNKEPSRKALDSYDKAYYVGTDSKESGIIQGDLIAKHWAANQGWDLNKDGQIQFVLLKGEPGHPDAEARTTYVIKELNDKGIKTEQLQLDTAMWDTAQAKDKMDAWLSGPNANKIEVVIANNDAMAMGAVEALKAHNKSSIPVFGVDALPEALALVKSGALAGTVLNDANNQAKATFDLAKNLADGKGAADGTNWKIDNKVVRVPYVGVDKDNLAEF
+>d2fwha_ c.47.1.1 (A:) Thiol:disulfide interchange protein DsbD, C-terminal domain (DsbD-gamma) {Escherichia coli [TaxId: 562]}
+HLNFTQIKTVDELNQALVEAKGKPVMLDLYADWCVACKEFEKYTFSDPQVQKALADTVLLQANVTANDAQDVALLKHLNVLGLPTILFFDGQGQEHPQARVTGFMDAETFSAHLRDR
+>d2fxua1 c.55.1.1 (A:7-146) Actin {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+ALVCDNGSGLVKAGFAGDDAPRAVFPSIVGRPRHQGVMVGMGQKDSYVGDEAQSKRGILTLKYPIEHGIITNWDDMEKIWHHTFYNELRVAPEEHPTLLTEAPLNPKANREKMTQIMFETFNVPAMYVAIQAVLSLYASG
+>d2fyga1 g.86.1.1 (A:6-128) Nonstructural protein 10, NSP10 {SARS coronavirus [TaxId: 227859]}
+HHHHNSTVLSFCAFAVDPAKAYKDYLASGGQPITNCVKMLCTHTGTGQAITVTPEANMDQESFGGASCCLYCRCHIDHPNPKGFCDLKGKYVQIPTTCANDPVGFTLRNTVCTVCGMWKGYGC
+>d2fyuk_ f.23.15.1 (K:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+MLTRFLGPRYRQLARNWVPTASLWGAVGAVGLVWATDWRLILDWVPYINGKFK
+>d2fyxa1 d.58.57.1 (A:1-130) Putative transposase DR0177 {Deinococcus radiodurans [TaxId: 1299]}
+MKKGRGYVYKLEYHLIWATKYRHQVLVDEVADGLKDILRDIATQNGLELVALEVMPDYVHLLLGATPQHVIPDFVKALKGASARRMFSAFPHLKQPHWGGNLWNPSYCVLTVSEHTRAQIQQYIENQHAA
+>d2fzcb1 d.58.2.1 (B:2-100) Aspartate carbamoyltransferase {Escherichia coli [TaxId: 562]}
+THDNKLQVEAIKRGTVIDHIPAQIGFKLLSLFKLTETDQRITIGLNLPSGEMGRKDLIKIENTFLSEDQVDQLALYAPQATVNRIDNYEVVGKSRPSLP
+>d2fzcb2 g.41.7.1 (B:101-153) Aspartate carbamoyltransferase, Regulatory-chain, C-terminal domain {Escherichia coli [TaxId: 562]}
+ERIDNVLVCPNSNCISHAEPVSSSFAVRKRANDIALKCKYCEKEFSHNVVLAN
+>d2fzpa1 d.345.1.1 (A:193-317) E3 ubiquitin-protein ligase NRDP1 {Human (Homo sapiens) [TaxId: 9606]}
+TIEYNEILEWVNSLQPARVTRWGGMISTPDAVLQAVIKRSLVESGCPASIVNELIENAHERSWPQGLATLETRQMNRRYYENYVAKRIPGKQAVVVMACENQHMGDDMVQEPGLVMIFAHGVEEI
+>d2fzta1 a.46.3.1 (A:1-78) Hypothetical protein TM0693 {Thermotoga maritima [TaxId: 2336]}
+MNIDEIERKIDEAIEKEDYETLLSLLNKRKELMEGLPKDKLSEILEKDRKRLEIIEKRKTALFQEINVIREARSSLQK
+>d2g03a1 a.265.1.1 (A:11-187) Hypothetical protein NMA0004 {Neisseria meningitidis [TaxId: 487]}
+MKSIDEQSLHNARRLFESGDIDRIEVGTTAGLQQIHRYLFGGLYDFAGQIREDNISKGGFRFANAMYLKEALVKIEQMPERTFEEIIAKYVEMNIAHPFLEGNGRSTRIWLDLVLKKNLKKVVNWQNVSKTLYLQAMERSPVNDLELRFLLKDNLTDDVDNREIIFKGIEQSYYYEG
+>d2g0da_ a.102.6.1 (A:) Nisin biosynthesis protein NisC {Lactococcus lactis [TaxId: 1358]}
+KKNIKRNVEKIIAQWDERTRKNKENFDFGELTLSTGLPGIILMLAELKNKDNSKIYQKKIDNYIEYIVSKLSTYGLLTGSLYSGAAGIALSILHLREDDEKYKNLLDSLNRYIEYFVREKIEGFNLENITPPDYDVIEGLSGILSYLLLINDEQYDDLKILIINFLSNLTKENNGLISLYIKSENQMSQSESEMYPLGCLNMGLAHGLAGVGCILAYAHIKGYSNEASLSALQKIIFIYEKFELERKKQFLWKDGLVADELKKEKVIREASFIRDAWCYGGPGISLLYLYGGLALDNDYFVDKAEKILESAMQRKLGIDSYMICHGYSGLIEICSLFKRLLNTKKFDSYMEEFNVNSEQILEEYGDESGTGFLEGISGCILVLSKFEYSINFTYWRQALLLFDDFLKGG
+>d2g38a1 a.25.4.1 (A:8-84) PE25 {Mycobacterium tuberculosis [TaxId: 1773]}
+PEALTVAATEVRRIRDRAIQSDAQVAPMTTAVRPPAADLVSEKAATFLVEYARKYRQTIAAAAVVLEEFAHALTTGA
+>d2g3ra1 b.34.9.1 (A:1485-1537) p53-binding protein 1, 53BP1 {Human (Homo sapiens) [TaxId: 9606]}
+SFVGLRVVAKWSSNGYFYSGKITRDVGAGKYKLLFDDGYECDVLGKDILLCDP
+>d2g50a1 b.58.1.1 (A:116-217) Pyruvate kinase (PK) {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+PEIRTGLIKGSGTAEVELKKGATLKITLDNAYMEKCDENILWLDYKNICKVVDVGSKVYVDDGLISLQVKQKGPDFLVTEVENGGFLGSKKGVNLPGAAVDL
+>d2g62a1 a.268.1.1 (A:22-322) Serine/threonine-protein phosphatase 2A regulatory subunit B', PTPA {Human (Homo sapiens) [TaxId: 9606]}
+NFIIPKKEIHTVPDMGKWKRSQAYADYIGFILTLNEGVKGKKLTFEYRVSEAIEKLVALLNTLDRWIDETPPVDQPSRFGNKAYRTWYAKLDEEAENLVATVVPTHLAAAVPEVAVYLKESVGNSTRIDYGTGHEAAFAAFLCCLCKIGVLRVDDQIAIVFKVFNRYLEVMRKLQKTYRMEPAGSQGVWGLDDFQFLPFIWGSSQLIDHPYLEPRHFVDEKAVNENHKDYMFLECILFITEMKTGPFAEHSNQLWNISAVPSWSKVNQGLIRMYKAECLEKFPVIQHFKFGSLLPIHPVTS
+>d2g7oa1 a.241.1.1 (A:60-127) TraM {Escherichia coli [TaxId: 562]}
+AFNQTEFNKLLLECVVKTQSSVAKILGIESLSPHVSGNSKFEYANMVEDIREKVSSEMERFFPKNDDE
+>d2g7sa2 a.121.1.1 (A:77-192) Putative transcriptional regulator Atu0279 {Agrobacterium tumefaciens [TaxId: 358]}
+SDPLEQLRAYIGYWEGCIADATHPFCVCALLASEIPVLPETVVLEVRAHFRSLSDWLTAVLERGIAQGRLVLTGTARANAEIFMATVHGAMLSARAHGDAATFGAITRPMLERITA
+>d2gboa1 a.23.6.1 (A:1-82) Hypothetical protein EF2458 {Enterococcus faecalis [TaxId: 1351]}
+MDEGISKKFAIQLLEDDAERIKMLIRNQKNSLCISQCKAFEEVVDTQMYGFSRQVTYATRLGILTNDEGHRLLSDLERELNQ
+>d2geca1 b.148.1.1 (A:23-160) Nucleocapsid protein {Avian infectious bronchitis virus [TaxId: 11120]}
+RPPKVGSSGNASWFQAIKAKKLNSPQPKFEGSGVPDNENLKTSQQHGYWRRQARFKPGKGRRKPVPDAWYFYYTGTGPAADLNWGDSQDGIVWVAAKGADVKSRSNQGTRDPDKFDQYPLRFSDGGPDGNFRWDFIPL
+>d2gf4a1 a.8.10.1 (A:1-89) Nypothetical protein Vng1086c {Halobacterium salinarium [TaxId: 2242]}
+MHKDELLELHEQMVNIKDQFLGFDHVDETAFAAYEELDVEPSHVHKSKSEHKHAVFLLGNALAAAMSEDEFSSAGRISKRMEELADDAS
+>d2gfqa1 c.56.7.1 (A:1-274) Hypothetical protein PH0006 {Pyrococcus horikoshii [TaxId: 53953]}
+MKVIMTTKVDKASMNIMNKLIENFGFKETEYVFEGNPVYKRGDVLILTTNDEMIYYDYLDREIENQLGFKPEIIAFASRHSSKQKLPALTTHVTGNWGKAMYGGKDESFAVAIPSAMKLSLLKMSELNDLGWTVCYEATHHGPTELEVPSFFIEIGSSEEEWINDRAGEIIAETIIYVLDNYEKGRSKFKVALGIGGGHYAPKQTKRALEGDLAFGHILPKYAQPVSRDVMIKALNRFGEKVEAIYVDWKGSRGETRQLAKSLAQELGLEFIKD
+>d2ggca_ d.127.1.1 (A:) Methionine aminopeptidase {Escherichia coli K-12 [TaxId: 83333]}
+AISIKTPEDIEKMRVAGRLAAEVLEMIEPYVKPGVSTGELDRICNDYIVNEQHAVSACLGYHGYPKSVCISINEVVCHGIPDDAKLLKDGDIVNIDVTVIKDGFHGDTSKMFIVGKPTIMGERLCRITQESLYLALRMVKPGINLREIGAAIQKFVEAEGFSVVREYCGHGIGRGFHEEPQVLHYDSRETNVVLKPGMTFTIEPMVNAGKKEIRTMKDGWTVKTKDRSLSAQYEHTIVVTDNGCEILTLRKDDTIPAIISHDE
+>d2ghvc1 d.318.1.1 (C:320-502) Spike protein S1 {SARS coronavirus [TaxId: 227859]}
+TNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFE
+>d2giba1 d.254.1.2 (A:270-366) Coronavirus nucleocapsid protein {SARS coronavirus [TaxId: 227859]}
+NVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPP
+>d2gjva1 d.323.1.2 (A:1-134) Putative cytoplasmic protein STM4215 {Salmonella typhimurium [TaxId: 90371]}
+METLSVIHTVANRLRELNPDMDIHISSTDAKVYIPTGQQVTVLIHYCGSVFAEPENTDATVQKQLIRISATVIVPQISDAINALDRLRRSLGGIELPDCDRPLWLESEKYIGDAANFCRYALDMTASTLFIAEQ
+>d2gkpa1 d.351.1.1 (A:1-164) Hypothetical protein NMB0488 {Neisseria meningitidis [TaxId: 487]}
+MTFNQEQDYWAGYKANERALIIQTWSGFGRYAPDHLYPPHILPLDTDNETLGTTVLQALANSRTFVYDSPEDQDFFDTEKIRQRYEDWVAKLCGNLGYKTRRALFKNMMSVDIWLHNGCLKISPSRHVKLEAWDAIDADDVILSLDNSPEEIGAGLKLALSRCR
+>d2glza1 d.81.3.1 (A:3-151) FwdE-like protein DSY1837 (Dhaf_2201) {Desulfitobacterium hafniense [TaxId: 49338]}
+VEKTPWELVIDFHGHTCPDIALGYRIAQLAQREMGIRPAPDSECLVKAYTQSCALDAIQVLNKATIGRHALIIEETHRYMYQFHFTGTQDIHQFTVSPAVLDHLETLRHPDLSPRERQNKVLEGVQYVLTLEESAFCHYDKIPGQLSKI
+>d2gnxa1 a.246.3.1 (A:123-294) Hypothetical protein BC048403 {Mouse (Mus musculus) [TaxId: 10090]}
+PHLSEQLCFFVQARMEIADFYEKMYALSTQKFINTEELVSTLDTILRKYSSRFHHPILSPLESSFQLEVGVLSHLLKAQAQISEWKFLPSLVTLHNAHTKLQSWGQTFEKQRETKKHLFGGQSQKAVQPPHLFLWLMKLKTMLLAKFSFYFHEALSRQTTASEMKALTAKAN
+>d2gnxa2 d.109.3.1 (A:295-440) Hypothetical protein BC048403 {Mouse (Mus musculus) [TaxId: 10090]}
+PDLFGKISSFIRKYDAANVSLIFDNRGSESFQGHGYHHPHSYREAPKGVDQYPAVVSLPSDRPVMHWPNVIMIMTDRASDLNSLEKVVHFYDDKVQSTYFLTRPEPHFTIVVIFESKKSERDSHFISFLNELSLALKNPKVFASLK
+>d2goma1 a.7.17.1 (A:105-165) Fibrinogen-binding protein Efb (Fib) {Staphylococcus aureus [TaxId: 1280]}
+IKKEQKLIQAQNLVREFEKTHTVSAHRKAQKAVNLVSFEYKVKKMVLQERIDNVLKQGLVR
+>d2gp4a2 d.334.1.1 (A:1-418) 6-phosphogluconate dehydratase EDD {Shewanella oneidensis [TaxId: 70863]}
+MHSVVQSVTDRIIARSKASREAYLAALNDARNHGVHRSSLSCGNLAHGFAACNPDDKNALRQLTKANIGIITAFNDMLSAHQPYETYPDLLKKACQEVGSVAQVAGGVPAMCDGVTQGQPGMELSLLSREVIAMATAVGLSHNMFDGALLLGICDKIVPGLLIGALSFGHLPMLFVPAGPMKSGIPNKEKARIRQQFAQGKVDRAQLLEAEAQSYHSAGTCTFYGTANSNQLMLEVMGLQLPGSSFVNPDDPLREALNKMAAKQVCRLTELGTQYSPIGEVVNEKSIVNGIVALLATGGSTNLTMHIVAAARAAGIIVNWDDFSELSDAVPLLARVYPNGHADINHFHAAGGMAFLIKELLDAGLLHEDVNTVAGYGLRRYTQEPKLLDGELRWVDGPTVSLDTEVLTSVATPFQNNG
+>d2gpia1 d.354.1.1 (A:1-90) Hypothetical protein Shew3726 {Shewanella loihica [TaxId: 359303]}
+MNQSIIFTEQLTWDVQLSAIHFTAQQQGMVIDCYIGQKVLEHLAAEKINNSEQALSLFEQFRFDIEEQAEKLIEQEAFDVQGHIQVERVD
+>d2grrb_ a.118.12.1 (B:) Ran-GTPase activating protein 1 (RanGAP1), C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+PADVSTFLAFPSPEKLLRLGPKSSVLIAQQTDTSDPEKVVSAFLKVSSVFKDEATVRMAVQDAVDALMQKAFNSSSFNSNTFLTRLLVHMGLLKSEDKVKAIANLYGPLMALNHMVQQDYFPKALAPLLLAFVTKPNSALESCSFARHSLLQTLYKV
+>d2gsva1 a.23.7.1 (A:3-69) Hypothetical protein YvfG {Bacillus subtilis [TaxId: 1423]}
+ELFSVPYFIENLKQHIEMNQSEDKIHAMNSYYRSVVSTLVQDQLTKNAVVLKRIQHLDEAYNKVKRG
+>d2gtia2 d.294.1.2 (A:217-369) Nsp15, C-terminal domain {Murine hepatitis virus, MHV [TaxId: 11138]}
+ARGTIFTQSRLLSSFTPRSEMEKDFMDLDDDVFIAKYSLQDYAFEHVVYGSFNQKIIGGLHLLIGLARRQQKSNLVIQEFVTYDSSIHSYLITDENSGSSKSVCTVIDLLLDDFVDIVKSLNLKCVSKVVNVNVDFKDFQFMLWCNEEKVMTF
+>d2guda1 b.77.3.1 (A:1-121) Griffithsin {Red alga (Griffithsia) [TaxId: 35158]}
+SLTHRKFGGSGGSPFSGLSSIAVRSGSYLDAIIIDGVHHGGSGGNLSPTFTFGSGEYISNMTIRSGDYIDNISFETNMGRRFGPYGGSGGSANTLSNVKVIQINGSAGDYLDSLDIYYEQY
+>d2guka1 d.360.1.1 (A:4-114) Hypothetical protein PG1857 {Porphyromonas gingivalis [TaxId: 837]}
+QTLNSDLRVFMHHIYEFEKGVRSMVLATLANDDIPYAEERLRSRQIPYFAQPTPNTERTNLFFGCKECMEAIRLFVSGRSLNSLTPEEDFIIGAMLGYDICRQCERYCRRK
+>d2guma1 e.76.1.1 (A:111-725) Glycoprotein B {Human herpesvirus 1 [TaxId: 10298]}
+ANFYVCPPPTGATVVQFEQPRRCPTRPEGQNYTEGIAVVFKENIAPYKFKATMYYKDVTVSQVWFGHRYSQFMGIFEDRAPVPFEEVIDKINAKGVCRSTAKYVRNNLETTAFHRDDHETDMELKPANAATRTSRGWHTTDLKYNPSRVEAFHRYGTTVNCIVEEVDARSVYPYDEFVLATGDFVYMSPFYGYREGSHTEHTTYAADRFKQVDGFYARDLTTKARATAPTTRNLLTTPKFTVAWDWVPKRPSVCTMTKWQEVDEMLRSEYGGSFRFSSDAISTTFTTNLTEYPLSRVDLGDCIGKDARDAMDRIFARRYNATHIKVGQPQYYQANGGFLIAYQPLLSNTLAELYVREHLREQSRKPPNPTPPPPGASANASVERIKTTSSIEFARLQFTYNHIQRHVNDMLGRVAIAWCELQNHELTLWNEARKLNPNAIASVTVGRRVSARMLGDVMAVSTCVPVAADNVIVQNSMRISSRPGACYSRPLVSFRYEDQGPLVEGQLGENNELRLTRDAIEPCTVGHRRYFTFGGGYVYFEEYAYSHQLSRADITTVSTFIDLNITMLEDHEFVPLEVYTRHEIKDSGLLDYTEVQRRNQLHDLRFADIDTVIHA
+>d2gyka1 a.28.2.1 (A:3-85) ImmE9 protein (Im9) {Escherichia coli [TaxId: 562]}
+LKHSISDYTEAEFLQLVTTICNADTSSEEELVKLVTHFEEMTEHPSGSALIYYPKEGDDDSPSGIVNTVKQWRAANGKSGFKQ
+>d2h1ta1 b.178.1.1 (A:2-187) Hypothetical protein PA1994 {Pseudomonas aeruginosa [TaxId: 287]}
+SRDRLYTWAGLWRSPSSSWEALRLEDDQAESQLRAPDERSGLPYQLDYRLRWDADWHLREAVFHVESETGVRKLHLLADGRGHWQDGDGEALPAFDGCLDIDIWPSPFTNTFPIRRLGLADGQRAEIRALYIEAPALEPRSMRQAYTRLDASHYLYENLEGSAFKAVLLVDEQGLVIDYPGLFQRL
+>d2h1va_ c.92.1.1 (A:) Ferrochelatase {Bacillus subtilis [TaxId: 1423]}
+SRKKMGLLVMAYGTPYKEEDIERYYTHIRRGRKPEPEMLQDLKDRYEAIGGISPLAQITEQQAHNLEQHLNEIQDEITFKAYIGLAHIEPFIEDAVAEMHKDGITEAVSIVLAPHFSTFSVQSYNKRAKEEAEKLGGLTITSVESWYDEPKFVTYWVDRVKETYASMPEDERENAMLIVSAHSLPEKIKEFGDPYPDQLHESAKLIAEGAGVSEYAVGWQSEGNTPDPWLGPDVQDLTRDLFEQKGYQAFVYVPVGFVADHLEVLYDNDYECKVVTDDIGASYYRPEMPNAKPEFIDALATVVLKKLGR
+>d2h6fa1 a.118.6.1 (A:55-369) Protein farnesyltransferase alpha-subunit {Human (Homo sapiens) [TaxId: 9606]}
+FVSLDSPSYVLYRDRAEWADIDPVPQNDGPNPVVQIIYSDKFRDVYDYFRAVLQRDERSERAFKLTRDAIELNAANYTVWHFRRVLLKSLQKDLHEEMNYITAIIEEQPKNYQVWHHRRVLVEWLRDPSQELEFIADILNQDAKNYHAWQHRQWVIQEFKLWDNELQYVDQLLKEDVRNNSVWNQRYFVISNTTGYNDRAVLEREVQYTLEMIKLVPHNESAWNYLKGILQDRGLSKYPNLLNQLLDLQPSHSSPYLIAFLVDIYEDMLENQCDNKEDILNKALELCEILAKEKDTIRKEYWRYIGRSLQSKHST
+>d2h6fb1 a.102.4.3 (B:521-921) Protein farnesyltransferase, beta-subunit {Human (Homo sapiens) [TaxId: 9606]}
+EPLYSLRPEHARERLQDDSVETVTSIEQAKVEEKIQEVFSSYKFNHLVPRLVLQREKHFHYLKRGLRQLTDAYECLDASRPWLCYWILHSLELLDEPIPQIVATDVCQFLELCQSPEGGFGGGPGQYPHLAPTYAAVNALCIIGTEEAYDIINREKLLQYLYSLKQPDGSFLMHVGGEVDVRSAYCAASVASLTNIITPDLFEGTAEWIARCQNWEGGIGGVPGMEAHGGYTFCGLAALVILKRERSLNLKSLLQWVTSRQMRFEGGFQGRCNKLVDGCYSFWQAGLLPLLHRALHAQGDPALSMSHWMFHQQALQEYILMCCQCPAGGLLDKPGKSRDFYHTCYCLSGLSIAQHFGSGAMLHDVVLGVPENALQPTHPVYNIGPDKVIQATTYFLQKPVP
+>d2h8ea_ d.79.6.1 (A:) automated matches {Escherichia coli [TaxId: 562]}
+MNTYSITLPWPPSNNRYYRHNRGRTHVSAEGQAYRDNVARIIKNAMLDIGLAMPVKIRIECHMPDRRRRNLDNLQKAAFDALTKAGFWLDDAQVVDYRVVKMPVTKGGRLELTITEMGNE
+>d2h9ec_ g.22.1.1 (C:) automated matches {Dog hookworm (Ancylostoma caninum) [TaxId: 29170]}
+CGENEKYDSCGSKECDKKCKYDGVEEEDDEEPNVPCLVRVCHQDCVCEEGFYRNKDDKCVSAEDCELDNMDFIYPGTR
+>d2hbaa1 d.100.1.1 (A:1-52) Ribosomal protein L9 N-domain {Bacillus stearothermophilus [TaxId: 1422]}
+MKVIFLKDVKGMGKKGEIKNVADGYANNFLFKQGLAIEATPANLKALEAQKQ
+>d2hc1a_ c.45.1.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+NRKTSCPIKINQFEGHFMKLQADSNYLLSKEYEELKDVGRNQSCDIALLPENRGKNRYNNILPYDATRVKLSGGSDYINASYIPGNNFRREYIVTQGPLPGTKDDFWKMVWEQNVHNIVMVTQCVEKGRVKCDHYWPADQDSLYYGDLILQMLSESVLPEWTIREFKICGEEQLDAHRLIRHFHYTVWPDHGVPETTQSLIQFVRTVRDYINRSPGAGPTVVHCSAGVGRTGTFIALDRILQQLDSKDSVDIYGAVHDLRLHRVHMVQTECQYVYLHQCVRDVLRARKLR
+>d2hdza_ a.21.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+LPESPKRAEEIWQQSVIGDYLARFKNDRVKALKAMEMTWNNMEKKEKLMWIKKAAEDQKRYERELS
+>d2hf1a1 b.171.1.1 (A:2-60) Hypothetical protein CV3345 {Chromobacterium violaceum [TaxId: 536]}
+DAKFLEILVCPLCKGPLVFDKSKDELICKGDRLAFPIKDGIPMMLESEARELAPEEEVK
+>d2hiya1 d.356.1.1 (A:1-180) Hypothetical protein SP0830 {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+MTRYALLVRGINVGGKNKVVMAELRQELTNLGLEKVESYINSGNIFFTSIDSKAQLVEKLETFFAVHYPFIQSFSLLSLEDFEAELENLPAWWSRDLARKDFLFYTEGLDVDQVIATVESLELKDEVLYFGKLGIFWGKFSEESYSKTAYHKYLLKVPFYRHITIRNAKTFDKIGQMLKK
+>d2hnga1 d.33.1.2 (A:5-128) Hypothetical protein SP1558 {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+MNLKREQEFVSQYHFDARNFEWENENGAPETKVDVNFQLLQHDQENQVTSLIVILSFMIVFDKFVISGTISQVNHIDGRIVNEPSELNQEEVETLARPCLNMLNRLTYEVTEIALDLPGINLEF
+>d2hnua_ b.9.1.1 (A:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+VRTCLPCGPGGKGRCFGPSICCGDELGCFVGTAEALRCQEENYLPSPCQSGQKPCGSGGRCAAAGICCSPDGCHEDPACDP
+>d2ho2a1 b.72.1.1 (A:253-285) Amyloid beta A4 precursor protein-binding family B member 1, APBB1 {Human (Homo sapiens) [TaxId: 9606]}
+SDLPAGWMRVQDTSGTYYWHIPTGTTQWEPPGR
+>d2hq2a1 e.62.1.1 (A:1-337) Heme oxygenase ChuS {Escherichia coli O157:H7 [TaxId: 83334]}
+MNHYTRWLELKEQNPGKYARDIAGLMNIREAELAFARVTHDAWRMHGDIREILAALESVGETKCICRNEYAVHEQVGTFTNQHLNGHAGLILNPRALDLRLFLNQWASVFHIKENTARGERQSIQFFDHQGDALLKVYATDNTDMAAWSELLARFITDENTPLELKAVDAPVVQTRADATVVEQEWRAMTDVHQFFTLLKRHNLTRQQAFNLVADDLACKVSNSALAQILESAQQDGNEIMVFVGNRGCVQIFTGVVEKVVPMKGWLNIFNPTFTLHLLEESIAEAWVTRKPTSDGYVTSLELFAHDGTQIAQLYGQRTEGEQEQAQWRKQIASLIP
+>d2hq4a1 d.342.1.1 (A:1-152) Hypothetical protein PH1570 {Pyrococcus horikoshii [TaxId: 53953]}
+MQCEEKLEVFENGFKDEKFNVEVKFYGNDARKVLLAMIYELYLPEYGREYVYPFECAKEFWNIYLEGEEIQDEEFQLKPIKFTSEQVIKKLQEEIKKIKPPLEIKIEEAKIYKTKEGYLAVGNYFILDPRGRLFIFNKPSIANKILKYIWKW
+>d2hqsa1 b.68.4.1 (A:163-431) TolB, C-terminal domain {Escherichia coli [TaxId: 562]}
+AFRTRIAYVVQTNGGQFPYELRVSDYDGYNQFVVHRSPQPLMSPAWSPDGSKLAYVTFESGRSALVIQTLANGAVRQVASFPRHNGAPAFSPDGSKLAFALSKTGSLNLYVMDLASGQIRQVTDGRSNNTEPTWFPDSQNLAFTSDQAGRPQVYKVNINGGAPQRITWEGSQNQDADVSSDGKFMVMVSSNGGQQHIAKQDLATGGVQVLSSTFLDETPSLAPNGTMVIYSSSQGMGSVLNLVSTDGRFKARLPATDGQVKFPAWSPYL
+>d2hqsa2 c.51.2.1 (A:29-162) TolB, N-terminal domain {Escherichia coli [TaxId: 562]}
+DSGVDSGRPIGVVPFQWAGPGAAPEDIGGIVAADLRNSGKFNPLDRARLPQQPGSAQEVQPAAWSALGIDAVVVGQVTPNPDGSYNVAYQLVDTGGAPGTVLAQNSYKVNKQWLRYAGHTASDEVFEKLTGIKG
+>d2hqsc_ d.79.7.1 (C:) automated matches {Escherichia coli [TaxId: 562]}
+NNIVYFDLDKYDIRSDFAQMLDAHANFLRSNPSYKVTVEGHADERGTPEYNISLGERRANAVKMYLQGKGVSADQISIVSYGKEKPAVLGHDEAAYSKNRRAVLVYL
+>d2hs1a_ b.50.1.1 (A:) Human immunodeficiency virus type 1 protease {Human immunodeficiency virus type 1 [TaxId: 11676]}
+PQITLWKRPLVTIKIGGQLKEALLDTGADDTIIEEMSLPGRWKPKMIGGIGGFIKVRQYDQIIIEIAGHKAIGTVLVGPTPVNIIGRNLLTQIGATLNF
+>d2huha1 b.7.5.1 (A:81-227) Putative DNA mismatch repair protein BT2179 {Bacteroides thetaiotaomicron [TaxId: 818]}
+RQPEVRGGDTLNVFLAYVPEDAKAMMTTPFEAYLVNDSNYYLYYTYLSAEGKAWNNRSHGLVEPNTKLLLEEFTKDVLNEMERVAVQLIAFKDGKPAAIKPAVSVELRIDTVKFYKLHTFSASDFFEEPALIYDIVKDDVPAKQVYV
+>d2huja1 a.24.26.1 (A:1-120) Hypothetical protein Lin2004 {Listeria innocua [TaxId: 1642]}
+MELLIRTEQLLLQNEKNWELYLSNREEEKPFDFYKDMKPFVDEAKRCADDFLELAIPWVNTERPPYLGELQLRQACDNVQMTAVSAFNGRSFYKHFLDHYQSTKYTLTRVRDFLKRKEES
+>d2hw4a1 d.322.1.1 (A:5-122) Phosphohistidine phosphatase 1, PHP14 {Human (Homo sapiens) [TaxId: 9606]}
+DLALIPDVDIDSDGVFKYVLIRVHSAPRSGAPAAESKEIVRGYKWAEYHADIYDKVSGDMQKQGCDCECLGGGRISHQSQDKKIHVYGYSMAYGPAQHAISTEKIKAKYPDYEVTWAN
+>d2hxma_ c.18.1.1 (A:) Uracil-DNA glycosylase {Human (Homo sapiens) [TaxId: 9606]}
+MEFFGESWKKHLSGEFGKPYFIKLMGFVAEERKHYTVYPPPHQVFTWTQMCDIKDVKVVILGQDPYHGPNQAHGLCFSVQRPVPPPPSLENIYKELSTDIEDFVHPGHGDLSGWAKQGVLLLNAVLTVRAHQANSHKERGWEQFTDAVVSWLNQNSNGLVFLLWGSYAQKKGSAIDRKRHHVLQTAHPSPLSVYRGFFGCRHFSKTNELLQKSGKKPIDWKEL
+>d2hy5a1 c.114.1.1 (A:1-130) Sulfurtransferase DsrE {Chromatium vinosum [TaxId: 1049]}
+MKFALQINEGPYQHQASDSAYQFAKAALEKGHEIFRVFFYHDGVNNSTRLTTPPQDDRHIVNRWAELAEQYELDMVVCVAAAQRRGIVDEGEASRNGKDATNIHPKFRISGLGQLVEAAIQADRLVVFGD
+>d2i06a_ e.2.1.1 (A:) Replication terminator protein (Tus) {Escherichia coli [TaxId: 562]}
+DLVDRLNTTFRQMEQELAIFAAHLEQHKLLVARVFSLPEVKKEDEHNPLNRIEVKQHLGNDAQSLALRHFRHLFIQQQSENRSSKAAVRLPGVLCYQVDNLSQAALVSHIQHINKLKTTFEHIVTVESELPTAARFEWVHRHLPGLITLNAYRTLTVLHDPATLRFGWANKHIIKNLHRDEVLAQLEKSLKSPRSVAPWTREEWQRKLEREYQDIAALPQNAKLKIKRPVKVQPIARVWYKGDQKQVQHACPTPLIALINRDNGAGVPDVGELLNYDADNVQHRYKPQAQPLRLIIPRLHLYVAD
+>d2i0za2 e.74.1.1 (A:193-361) Flavoprotein BC4706 {Bacillus cereus [TaxId: 1396]}
+PTEVPILSNEPFIRDRSLQGLALRDINLSVLNPKGKAIISHKMDMLFTHFGLSGPAALRCSQFVVKALKKFKTNTIQMSIDALPEENSEQLFQRMLKQMKEDPKKGIKNVLKGYVPERYFLFLLEKNEIDGSEQAGQVSHEKIRALVKDFKEFTVNVNGTQSIEKAFVT
+>d2i15a1 a.291.1.1 (A:1-129) Hypothetical protein MPN423 {Mycoplasma pneumoniae [TaxId: 2104]}
+MKPQLLALKQFVQTEFEKVDFETFRQNFNRCLEREQSTLLIYEDDDYDDQSFFLKPMLSDAFFISSEVVKQLDLLAVLVDNPKGDVKSCCQSFYEALTLFISALAITKGVDVGRYHQQLGKRFGVLTVY
+>d2i1sa1 d.343.1.1 (A:4-188) Hypothetical protein MM3350 {Methanosarcina mazei [TaxId: 2209]}
+TFEKVYHLKLSIKGITPQIWRRIQVPENYTFLDLHKAIQAVMDWEDYHLHEFEMVNPKTGMLDKIGAEGDDFDAFGGPLVSEKKAKLSDYFTLENKEALYTYDFGDNWQVKVRLEKILPRKEGVEYPICTAGKRAAVPEDSGGVWGYEEMLEVLKDSEHEEYEDTVLWLGDDFDPEYFDPKDVSF
+>d2i53a1 a.74.1.1 (A:14-157) Cyclin K {Human (Homo sapiens) [TaxId: 9606]}
+SANLDHTKPCWYWDKKDLAHTPSQLEGLDPATEARYRREGARFIFDVGTRLGLHYDTLATGIIYFHRFYMFHSFKQFPRYVTGACCLFLAGKVEETPKKCKDIIKTARSLLNDVQFGQFGDDPKEEVMVLERILLQTIKFDLQV
+>d2i5ha1 e.71.1.1 (A:16-195) Hypothetical protein AF1531 {Archaeoglobus fulgidus [TaxId: 2234]}
+EDYAYVLDFMPYGHPDDKRPIHRREPLAQVVGERNFTLLEVSIRKGKQPLVMDRVYIGKGERDVVYKIKRRLRYEDLTPAAKTELPYVIEHIIKQDEKKYVDFFNKADSITTRMHQLELLPGVGKKMMWAIIEERKKRPFESFEDIAQRVKGIQRPEKLIVSRIIYEIKNPQTKYKLFTA
+>d2i5ua1 a.275.1.1 (A:2-75) Uncaracterized protein EF2839 {Enterococcus faecalis [TaxId: 1351]}
+IRSIWENNGFGLMSSKTMTDFDYWISDFEKIGASQKEAEQLIVKAIEIAIDANARNYNYINAILKDWEQRGFKS
+>d2i5vo_ b.76.1.1 (O:) automated matches {Lyme disease spirochete (Borrelia burgdorferi) [TaxId: 139]}
+NSVSVDLPGSMKVLVSKSSNADGKYDLIATVDALELSGTSDKNNGSGVLEGVKADASKVKLTISDDLGQTTLEVFKSDGSTLVSKKVTSKDKIIIIIKFNEKGEVSEKIITRADGTRLEYTGIKSDGSGKAKEVLKGYVLEGTLTAEKTTLVVKEGTVTLSKNISKSGEVSVELNDTDSSAATKKTAAWNSGTSTLTITVNSKKTKDLVFTSSNTITVQQYDSNGTSLEGSAVEITKLDEIKNALK
+>d2i71a1 e.72.1.1 (A:1-377) Hypothetical protein SSO1389 {Sulfolobus solfataricus [TaxId: 2287]}
+MASIVFSTIGNPKGYQKVTYEIDGEKFESNVSVLALRDLLKVDKTVVILGISVADVYNCKYADYRSCKECIIQNSKNDLGISESYVVAPNVYQKFKGKPDHYFTYIYYHSLRILEKEGINEVFIDTTHGINYMGVLAKEAIQLAVSAYAAKSEKEVKVSLYNSDPVGKDVSDTVKLHEIEAIKISPLSGLKYVTYQILNKDKNFFNKIFSDSVNAIPRFATALDNGLFIYLSEKDSSLHLKRLEDDLSKDPLLTPSENEINVVYKDMKYALSHALFYVISRFSGNVDLDTLRHYAETYADKVTRAIIENEVDKIEKYQMGSERKLLGEYMKVEGKGFDKRILYAHGGLPYAGTYVYKEKDKVYVTYGDKIDEIERQI
+>d2i8da1 d.198.4.1 (A:2-122) Uncharacterized protein LSEI2283 {Lactobacillus casei [TaxId: 1582]}
+GSLAEWYQRIPTPDDLTRVESLFANMQAQFPQLKLEFKWNQPMFTDHGTFIMGFNPSKKHLAVAIEPQTMTRFIPQIDKAGYDHSQIIRFPWHKPLDEQLIHDLIAYTIDQKKDATTFWQR
+>d2i9ia1 c.51.6.1 (A:51-271) Hypothetical protein HP0492 {Helicobacter pylori [TaxId: 210]}
+ERMKTSSEHVTPLDFNYPIHIVQAPQNHHVVGILTPRIQVSDNLKPYIDKFQDALINQIQTIFEKRGYQVLRFQDEKALNAQDKRKIFSVLDLKGWVGILEDLKMNLKDPNNPNLDTLVDQSSGSVWFNFYEPESNRVVHDFAVEVGTFQAMTYTYKHNNSGGLNSSNSIIHEYLEKNKEDAIHKILNRMYAVVMKKAVTELTKENIDKYREAIDRMKGFK
+>d2i9wa2 g.74.1.1 (A:1-39) Hypothetical protein Psyc2064 {Psychrobacter arcticus [TaxId: 334543]}
+MLFSIQTCPCQINPALNAVSTPLLYQDCCQPYHDGLYNQ
+>d2i9xa1 d.366.1.1 (A:1-84) Putative septation protein SpoVG {Staphylococcus epidermidis [TaxId: 1282]}
+MKVTDVRLRKIQTDGRMKALVSITLDEAFVIHDLRVIEGNSGLFVAMPSKRTPDGEFRDIAHPINSDMRQEIQDAVMKVYDETD
+>d2ia1a1 d.359.1.1 (A:1-166) Uncharacterized protein BH3703 {Bacillus halodurans [TaxId: 86665]}
+LEKQIESYYQEIAQLIIDMIPEEWAEVRFYAQEDHDGWKIFFFHYLSASSDEWTKDIDIRDVIKVPQDEFMEKYNELSFCISDFRKDYAEAFGEPWMSFQMTFYASGKFNIDFYYDKNPFDTFLTRLAWQYEHFGTIPEDSFYKETLNEYLEEKAQGKRYPFLEPL
+>d2ia7a1 d.373.1.1 (A:23-133) Uncharacterized protein GSU0986 {Geobacter sulfurreducens [TaxId: 35554]}
+AMVLSSAEEDIAESIRIILGTARGERVMRPDFGCGIHDRVFSVINTTTLGLIENEVKEALILWEPRIELLSVTASPREAAEGRLLIDIEYRVRSTNTRFNLVYPFYLKESA
+>d2iafa1 d.81.2.1 (A:4-148) L-serine dehydratase SdhL, N-terminal domain {Legionella pneumophila [TaxId: 446]}
+SSHTVGPMLAANAFLQLLEQKNLFDKTQRVKVELYGSLALTGKGHGTDKAILNGLENKAPETVDPASMIPRMHEILDSNLLNLAGKKEIPFHEATDFLFLQKELLPKHSNGMRFSAFDGNANLLIEQVYYSIGGGFITTEEDFDK
+>d2iaya1 d.376.1.1 (A:1-113) Hypothetical protein Lp2179 {Lactobacillus plantarum [TaxId: 1590]}
+MAYTTTVKLDGDTKTYTLSPTVKKYTLMDLGFVKGRSGAFSFERSLDPTSPYQAAFKLKMTVNADLTGFKMTTVTGNGVQRANIFKNDAHPEAVEQLRYILANFIERDILTTD
+>d2ic2a1 b.1.2.1 (A:466-572) Hedgehog receptor iHog {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+YPPTPPNVTRLSDESVMLRWMVPRNDGLPIVIFKVQYRMVGKRKNWQTTNDNIPYGKPKWNSELGKSFTASVTDLKPQHTYRFRILAVYSNNDNKESNTSAKFYLQP
+>d2icha1 b.176.1.1 (A:24-351) AttH-related protein NE1406 {Nitrosomonas europaea [TaxId: 915]}
+LAPVVPGKALEFPQDFGAHNDFRIEWWYVTGWLETPTGKPLGFQITFFRTATEIDRDNPSHFAPDQLIIAHVALSDPAIGKLQHDQKIARAGFDLAYARTGNTDVKLDDWIFVRETDGRYRTRIEAEDFTLTFILTPSQPLMLQGENGFSRKGPGAPQASYYYSEPHLQVSGIINRQGEDIPVTGTAWLDREWSSEYLDPNAAGWDWISANLDDGSALMAFQIRGKDDSKIWAYAALRDASGHTRLFTPDQVSFHPIRTWRSARTQAVYPVATRVLTGETEWQITPLMDDQELDSRASAGAVYWEGAVTFTRDGQPAGRGYMELTGYV
+>d2icua_ d.303.1.0 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+GRFAQSQTREDYLALLAEDIERDIPYDPEPIGRYNVAPGTKVLLLSERDEHLHLDPVFWGYAPGWWDKPPLINARVETAATSRMFKPLWQHGRAICFADGWFEWKKEGDKKQPFFIYRADGQPIFMAAIGSTPFERGDEAEGFLIVTAAADQGLVDIHDRRPLVLSPEAAREWMRQEISGKEASEIAASGCVPANQFSWHPVSRAVGNVKNQGAELIQPV
+>d2icwg_ a.202.1.1 (G:) Superantigen MAM {Mycoplasma arthritidis [TaxId: 2111]}
+MKLRVENPKKAQKHFVQNLNNVVFTNKELEDIYNLSNKEETKEVLKLFKLKVNQFYRHAFGIVNDYNGLLEYKEIFNMMFLKLSVVFDTQRKEANNVEQIKRNIAILDEIMAKADNDLSYFISQNKNFQELWDKAVKLTKEMKIKLKGQKLDLRDGEVAINKVRELFGSDKNVKELWWFRSLLVKGVYLIKRYYEGDIELKTTSDFAKAVFED
+>d2idla1 d.64.2.1 (A:1-112) Hypothetical protein SP1106 {Pneumococcus (Streptococcus pneumoniae) [TaxId: 1313]}
+MIQAVFERAEDGELRSAEITGHAESGEYGLDVVCASVSTLAINFINSIEKFAGYEPILELNEDEGGYLMVEIPKDLPSHQREMTQLFFESFFLGMANLSENYSEFVQTRVIT
+>d2idob_ a.237.1.1 (B:) Homolog of theta (HOT) {Bacteriophage P1 [TaxId: 10678]}
+YDWNIAAKSQEERDKVNVDLAASGVAYKERLNIPVIAEQVAREQPENLRTYFMERLRHYRQLSLQLPKGSDPAYQ
+>d2ih2a2 d.287.1.1 (A:244-413) DNA methylase TaqI, C-terminal domain {Thermus aquaticus [TaxId: 271]}
+RFETEETRKLEISGMPLGDLFHIRFAARSPEFKKHPAVRKEPGPGLVPVLTGRNLKPGWVDYEKNHSGLWMPKERAKELRDFYATPHLVVAHTKGTRVVAAWDERAYPWREEFHLLPKEGVRLDPSSLVQWLNSEAMQKHVRTLYRDFVPHLTLRMLERLPVRREYGFHT
+>d2ii1a_ b.23.3.0 (A:) automated matches {Bacillus halodurans [TaxId: 86665]}
+GMIRLSNENTIFFMDKENVPIASCQSGDTVIFETKDCFSDQITNEEQALTSIDFNRVNPATGPLYVEGARRGDMLEIEILDIKVGKQGVMTAAPGLGALGESLNSPTTKLFPIEGDDVVYSTGLRLPLQPMIGVIGTAPPGEPINNGTPGPHGGNLDTKDIKPGTTVYLPVEVDGALLALGDLHAAMGDGEILICGVEIAGTVTLKVNVKKERMFPLPALKTDTHFMTIASAETLDAAAVQATKNMATFLANRTALSIEEAGMLLSGAGDLYVSQIVNPLKTARFSLALHYFEKLGV
+>d2ilka_ a.26.1.3 (A:) Interleukin-10 (cytokine synthesis inhibitory factor, CSIF) {Human (Homo sapiens) [TaxId: 9606]}
+TQSENSCTHFPGNLPNMLRDLRDAFSRVKTFFQMKDQLDNLLLKESLLEDFKGYLGCQALSEMIQFYLEEVMPQAENQDPDIKAHVNSLGENLKTLRLRLRRCHRFLPCENKSKAVEQVKNAFNKLQEKGIYKAMSEFDIFINYIEAYMTMKIRN
+>d2imqx_ d.151.1.2 (X:) automated matches {Bedbug (Cimex lectularius) [TaxId: 79782]}
+PPAQLSVHTVSWNSGHERAPTNLEELLGLNSGETPDVIAVAVQGFGFQTDKPQQGPACVKNFQSLLTSKGYTKLKNTITETMGLTVYCLEKHLDQNTLKNETIIVTVDDQKKSGGIVTSFTIYNKRFSFTTSRMSDEDVTSTNTKYAYDTRLDYSKKDDPSDFLFWIGDLNVRVETNATHAKSLVDQNNIDGLMAFDQLKKAKEQKLFDGWTEPQVTFKPTYKFKPNTDEYDLSATPSWTDRALYKSGTGKTIQPLSYNSLTNYKQTEHRPVLAKFRVTL
+>d2in5a1 b.177.1.1 (A:3-200) Hypothetical lipoprotein YmcC {Escherichia coli [TaxId: 562]}
+HSQQSMVDTFRASLFDNQDITVADQQIQALPYSTMYLRLNEGQRIFVVLGYIEQEQSKWLSQDNAMLVTHNGRLLKTVKLNNNLLEVTNSGQDPLRNALAIKDGSRWTRDILWSEDNHFRSATLSSTFSFAGLETLNIAGRNVLCNVWQEEVTSTRPEKQWQNTFWVDSATGQVRQSRQMLGAGVIPVEMTFLKPAPL
+>d2inwa1 d.110.8.1 (A:4-120) Hypothetical protein YeeU {Shigella flexneri [TaxId: 623]}
+TLPGTTPPDDNHDRPWWGLPCTVTPCFGARLVQEGNRLHYLADRAGIRGRFSDVDAYHLDQAFPLLMKQLELMLTGGELNPRHQHTVTLYAKGLTCEADTLGSCGYVYLAVYPTPAA
+>d2isba_ c.8.9.1 (A:) Fumarate hydratase class I beta subunit {Archaeoglobus fulgidus [TaxId: 2234]}
+HHHHMVMEYELRTPLVKDQILKLKVGDVVYITGEIFTARDEAHARALEWMEEGKELPFSFDKGVVYHCGPLVKKNDEWRVVSAGPTTSARMNPFTPKILEKVECMGIIGKGGMSEEVVEAMRGKAAYFAFTGGAGALAAMSIKKVKGVVWEDLGMPEAVWLLEVERFGPCIVAIDAHGNSLYRR
+>d2ivya_ d.58.58.1 (A:) automated matches {Sulfolobus solfataricus [TaxId: 273057]}
+AMLYLIFYDITDDNLRNRVAEFLKKKGLDRIQYSVFMGDLNSSRLKDVEAGLKIIGNRKKLQEDERFFILIVPITENQFRERIVIGYS
+>d2izxa_ a.31.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+IPPGLTELLQGYTVEVLRQQPPDLVEFAVEYFTRLREAR
+>d2j4wd1 g.61.1.1 (D:421-454) Apical membrane antigen 1 {Malaria parasite (Plasmodium falciparum) [TaxId: 5833]}
+IFISNDKESIKCPCEPERISESTCNFYVCNCVEK
+>d2j5ya_ a.8.1.2 (A:) automated matches {Peptostreptococcus magnus [TaxId: 1260]}
+LVPRGSHMTIDQWLLKNAKEDAIAELKKAGITSDFYFNAINKAKTVEEVNALKNEILKAHA
+>d2j6ba1 d.321.1.1 (A:1-109) Afv3-109 {Acidianus filamentous virus 1 [TaxId: 235266]}
+MLYILNSAILPLKPGEEYTVKAKEITIQEAKELVTKEQFTSAIGHQATAELLSSILGVNVPMNRVQIKVTHGDRILAFMLKQRLPEGVVVKTTEELEKIGYELWLFEIQ
+>d2j73a_ b.3.1.3 (A:) Pullulanase PulA {Thermotoga maritima [TaxId: 2336]}
+FTETTIVVHYHRYDGKYDGWNLWIWPVEPVSQEGKAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLNEWQAKDVAKDRFIEIKDGKAEVWILQGVEEIFYEKP
+>d2j8ga1 b.109.1.1 (A:191-339) C-terminal domain of endolysin {Bacteriophage cp-1 [TaxId: 10747]}
+EEDDKPKTAGTWKQDSKGWWFRRNNGSFPYNKWEKIGGVWYYFDSKGYCLTSEWLKDNEKWYYLKDNGAMATGWVLVGSEWYYMDDSGAMVTGWVKYKNNWYYMTNERGNMVSNEFIKSGKGWYFMNTNGELADNPSFTKEPDGLITVA
+>d2j8ka1 b.80.8.1 (A:1-175) NP275-NP276 {Nostoc punctiforme [TaxId: 272131]}
+MDVEKLRQLYAAGERDFSIVDLRGAVLENINLSGAILHGAMLDEANLQQANLSRADLSGATLNGADLRGANLSKADLSDAILDNAILEGAILDEAVLNQANLKAANLEQAILSHANIREADLSEANLEAADLSGADLAIADLHQANLHQAALERANLTGANLEDANLEGTILEGG
+>d2j97a_ b.140.1.0 (A:) automated matches {Human coronavirus 229E [TaxId: 11137]}
+KMKVKATKGEGDGGITSEGNALYNNEGGRAFMYAYVTTKPGMKYVKWEHDSGVVTVELEPPCRFVIDTPTGPQIKYLYFVKNLNNLRRGAVLGYIGATVRLQ
+>d2j9wa_ a.24.28.0 (A:) automated matches {African clawed frog (Xenopus laevis) [TaxId: 8355]}
+HHMGNLNRCIADIVSLFITVMDKLRLEIRAMDEIQPDLRELMETMNRMSHLPPDFEGREKVSQWLQKLSSMSASDELDDSQVRQMLFDLESAYNAFNRFLH
+>d2jdia1 a.69.1.1 (A:380-510) F1 ATP synthase alpha subunit, domain 3 {Cow (Bos taurus) [TaxId: 9913]}
+TRAMKQVAGTMKLELAQYREVAAFAQFGSDLDAATQQLLSRGVRLTELLKQGQYSPMAIEEQVAVIYAGVRGYLDKLEPSKITKFENAFLSHVISQHQALLGKIRTDGKISEESDAKLKEIVTNFLAGFEA
+>d2jdia2 b.49.1.1 (A:24-94) F1 ATP synthase alpha subunit, domain 1 {Cow (Bos taurus) [TaxId: 9913]}
+DLEETGRVLSIGDGIARVHGLRNVQAEEMVEFSSGLKGMSLNLEPDNVGVVVFGNDKLIKEGDIVKRTGAI
+>d2jdig_ c.49.2.1 (G:) ATP synthase (F1-ATPase), gamma subunit {Cow (Bos taurus) [TaxId: 9913]}
+ATLKDITRRLKSIKNIQKITKSMKMVAAAKYARAERELKPARVYGVGSLALYEKADIKTPEDKKKHLIIGVSSDRGLCGAIHSSVAKQMKSEAANLAAAGKEVKIIGVGDKIRSILHRTHSDQFLVTFKEVGRRPPTFGDASVIALELLNSGYEFDEGSIIFNRFRSVISYKTEEKPIFSLDTISSAESMSIYDDIDADVLRNYQEYSLANIIYYSLKESTTSEQSARMTAMDNASKNASEMIDKLTLTFNRTRQAVITKELIEIISGAAALD
+>d2jdih1 a.2.10.1 (H:102-145) Epsilon subunit of F1F0-ATP synthase C-terminal domain {Cow (Bos taurus) [TaxId: 9913]}
+MLDLGAAKANLEKAQSELLGAADEATRAEIQIRIEANEALVKAL
+>d2jdih2 b.93.1.1 (H:17-101) Epsilon subunit of F1F0-ATP synthase N-terminal domain {Cow (Bos taurus) [TaxId: 9913]}
+SFTFASPTQVFFNSANVRQVDVPTQTGAFGILAAHVPTLQVLRPGLVVVHAEDGTTSKYFVSSGSVTVNADSSVQLLAEEAVTLD
+>d2jdqd_ d.361.1.1 (D:) automated matches {Influenza A virus [TaxId: 11320]}
+SAVLRGFLILGKEDRRYGPALSINELSNLAKGEKANVLIGQGDVVLVMKRKRDSSILTDSQTATKRIRM
+>d2je6a2 d.101.1.1 (A:192-275) Exosome complex exonuclease 2, ECX2 {Sulfolobus solfataricus [TaxId: 2287]}
+PLNYPVVTISVAKVDKYLVVDPDLDEESIMDAKISFSYTPDLKIVGIQKSGKGSMSLQDIDQAENTARSTAVKLLEELKKHLGI
+>d2je6i2 b.84.4.2 (I:7-65) Exosome complex RNA-binding protein 1, ECR1 {Sulfolobus solfataricus [TaxId: 2287]}
+QEIVLQPRSIVVPGELLAEGEFQIPWSPYILKINSKYYSTVVGLFDVKDTQFEVIPLEG
+>d2jeka1 a.255.1.1 (A:6-145) Hypothetical protein Rv1873 (MT1922) {Mycobacterium tuberculosis [TaxId: 1773]}
+DPFDLKRFVYAQAPVYRSVVEELRAGRKRGHWMWFVFPQLRGLGSSPLAVRYGISSLEEAQAYLQHDLLGPRLHECTGLVNQVQGRSIEEIFGPPDDLKLCSSMTLFARATDANQDFVALLAKYYGGGEDRRTVALLAVT
+>d2jfga1 c.5.1.1 (A:1-93) UDP-N-acetylmuramoyl-L-alanine:D-glutamate ligase MurD {Escherichia coli [TaxId: 562]}
+ADYQGKNVVIIGLGLTGLSCVDFFLARGVTPRVMDTRMTPPGLDKLPEAVERHTGSLNDEWLMAADLIVASPGIALAHPSLSAAADAGIEIVG
+>d2jfga2 c.59.1.1 (A:298-437) UDP-N-acetylmuramoyl-L-alanine:D-glutamate ligase MurD {Escherichia coli [TaxId: 562]}
+GLPHRFEVVLEHNGVRWINDSKATNVGSTEAALNGLHVDGTLHLLLGGDGKSADFSPLARYLNGDNVRLYCFGRDGAQLAALRPEVAEQTETMEQAMRLLAPRVQPGDMVLLSPACASLDQFKNFEQRGNEFARLAKELG
+>d2jfga3 c.72.2.1 (A:94-297) UDP-N-acetylmuramoyl-L-alanine:D-glutamate ligase MurD {Escherichia coli [TaxId: 562]}
+DIELFCREAQAPIVAITGSNGKSTVTTLVGEMAKAAGVNVGVGGNIGLPALMLLDDECELYVLELSSFQLETTSSLQAVAATILNVTEDHMDRYPFGLQQYRAAKLRIYENAKVCVVNADDALTMPIRGADERCVSFGVNMGDYHLNHQQGETWLRVKGEKVLNVKEMKLSGQHNYTNALAALALADAAGLPRASSLKALTTFT
+>d2jfra_ d.219.1.0 (A:) automated matches {Mycobacterium smegmatis [TaxId: 246196]}
+GMASVLSAATATDQGPVRENNQDACLADGILYAVADGFGARGHHASATALKTLSAGFAAAPDRDGLLEAVQQANLRVFELLGDEPTVSGTTLTAVAVFEPGQGGPLVVNIGDSPLYRIRDGHMEQLTDDHSVAGELVRMGEITRHEARWHPQRHLLTRALGIGPHIGPDVFGIDCGPGDRLLISSDGLFAAADEALIVDAATSPDPQVAVRRLVEVANDAGGSDNTTVVVIDLG
+>d2jgba_ d.86.1.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+KAVVPGPAEHPLQYNYTFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRLRKGLASRCWENLILAMLGEQFMVGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKMPGRLGPQRLLF
+>d2jhfa2 c.2.1.1 (A:164-339) Alcohol dehydrogenase {Horse (Equus caballus) [TaxId: 9796]}
+SPLEKVCLIGCGFSTGYGSAVKVAKVTQGSTCAVFGLGGVGLSVIMGCKAAGAARIIGVDINKDKFAKAKEVGATECVNPQDYKKPIQEVLTEMSNGGVDFSFEVIGRLDTMVTALSCCQEAYGVSVIVGVPPDSQNLSMNPMLLLSGRTWKGAIFGGFKSKDSVPKLVADFMAKK
+>d2jlia_ d.367.1.0 (A:) automated matches {Yersinia pestis [TaxId: 632]}
+QFHQEIQSRNMRENVKRSSVVVANPTHIAIGILYKRGETPLPLVTFKYTDAQVQTVRKIAEEEGVPILQRIPLARALYWDALVDHYIPAEQIEATAEVLR
+>d2liga_ a.24.2.1 (A:) Aspartate receptor, ligand-binding domain {Salmonella typhimurium [TaxId: 90371]}
+MGGLLFSSLQHCQQGFVISNELRQQQSELTSTWDLMLQTRINLSRSAARMMMDASNQQSSAKTDLLQNAKTTLAQAAAHYANFKNMTPLPAMAEASANVDEKYQRYQAALAELIQFLDNGNMDAYFAQPTQGMQNALGEALGNYARVSENLYRQTFD
+>d2lisa_ a.19.1.1 (A:) Lysin {Red abalone (Haliotis rufescens) [TaxId: 6454]}
+HYVEPKFLNKAFEVALKVQIIAGFDRGLVKWLRVHGRTLSTVQKKALYFVNRRYMQTHWANYMLWINKKIDALGRTPVVGDYTRLGAEIGRRIDMAYFYDFLKDKNMIPKYLPYMEEINRMRPADVPVKYM
+>d2mcma_ b.1.7.1 (A:) Macromycin {Streptomyces macromomyceticus [TaxId: 1917]}
+APGVTVTPATGLSNGQTVTVSATGLTPGTVYHVGQCAVVEPGVIGCDATTSTDVTADAAGKITAQLKVHSSFQAVVGADGTPWGTVNCKVVSCSAGLGSDSGEGAAQAITFA
+>d2mhra_ a.24.4.1 (A:) Myohemerythin {Sipunculan worm (Themiste zostericola) [TaxId: 6437]}
+GWEIPEPYVWDESFRVFYEQLDEEHKKIFKGIFDCIRDNSAPNLATLVKVTTNHFTHEEAMMDAAKYSEVVPHKKMHKDFLEKIGGLSAPVDAKNVDYCKEWLVNHIKGTDFKYKGKL
+>d2nlsa_ g.9.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+DHYNCVSSGGQCLYSACPIFTKIQGTCYRGEAKCCK
+>d2nlva1 d.326.1.1 (A:1-111) Hypothetical protein Ava3825 {Anabaena variabilis [TaxId: 1172]}
+MDKLVKYQELVKKLLTNYASDDVSDQDVEVQLILDTERNHYQWMNVGWQGLNRIYRCVIHFDIKDGKIWLQQNLTDRNPAEELVMMGVPREDIVLGLQAPYKRQYTDYGVA
+>d2nmla1 d.330.1.1 (A:2-101) Enhancer of rudimentary homolog, ERH {Mouse (Mus musculus) [TaxId: 10090]}
+SHTILLVQPTKRPEGRTYADYESVNECMEGVCKMYEEHLKRMNPNSPSITYDISQLFDFIDDLADLSCLVYRADTQTYQPYNKDWIKEKIYVLLRRQAQQ
+>d2nn4a1 a.272.1.1 (A:1-62) Hypothetical protein YqgQ {Bacillus subtilis [TaxId: 1423]}
+LNTFYDVQQLLKTFGHIVYFGDRELEIEFMLDELKELYMNHMIEKEQWARAAAVLRKELEQT
+>d2nnua_ b.91.1.1 (A:) E2 regulatory, transactivation domain {Human papillomavirus type 16 [TaxId: 333760]}
+SMETLCQRLNVCQDKILTHYENDSTDLRDHIDYWKHMRLECAIYYKAREMGFKHINHQVVPTLAVSKNKALQAIELQLTLETIYNSQYSNEKWTLQDVSLEVYLTAPTGCIKKHGYTVEVQFDGDICNTMHYTNWTHIYICEEASVTVVEGQVDYYGLYYVHEGIRTYFVQFKDDAEKYSKNKVWEVHAGGQVILCPTSVF
+>d2nr5a1 a.25.6.1 (A:1-64) Hypothetical protein SO2669 {Shewanella oneidensis [TaxId: 70863]}
+MMTKKERIAIQRSMAEEALGKLKAIRQLCGAEDSSDSSDMQEVEIWTNRIKELEDWLWGESPIA
+>d2nsza1 a.118.1.14 (A:322-450) Programmed cell death 4, PDCD4 {Mouse (Mus musculus) [TaxId: 10090]}
+QPVNHLVKEIDMLLKEYLLSGDISEAEHCLKELEVPHFHHELVYEAIVMVLESTGESAFKMILDLLKSLWKSSTITIDQMKRGYERIYNEIPDINLDVPHSYSVLERFVEECFQAGIISKQLRDLCPSR
+>d2ntka1 d.153.2.1 (A:1-202) Hypothetical protein MTH1020 {Methanothermobacter thermautotrophicus [TaxId: 145262]}
+MYLGRILAVGRNSNGSFVAYRVSSRSFPNRTTSIQEERVAVVPVEGHERDVFRNPYIAYNCIRIVGDTAVVSNGSHTDTIADKVALGMNLRDAIGLSLLAMDYEKDELNTPRIAAAINGSEAFIGIVTADGLMVSRVPEETPVYISTYEQTEPAATEFKAGSPEEAAEFILKGGEFAAFTHPVTAAAAFNDGEGWNLATREM
+>d2nuga1 a.149.1.1 (A:3-150) RNase III endonuclease catalytic domain {Aquifex aeolicus [TaxId: 63363]}
+MLEQLEKKLGYTFKDKSLLEKALTHVSYSKKEHYETLEFLGDALVNFFIVDLLVQYSPNKREGFLSPLKAYLISEEFFNLLAQKLELHKFIRIKRGKINETIIGDVFEALWAAVYIDSGRDANFTRELFYKLFKEDILSAIKEGRVKK
+>d2nuga2 d.50.1.1 (A:151-218) RNase III, C-terminal domain {Aquifex aeolicus [TaxId: 63363]}
+DYKTILQEITQKRWKERPEYRLISVEGPHHKKKFIVEAKIKEYRTLGEGKSKKEAEQRAAEELIKLLE
+>d2nw8a1 a.266.1.1 (A:23-284) Tryptophan 2,3-dioxygenase {Xanthomonas campestris pv. campestris [TaxId: 340]}
+TYGGYLRLDQLLSAQQPLSEPAHHDEMLFIIQHQTSELWLKLLAHELRAAIVHLQRDEVWQCRKVLARSKQVLRQLTEQWSVLETLTPSEYMGFRDVLGPSSGFQSLQYRYIEFLLGNKNPQMLQVFAYDPAGQARLREVLEAPSLYEEFLRYLARFGHAIPQQYQARDWTAAHVADDTLRPVFERIYENTDRYWREYSLCEDLVDVETQFQLWRFRHMRTVMRVIGFKRGTGGSSGVGFLQQALALTFFPELFDVRTSVGV
+>d2nxpa1 d.379.1.1 (A:195-343) TAF5 subunit of TFIID {Human (Homo sapiens) [TaxId: 9606]}
+QPDVSAVLSAYNQQGDPTMYEEYYSGLKHFIECSLDCHRAELSQLFYPLFVHMYLELVYNQHENEAKSFFEKFHGDQECYYQDDLRVLSSLTKKEHMKGNETMLDFRTSKFVLRISRDSYQLLKRHLQEKQNNQIWNIVQEHLYIDIFD
+>d2nxya1 d.172.1.1 (A:83-491) gp120 core {Human immunodeficiency virus type 1 [TaxId: 11676]}
+EVVLVNVTENFNMWKNDMVEQMHEDIISLWDQSLKPCVKLTPLCVGAGSCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNNKTFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSVNFTDNAKTIIVQLNTSVEINCTGAGHCNIARAKWNNTLKQIASKLREQFGNNKTIIFKQSSGGDPEIVTHSFNCGGEFFYCNSTQLFNSTWFNSTWSTEGSNNTEGSDTITLPCRIKQIINMWQKVGKAMYAPPISGQIRCSSNITGLLLTRDGGNSNNESEIFRPGGGDMRDNWRSELYKYKVVKI
+>d2o35a1 a.293.1.1 (A:2-80) Hypothetical protein SMc04008 {Rhizobium meliloti [TaxId: 382]}
+SEISPEQRTAFEAAVFRRLLEHLRERSDVQNIDLMNLAGFCRNCLSNWYREAAEASGVPMSKEESREIVYGMPYEEWRT
+>d2o37a_ a.2.3.0 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+MVKETKLYDLLGVSPSANEQELKKGYRKAALKYHPDKPTGDTEKFKEISEAFEILNDPQKREIYDQYGLEAARSGGPSFGP
+>d2o3bb_ d.221.1.1 (B:) automated matches {Nostoc sp. PCC 7120 [TaxId: 103690]}
+STKTNSEILEQLKQASDGLLFMSESEYPFEVFLWEGSAPPVTHEIVLQQTGHGQDAPFKVVDIDSFFSRATTPQDWYEDEENAVVAKFQKLLEVIKSNLKNPQVYRLGEVELDVYVIGETPAGNLAGISTKVVET
+>d2o3ia1 e.73.1.1 (A:2-390) Hypothetical protein CV3147 {Chromobacterium violaceum [TaxId: 536]}
+AFELSPSDLEPLLQGACFFGSGGGGTMISARHLAANFRKGDYYPTDKVRVVDVDEATDGDCVMVAYMGAPDAINQVQWPNGPVEAALAARQRLESQGRKLAYVVAPESGALGFVVASLVAAKLGLAVVDADGAGRAVPSLPMLTYAAAGVPPTPAFLAGESGLCVELGVRMPPPDGQRREDISTVVEQMLRPILTNPQFGQFGGLAMWMMSPAQLGGALPVRGTLSRALKLGRALQDGKVKTAEAMLDFLRRELDIKGKLLFGPATLASPEVSTAGGFDLGKVVLEDGERRCTVLYQNESLLAWDSALSHPLATAPDAISYFVEGEGQHVFSNGDLSGNDHGLDPSVRGRKAAVIALPAAAPLSEGLILQSFADELAQLGYLGPYAPVD
+>d2o3la1 a.69.4.1 (A:14-95) Hypothetical protein BCE3448 {Bacillus cereus [TaxId: 1396]}
+EYKMMMARVAALPEDYQFVFKKIQNYMWNFSAGNGMDMLHIQYELIDLFEAGAAEGRQVLDITGEDVASFADELVANAKTYV
+>d2o5ha1 d.363.1.1 (A:1-131) Hypothetical protein NMB0513 {Neisseria meningitidis [TaxId: 487]}
+MRKLNNHDVHKRYQDRLEEDVEFTINYELPLSCLWSTIKDFSSDFEEKTEAFFILFKELLRRGHLKLQRDGQIIGHTPEEWEQIFREVWPEYEIEPNPLPGYAPFDIGMWLTVEAPAYAVWIDPEDGSEYW
+>d2o6ka1 a.60.15.1 (A:4-73) Uncharacterized protein MW1311 {Staphylococcus aureus [TaxId: 1280]}
+YSFYQFVMTVRGRHDDKGRLAEEIFDDLAFPKHDDDFNILSDYIETHGDFTLPMSVFDDLYEEYTEWLKF
+>d2o70a1 a.288.1.1 (A:2-166) OHCU decarboxylase, UraD {Zebrafish (Danio rerio) [TaxId: 7955]}
+DINVVNALAYEDFVKLFGNVVEKCPLISAAIWSYRPFKDLADIEARISEFIHSLPDSGKEGILRCHPDLAGRDLQSGTLTPESQEEQSQAGMTTLDSAEIVHMYRLNSEYKERFGFPFVICARLNNKADIVRQLSERLKNRRTAELECAIEEVKKICSLRLHSIV
+>d2o8sa1 a.295.1.1 (A:54-278) Uncharacterized protein AGR_C_984p {Agrobacterium tumefaciens [TaxId: 358]}
+VTSTYTSYRLISQDIGKSLERVSKQPDVARETEYYREKIGSVKSIDDFMADTRLYNYALKAHGLEDMAYAKAFIRKVLTEGASDKNAFANKLSDNRYAELAKSLDFAGLGAAATATEAAKSGVIGNYARQTLEQEAGDDNNGVRLALYFERKAPTIKSGLDFLADDALAQVFRTTFNLPDAFAAADVDKQAALIEKSINIKDLQDPEKVGKLLERFTIMWEMQNP
+>d2o9sa_ b.34.2.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GIDPFTGEAIAKFNFNGDTQVEMSFRKGERITLLRQVDENWYEGRIPGTSRQGIFPITYVDVIKRPL
+>d2o9ux_ d.17.1.1 (X:) automated matches {Serendipity berry (Dioscoreophyllum cumminsii) [TaxId: 3457]}
+GEWEIIDIGPFTQNLGKFAVDEENKIGQYGRLTFNKVIRPCMKKTIYENEGFREIKGYEYQLYVYASDKLFRADISEDYKTRGRKLLRFNGPVPPP
+>d2oa5a_ d.362.1.1 (A:) Uncharacterized protein BQLF2 {Murid herpesvirus 4 [TaxId: 33708]}
+PDKTYEEMVKEVERLKLENKTLKQKVKSSGAVSSDDSILTAAKRESIIVSSSRALGAVAMRKIEAKVRSRAAKAVTEQELTSLLQSLTLRVDVSMEELEHH
+>d2ob3a_ c.1.9.3 (A:) Phosphotriesterase (parathion hydrolase, PTE) {Pseudomonas diminuta [TaxId: 293]}
+DRINTVRGPITISEAGFTLTHEHICGSSAGFLRAWPEFFGSRKALAEKAVRGLRRARAAGVRTIVDVSTFDIGRDVSLLAEVSRAADVHIVAATGLWFDPPLSMRLRSVEELTQFFLREIQYGIEDTGIRAGIIKVATTGKATPFQELVLKAAARASLATGVPVTTHTAASQRDGEQQAAIFESEGLSPSRVCIGHSDDTDDLSYLTALAARGYLIGLDHIPYSAIGLEDNASASALLGIRSWQTRALLIKALIDQGYMKQILVSNDWTFGFSSYVTNIMDVMDRVNPDGMAFIPLRVIPFLREKGVPQETLAGITVTNPARFLSPTLRA
+>d2ob5a1 c.133.1.1 (A:1-147) Hypothetical protein Atu2016 {Agrobacterium tumefaciens [TaxId: 358]}
+MLKNIDPALNADVLHALRAMGHGDTLVISDTNFPSDSVARQTTVGKVLHIDNVSAARAMKAILSVLPLDTPLQPSVGRMEVMGAPDQLEPVQVEVQQEIDAAEGKSAPMYGIERFAFYEKAKQAYCVITTGETRFYGCFLLTKGVIP
+>d2od0a1 d.198.5.2 (A:3-105) Hypothetical protein VP1028 {Vibrio parahaemolyticus [TaxId: 670]}
+KPILKDSMKLFEALGTIKSRSMFGGFGLFADETMFALVVNNQLHIRADQQTSSDFETQGLKPYVYKKRGFPVVTKYYAISSELWESSDRLIEVAKKSLENAKL
+>d2odka1 d.306.1.1 (A:1-51) Hypothetical protein NE2111 {Nitrosomonas europaea [TaxId: 915]}
+MHVWPVQDAKARFSEFLDACITEGPQIVSRRGAEEAVLVPIGEWRRLQAAA
+>d2oeba1 a.70.2.1 (A:2-153) Hypothetical protein AF1862 {Archaeoglobus fulgidus [TaxId: 2234]}
+DIREIEQERASFAFKVVSDIKDKYSQNKKVQGKYSSYAEKAPTIILNNGLGATLAFFLSKLEKPIDDVDYKSINPESFGNAENIAYAFLYKHLSTWLAEGNGKDSAFSGLTNGEDPLKYIMEKTAIDVAISTEEALSILNWIKKFAKAMLEE
+>d2oeea1 a.281.1.2 (A:3-112) Hypothetical protein YheA {Bacillus subtilis [TaxId: 1423]}
+VNFYDVAYDLENALRGSEEFTRLKNLYDEVNADESAKRMFENFRDVQLRLQQKQMAGEEITQEEVTQAQKTVALVQQHEKISQLMEAEQRMSMLIGELNKIIMKPLEELY
+>d2oeza1 e.68.1.1 (A:1-245) Uncharacterized protein VP2528 {Vibrio parahaemolyticus [TaxId: 670]}
+ATTHKFEHPLNEKTRIYLRVESLLRQAHLASGFADNHQYQLFFRALFDMVEIFEQIQLKSELAKDLEKQRLSYRHWLNVEGVDQEALNSLLNEIDVVHSQLMGAERFGQALKEDRFLSSIRQRFNLPGGSCCFDLPALHYWLHLPIERKKHDANQWQKSLKPLSDALTLWLKLARETGHFKAQIARAGFFQSDADEANILRLHIPMKYGVYPMISGHKNRFAIKFMAFENGQACSQDVEFELAVC
+>d2ofca_ b.97.1.2 (A:) automated matches {Athelia rolfsii [TaxId: 39291]}
+TYKITVRVYQTNPNAFFHPVEKTVWKYANGGTWTITDDQHVLTMGGSGTSGTLRFHADNGESFTATFGVHNYKRWCDIVTNLAADETGMVINQQYYSQKNREEARERQLSNYEVKNAKGRNFEIVYTEAEGNDLHANLIIG
+>d2ogfa_ d.316.1.0 (A:) automated matches {Methanocaldococcus jannaschii [TaxId: 2190]}
+SLRVEETEVFKKYFKNLTDRERAVFEGGITLGALFHQFVGTPVSKYNKESLERAIEEAMKNQPCVYDIKVKIRNVGEKYVSLDGKMLDVDLKIKINKTVAHLKLEYIPEIDYPLMYVKKFE
+>d2ogqa1 d.223.1.2 (A:371-494) Serine/threonine-protein kinase plk C-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+DCHLSDMLQQLHSVNASKPSERGLVRQEEAEDPACIPIFWVSKWVDYSDKYGLGYQLCDNSVGVLFNDSTRLILYNDGDSLQYIERDGTESYLTVSSHPNSLMKKITLLKYFRNYMSEHLLKAG
+>d2ohwa1 d.79.8.1 (A:3-130) Uncharacterized protein YueI {Bacillus subtilis [TaxId: 1423]}
+EDKMDLYLQQGMYGPLETKPDERHLFLGSLRERVVLALTKGQVLRSKPYKEAEHELKNSHNVTLLINGELQYQSYSSYIQMASRYGVPFKIVSDLQFHTPLGIVIAADIAVNRELIYIQDDIYNRSVL
+>d2oizd_ g.21.1.0 (D:) automated matches {Alcaligenes faecalis [TaxId: 511]}
+EVNSCDYWRHCAVDGFLCSCCGGTTTTCPPGSTPSPISWIGTCHNPHDGKDYLISYHDCCGKTACGRCQCNTQTRERPGYEFFLHNDVNWCMANENSTFHCTTSVLVGLA
+>d2okfa1 c.52.1.32 (A:4-139) FdxN element excision controlling factor protein {Anabaena variabilis [TaxId: 1172]}
+RDVFHEVVKTALKKDGWQITDDPLTISVGGVNLSIDLAAQKLIAAERQGQKIAVEVKSFLKQSSAISEFHTALGQFINYRGALRKVEPDRVLYLAVPLTTYKTFFQLDFPKEIIIENQVKMLVYDVEQEVIFQWIN
+>d2okua1 a.48.5.1 (A:443-564) Uncharacterized protein PG0775 {Porphyromonas gingivalis [TaxId: 837]}
+QVVAAIRHITTGTYIARIREEYQQTEVKPELQPMKEALARMTDRAEALIAFVTEQKDQELLDFQARRLVEMTAHAVFGHLLMLAANDDDSFRQSAEVYLRYGQAEQEKIDSYVRAFRPEELT
+>d2olra1 c.91.1.1 (A:228-540) Phosphoenolpyruvate (PEP) carboxykinase (ATP-oxaloacetate carboxy-lyase) {Escherichia coli [TaxId: 562]}
+IASMHCSANVGEKGDVAVFFGLSGTGKTTLSTDPKRRLIGDDEHGWDDDGVFNFEGGCYAKTIKLSKEAEPEIYNAIRRDALLENVTVREDGTIDFDDGSKTENTRVSYPIYHIDNIVKPVSKAGHATKVIFLTADAFGVLPPVSRLTADQTQYHFLSGFTAKLAGTERGITEPTPTFSACFGAAFLSLHPTQYAEVLVKRMQAAGAQAYLVNTGWNGTGKRISIKDTRAIIDAILNGSLDNAETFTLPMFNLAIPTELPGVDTKILDPRNTYASPEQWQEKAETLAKLFIDNFDKYTDTPAGAALVAAGPKL
+>d2olra2 c.109.1.1 (A:6-227) Phosphoenolpyruvate (PEP) carboxykinase (ATP-oxaloacetate carboxy-lyase) {Escherichia coli [TaxId: 562]}
+GLTPQELEAYGISDVHDIVYNPSYDLLYQEELDPSLTGYERGVLTNLGAVAVDTGIFTGRSPKDKYIVRDDTTRDTFWWADKGKGKNDNKPLSPETWQHLKGLVTRQLSGKRLFVVDAFCGANPDTRLSVRFITEVAWQAHFVKNMFIRPSDEELAGFKPDFIVMNGAKCTNPQWKEQGLNSENFVAFNLTERMQLIGGTWYGGEMKKGMFSMMNYLLPLKG
+>d2omzb_ b.1.6.1 (B:) E-cadherin (epithelial) {Human (Homo sapiens) [TaxId: 9606]}
+GPLGSWVIPPISCPENEKGPFPKNLVQIKSNKDKEGKVFYSITGQGADTPPVGVFIIERETGWLKVTEPLDRERIATYTLFSHAVSSNGNAVEDPMEILITVTDQ
+>d2oq0a1 b.40.16.1 (A:115-202) Gamma-interferon-inducible protein Ifi-16 {Human (Homo sapiens) [TaxId: 9606]}
+LKIDILHKQASGNIVYGVFMLHKKTVNQKTTIYEIQDDRGKMDVVGTGQCHNIPCEEGDKLQLFCFRLRKKNQMSKLISEMHSFIQIK
+>d2oqza_ b.100.1.1 (A:) Hypothetical protein BA4783 {Anthrax bacillus (Bacillus anthracis) [TaxId: 1392]}
+IFMDYYENRKVMAEAQNIYEKSPMEEQSQDGEVRKQFKALQQINQEIVGWITMDDTQINYPIVQAKDNDYYLFRNYKGEDMRAGSIFMDYRNDVKSQNRNTILYGHRMKDGSMFGSLKKMLDEEFFMSHRKLYYDTLFEGYDLEVFSVYTTTTDFYYIETDFSSDTEYTSFLEKIQEKSLYKTDTTVTAGDQIVTLSTCDYALDPEAGRLVVHAKLVKRQ
+>d2ot3a_ a.222.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SKEFIEFLKTFHKTGQEIYKQTKLFLEGMHYKRDLSIEEQSECAQDFYHNVAERMQTRGKVPPERVEKIMDQIEKYIMTRLYKYVFCPETTDDEKKDLAIQKRIRALRWVTPQMLCVPVNEDIPEVSDMVVKAITDIIEMDSKRVPRDKLACITKCSKHIFNAIKITKNEPASADDFLPTLIYIVLKGNPPRLQSNIQYITRFCNPSRLMTGEDGYYFTNLCCAVAFIEKLDAQSLNLSQEDFDRYMSGQTSP
+>d2otaa1 a.284.1.1 (A:7-68) Hypothetical protein CPS2611 {Colwellia psychrerythraea [TaxId: 28229]}
+YSNERVEKIIQDLLDVLVKEEVTPDLALMCLGNAVTNIIAQVPESKRVAVVDNFTKALKQSV
+>d2ou3a1 a.287.1.1 (A:1-160) Tellurite resistance protein of COG3793 {Nostoc punctiforme pcc 73102 [TaxId: 63737]}
+MSDIKKLGSSWIINWFFGFNQIPTNEDSSIYMKSVLTCAKADGVISPEEKDWALGFCASWGVADWVIEDLKTYEADEALEEVIARSPQVSMAQRDILLSAIWVSAADGELHEKEKAKIRKMATILGIKEEIVDQLEQLYYYEAALRQKRLNLLYPQKSPY
+>d2oufa1 a.292.1.1 (A:13-92) Hypothetical protein HP0242 {Helicobacter pylori [TaxId: 210]}
+NPLDKWNDIIFHASKKLSKKELERLLELLALLETFIEKEDLEEKFESFAKALRIDEELQQKIESRKTDIVIQSMANILSG
+>d2ouxa1 a.118.26.1 (A:6-135) Magnesium transporter MgtE {Enterococcus faecalis [TaxId: 1351]}
+EMEEQFALLLETLKNQQMNEFRELFLALHIYEQGQFYQSLDEKDRQHLYNYLSPKELADMFDVIEEDNENMKDYLAEMRPSYAADMLAEMYTDNAVDLLNMLDKSQKAKYLSLLSSEEAGEIKELLHYED
+>d2ov0a_ b.6.1.1 (A:) Amicyanin {Paracoccus denitrificans [TaxId: 266]}
+DKATIPSESPFAAAEVADGAIVVDIAKMKYETPELHVKVGDTVTWINREAMPHNVHFVAGVLGEAALKGPMMKKEQAYSLTFTEAGTYDYHCTPHPFMRGKVVVE
+>d2ox7a1 b.172.1.1 (A:3-145) Hypothetical protein EF1440 {Enterococcus faecalis [TaxId: 1351]}
+LIPKFRAWDTYEKEMLENVTPLFDDSNSMIAIITDFQIKGSPGTSEIEIGSYDTTFNWDEFPYVIMQSTGLKDKNGVEIFEGDILVYDAPKKYAHRRSMHEIAYADGRFFWEFLDLVFCQSNILYRDGYLVIGNIHENPELLE
+>d2oy9a1 a.276.1.1 (A:6-90) Uncharacterized protein BH2638 {Bacillus halodurans [TaxId: 86665]}
+TLPISLDWSTEEVIDVVHFFQAIEQAYDQGIAREDLLGKYRRFKEIVPSKSEEKQLFRAYEQENDVSCYQTIKKAREEMEEHIQM
+>d2p02a1 d.130.1.1 (A:38-147) S-adenosylmethionine synthetase {Human (Homo sapiens), isoform type-2 [TaxId: 9606]}
+GTFLFTSESVGEGHPDKICDQISDAVLDAHLQQDPDAKVACETVAKTGMILLAGEITSRAAVDYQKVVREAVKHIGYDDSSKGFDYKTCNVLVALEQQSPDIAQGVHLDR
+>d2p0ta1 a.290.1.1 (A:22-169) Uncharacterized protein PSPTO4464 {Pseudomonas syringae pv. tomato [TaxId: 323]}
+LHALVDLGERLTTLKADVLAKLPLTDALRKALAEAPKHTANIARKRHILFIGKLMRDQDQEAILVLLDQLDASTRQYNERFHNLERWRDRLIAGDDADLEKFVIEYPDADRQQLRSLIRQAQHEVARNKPPATSRKIFKYIRELDELQ
+>d2p12a1 b.175.1.1 (A:8-172) Hypothetical protein RHA1_ro00977 {Rhodococcus sp. RHA1 [TaxId: 101510]}
+IHPPKVEYFDLRDHTNTDPKGFVRHVDHYRVEPWGLYMARTSDHPQFHYLESWLLPDLGLRASIFHYHPYHQRDQDHYVDIGTFTRGDDVWKSEDHYLDLVVRTGRDTELLDVDELMEAHTTGLLDTATAEQAILTATTAIDGIAAHGHDLGRWLASIGMPIDWR
+>d2p3pa1 d.383.1.1 (A:66-262) Hypothetical protein PG1388 {Porphyromonas gingivalis [TaxId: 837]}
+AGELERCFLAMPESVLPIVTMEERNDLCRRAGHLSGFTHTASLESSLGGTVTFLLNRNFIRIQTSTVGEVFMRILPFSDSSSVICVVTTVLHPVADSRIDFYTTEWKPLKTDRFWQQPRIEDFFLPHTDRQSYAYQAIYASLTPSYMQVSLSEESDTLSIRQTVTETLAEEEKPLAAIFLSPEPLVYRWQSGRFVRQ
+>d2p3ya1 e.65.1.1 (A:22-482) Hypothetical protein VPA0735 {Vibrio parahaemolyticus [TaxId: 670]}
+QETVVPSRVGDLKFESDFPTQETMKNMLNEMDFQRATQAYLWGIPASSIMEWLNVSRNDFKFEEGQMGFFNTLKQKQGIITANFTTPYVIGTWNLEKTGPLIINLPEAKMAGMMLDVHQRVLSDLSLLGPDKGKGGKYLIVPPGEKYKDLNPKGYYVIRPKTNVVYGGIRILEPDVDRVVKQVVPNITTQPYADGKLGRKIPVAQVPEIDWTHIPKDGLEYWKTIHQIIQENPVEERDRFVMAQLKFLGIEKGKPFNPTEEQKKILLEASKVGRAMAQSNDYTKRFTQPYWKGTNWKDAISVSLDQRSENYDELDERAAWFYEAITVSRGMKSTIPGFGQRYLVTYQDSDGNWLSGEHTYKLHVPANVPASNFWSTTVYDENNRLMIINDAGSPDISSRKNLKVNSDGSIDVYYGPKPVKGYENNWVQTNPGEGWFTYFRFYGPTEKMFDKSWTMGDIELV
+>d2p5ma1 d.74.2.1 (A:79-149) C-terminal domain of arginine repressor {Bacillus subtilis [TaxId: 1423]}
+ALMDAFVKIDSASHMIVLKTMPGNAQAIGALMDNLDWDEMMGTICGDDTILIICRTPEDTEGVKNRLLELL
+>d2p62a1 e.67.1.1 (A:1-241) Hypothetical protein PH0156 {Pyrococcus horikoshii [TaxId: 53953]}
+MRIKLIIVEGKTDESFFKVLLEKLYGFREAKKLTPEFPIGKWGFRIGEHPLVLEKDNIALVIIHAEGKQRIPKVLKSVLDSVKLGLLNVEEVYVVRDVDEGNDVFEWVLSFLREREVRVDNGAIVTEGVKIYPYGMGNLTLNEPFVKEKKELELSLAYLAKLDGILEKYRGSMRALSQDKGDKLTPKDVMHILSIANDYTGDCLSGLYEKYIGIMIHRNRELLIRFLSEVNLLPLLERMVG
+>d2p6va1 a.277.1.1 (A:582-678) Transcription initiation factor TFIID subunit 4, TAF4 {Human (Homo sapiens) [TaxId: 9606]}
+SSAATETMENVKKCKNFLSTLIKLASSGKQSTETAANVKELVQNLLDGKIEAEDFTSRLYRELNSSPQPYLVPFLKRSLPALRQLTPDSAAFIQQSQ
+>d2p74a_ e.3.1.1 (A:) automated matches {Escherichia coli [TaxId: 562]}
+ETSAVQQKLAALEKSSGGRLGVALIDTADNTQVLYRGDERFPMCSTSKVMAAAAVLKQSETQKQLLNQPVEIKPADLVNYNPIAEKHVNGTMTLAELSAAALQYSDNTAMNKLIAQLGGPGGVTAFARAIGDETFRLDRTEPTLNTAIPGDPRDTTTPRAMAQTLRQLTLGHALGETQRAQLVTWLKGNTTGAASIRAGLPTSWTAGDKTGSGDYGTTNDIAVIWPQGRAPLVLVTYFTQPQQNAESRRDVLASAARIIAEGL
+>d2p8ia_ d.58.55.1 (A:) Putative dioxygenase BxeB0224 {Burkholderia xenovorans [TaxId: 36873]}
+GMTFRDTSAIASWHAHVYFDASSRDAAWTLREQIEAHWSGKLQLGRFHERPVGPHPMWSYQLAFTQEQFADLVGWLTLNHGALDIFLHPNTGDALRDHRDAAVWIGHSHELVLSALN
+>d2p8ta2 d.74.4.2 (A:83-199) Hypothetical protein PH0730 {Pyrococcus horikoshii [TaxId: 53953]}
+MFSEPIGVSVDGYPGIAIVVKNPPEFKSIELRDEAIKFDAKGAMILTVKDNEIVFPEDFRPLKEMYPEVAKKIVDYEDGDAVIITWAETPAKALKSAIHVAYILKKEEITPEILEVV
+>d2p90a1 c.56.8.1 (A:6-274) Hypothetical protein Cgl1923 {Corynebacterium glutamicum [TaxId: 1718]}
+DRMYELEYPSPEVSGQTAGGPTLIVALQGYADAGHAVESSSSHLMDALDHRLIASFNNDELIDYRSRRPVVVIEHNEVTSMDELNLGLHVVRDNDNKPFLMLSGPEPDLRWGDFSNAVVDLVEKFGVENTICLYAAPMTVPHTRPTVVTAHGNSTDRLKDQVSLDTRMTVPGSASLMLEKLLKDKGKNVSGYTVHVPHYVSASPYPAATLKLLQSIADSADLNLPLLALERDAEKVHRQLMEQTEESSEIQRVVGALEQQYDSELERYR
+>d2pbdp_ d.110.1.1 (P:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+AGWNAYIDNLMADGTCQDAAIVGYKDSPSVWAAVPGKTFVNITPAEVGVLVGKDRSSFYVNGLTLGGQKCSVIRDSLLQDGEFSMDLRTKSTGGAPTFNVTVTKTDKTLVLLMGKEGVHGGLINKKCYEMASHLRRSQY
+>d2pbka_ b.57.1.1 (A:) KSHV protease {Kaposi's sarcoma-associated herpesvirus [TaxId: 37296]}
+QGLYVGGFVDVVSCPKLEQELYLDPDQVTDYLPVTEPLPITIEHLPETEVGWTLGLFQVSHGIFCTGAITSPAFLELASRLADTSHVARAPVKNLPKEPLLEILHTWLPGLSLSSIHPRELSQTPSGPVFQHVSLCALGRRRGTVAVYGHDAEWVVSRFSSVSKSERAHILQHVSSCRLEDLSTPNFVSPLETLMAKAIDAGFIRDRLDLLKTDRGVASILSPVYLKA
+>d2phcb2 d.74.5.1 (B:2-85) Uncharacterized protein PH0987 {Pyrococcus horikoshii [TaxId: 53953]}
+IIKPAGDSAFLISFGDEISEEINDRVHSLAKAIEKESPEWLVELVPAYSSLLVIYDPLKASYEEVESYLKRISAREVERIKGKT
+>d2phna_ d.340.1.1 (A:) F420-0:gamma-glutamyl ligase CofE {Archaeoglobus fulgidus [TaxId: 2234]}
+RVEVFPVEGLPLIKEGDDLAELISSRVRFEDGDVLVVCSTVISKAEGRIRRLEEFNPSERAKEIAARIGKPAEFVQAVLEESEEVLLDFPFLLVKAKFGNVCVNAGIDASNVEEGSLLLPPLDPDGSAEKLRRRILELTGKRVGVIITDTNGRCFRRGVVGFAIGISGVKAMKDWIGRKDLYGRELEVTVECVADEIAAFANLLMGEGGDGIPAVVVRGLNVAGEGSMEEIYRSEEEDVIRRCLKRCL
+>d2pifa1 d.382.1.1 (A:7-262) Uncharacterized protein PSTPO5379 {Pseudomonas syringae pv. tomato [TaxId: 323]}
+ARQSAIAAAREARGTYRNGLVTPTAGVAPGMTQANLIALPRDWAYDFLLYAQRNPKACPILDVSDAGSPTTLLAEGSDLRTDIPMYRIWRDGKLAEEVSDATQAWAEHDDMVAFLIGCSFTFETPLQEAGIEVRHITDGCNVPMYRTNRACRPAGRLHGEMVVSMRPIPADRVAEASAISGRYPSVHGAPVHIGEPGRLGINDLSRPDFGDAVSIKPGEVPVFWACGVTPQAAVMASGVPFAITHSPGYMFITDVP
+>d2pjua1 c.92.3.1 (A:11-196) Propionate catabolism operon regulatory protein PrpR {Escherichia coli [TaxId: 562]}
+KPVIWTVSVTRLFELFRDISLEFDHLANITPIQLGFEKAVTYIRKKLANERCDAIIAAGSNGAYLKSRLSVPVILIKPSGYDVLQFLAKAGKLTSSIGVVTYQETIPALVAFQKTFNLRLDQRSYITEEDARGQINELKANGTEAVVGAGLITDLAEEAGMTGIFIYSAATVRQAFSDALDMTRMS
+>d2pk8a_ d.274.1.1 (A:) Hypothetical protein PF0899 {Pyrococcus furiosus [TaxId: 2261]}
+STRGDLIRILGEIEEKMNELKMDGFNPDIILFGREAYNFLSNLLKKEMEEEGPFTHVSNIKIEILEELGGDAVVIDSKVLGLVPGAAKRIKIIK
+>d2pmra1 a.8.11.1 (A:3-77) Uncharacterized protein MTH1690 {Methanobacterium thermoautotrophicum [TaxId: 145262]}
+CRERIEKDLELLEKNLMEMKSIKLSDDEEAVVERALNYRDDSVYYLEKGDHITSFGCITYAHGLLDSLRMLHRII
+>d2ppva_ c.143.1.0 (A:) automated matches {Staphylococcus epidermidis [TaxId: 176280]}
+KQMNVVLIGGGTGLSVLARGLREFPIDITAIVTVADNGGSTGKIRDVMDIPAPGDIRNVIAALSDSESILTQLFQYRFGENQVDGHSLGNLVIAGMTNITNDFGHAIKELSKVLNIKGQVIPSTNASVQLNAVMEDGEIVHGETNIPKTHKKIDRVFLEPSDVEPMNEAIEALEQADLIVLGPGSLYTSVISNLCVKGISEALLRTSAPKLYVSNVMTQPGETDNYDVKEHIDALTRQVGEPFIDFVICSSESYSKDVLQRYEEKNSKPVAVHKEQLKDSGIRVLTASNLVEISNEHYVRHNTKVLSKMIYELALELTSTIRFTP
+>d2prva1 d.369.1.1 (A:1-152) Uncharacterized protein YobK {Bacillus subtilis [TaxId: 1423]}
+MIYSKVENFINENKQNAIFTEGASHENIGRIEENLQCDLPNSYKWFLEKYGAGGLFGVLVLGYNFDHASVVNRTNEYKEHYGLTDGLVVIEDVDYFAYCLDTNKMKDGECPVVEWDRVIGYQDTVADSFIEFFYNKIQEAKDDWDEDEDWDD
+>d2psba1 c.153.1.1 (A:13-308) Uncharacterized protein YerB {Bacillus subtilis [TaxId: 1423]}
+KLKAPLTGLKTEQKVTERRPVAVVVNNHPKARPQSGLSKADIVIEALAEGQITRFLAIFQSQMPETVGPVRSAREYFVTLSNGFDSIFVHHGWSPGAKKQLESGAADYMNGLDFDGSLFWRADFSKPPHNSYTSYDYIKKAAEQKGYKLKQETNPLLFQTSDAKPANESYNVRVDYGTNNVTNLVEYNYDKKAEFYTRSSDGVITTDRETGKPVAMQNIFIVEASHHIIDQDGRRDIDLESGGKGLLFQHGNVIETDWKQVNGRIVPVKDGKWLPFVPGKTWINIVPDLDAASISK
+>d2pspa1 g.16.1.1 (A:1-53) Pancreatic spasmolytic polypeptide {Pig (Sus scrofa) [TaxId: 9823]}
+EKPAACRCSRQDPKNRVNCGFPGITSDQCFTSGCCFDSQVPGVPWCFKPLPAQ
+>d2pstx_ d.100.2.1 (X:) automated matches {Pseudomonas aeruginosa [TaxId: 208964]}
+DDIQFQVVVNHEEQYSIWPEYKEIPQGWRAAGKSGLKKDCLAYIEEVWTDMRPLSLRQHMD
+>d2ptha_ c.56.3.1 (A:) Peptidyl-tRNA hydrolase {Escherichia coli [TaxId: 562]}
+TIKLIVGLANPGAEYAATRHNAGAWFVDLLAERLRAPLREEAKFFGYTSRVTLGGEDVRLLVPTTFMNLSGKAVAAMASFFRINPDEILVAHDELDLPPGVAKFKLGGGHGGHNGLKDIISKLGNNPNFHRLRIGIGHPGDKNKVVGFVLGKPPVSEQKLIDEAIDEAARCTEMWFTDGLTKATNRLHAFKAQ
+>d2pu9a_ g.36.1.1 (A:) Ferredoxin thioredoxin reductase (FTR), catalytic beta chain {Synechocystis sp. [TaxId: 1143]}
+NKTLAAMKNFAEQYAKRTDTYFCSDLSVTAVVIEGLARHKEELGSPLCPCRHYEDKEAEVKNTFWNCPCVPMRERKECHCMLFLTPDNDFAGDAQDIPMETLEEVKASMA
+>d2pv4a1 a.286.1.1 (A:1-144) Uncharacterized protein Sama2622 {Shewanella amazonensis [TaxId: 60478]}
+MSEIDANYRALAQQVADKVAGRVIALDRLPESLLTAYRSLCDELLADRDGRFTRAWDQLPDSASSLFERCVFHGFYLANAWIQLSIVARDISELQDTDEAIAEQEYSGLYVRVAEAALKESVKKLKKARTDRSMYNSMREVMGI
+>d2pvba_ a.39.1.4 (A:) Parvalbumin {Pike (Esox lucius) [TaxId: 8010]}
+SFAGLKDADVAAALAACSAADSFKHKEFFAKVGLASKSLDDVKKAFYVIDQDKSGFIEEDELKLFLQNFSPSARALTDAETKAFLADGDKDGDGMIGVDEFAAMIKA
+>d2pwwa1 d.129.11.1 (A:1-114) Uncharacterized protein ABC2387 {Bacillus clausii [TaxId: 79880]}
+LKFPDTGLEEKEVAFSIVNHAAKSLGFIHVDQWDYERVMFDYKIVHHEGTFYLRVPAYAVKGEIPRPSTIVQIMTPILGKYYYPHGVEYEGETFPQAVIDKCNNKLALLAKTIK
+>d2pyqa1 a.279.1.1 (A:1-113) Uncharacterized protein Jann4075 {Jannaschia sp. CCS1 [TaxId: 290400]}
+MGKRDDLIAQYADDLRNKCGMEPDMALLEKVTKGCGPAIYNRDASTVAGSDTAELETIKKNFLMKKLGLADSESLMGGIQSVIETYGRSERNKYRAVVYYMLTKHFGKESVYG
+>d2q03a1 b.159.2.1 (A:5-137) Uncharacterized protein Sden_2034 {Shewanella denitrificans [TaxId: 192073]}
+TKLQTIIGMFQITAWDETSYFESDNGAKLTQAVITQSYQGVLQGHSEIRYLMSYQDNANATFVGFEHFTGSLGDKKGSFILQHKGLFAAGVASSEFELVERSATGDFVHLVGKGHFVSTENGQANYQITLQDS
+>d2q0zx1 a.289.1.1 (X:33-208) Protein pro2281 {Human (Homo sapiens) [TaxId: 9606]}
+TKVRGLIEIISNAAEYENIPIRHHEDNLLRQLAQKVPHKLNNPKFNDPHVKTNLLLQAHLSRMQLSAELQSDTEEILSKAIRLIQACVDVLSSNGWLSPALAAMELAQMVTQAMWSKDSYLKQLPHFTSEHIKRCTDKGVESVFDIMEMEDEERNALLQLTDSQIADVARFCNRYP
+>d2q22a1 d.365.1.1 (A:8-138) Uncharacterized protein Ava3019 {Anabaena variabilis [TaxId: 1172]}
+NLTTADAKKILNKFNCLDIAPILKPSEKESVRRALILITKLSDYQILGICADTADEGLLAMKTYSHALGYEVPIDLPVVEGPVYIKLNGKNGLCYLDSYAGHHRGVLVSCQSYYEGGINEMYGHLPLDLFV
+>d2q4ma1 d.23.1.2 (A:24-212) Hypothetical protein At5g01750 {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+GGVVVDPKYCAPYPIDMAIVRKMMSLTDGNFVITDVNGNLLFKVKEPVFGLHDKRVLLDGSGTPVVTLREKMVSMHDRWQVFRGGSTDQRDLLYTVKRSSMLQLKTKLDVFLGHNKDEKRCDFRVKGSWLERSCVVYAGESDAIVAQMHRKHTVQSVFLGKDNFSVTVYPNVDYAFIASLVVILDDVNR
+>d2q66a3 d.58.16.1 (A:352-529) Poly(A) polymerase, PAP, C-terminal domain {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+NDFFFRYKFYLEITAYTRGSDEQHLKWSGLVESKVRLLVMKLEVLAGIKIAHPFTKPFESSYCCPTEDDYEMIQDKYGSHKTETALNALKLVTDENKEEESIKDAPKAYLSTMYIGLDFNIENKKEKVDIHIPCTEFVNLCRSFNEDYGDHKVFNLALRFVKGYDLPDEVFDENEKRP
+>d2qfaa_ g.52.1.1 (A:) Anti-apoptotic protein survivin {Human (Homo sapiens) [TaxId: 9606]}
+TLPPAWQPFLKDHRISTFKNWPFLEGCACTPERMAEAGFIHCPTENEPDLAQCFFCFKELEGWEPDDDPIEEHKKHSSGCAFLSVKKQFEELTLGEFLKLDRERAKNKIAKETNNKKKEFEETAKKVRRAIEQLAAM
+>d2qfra1 b.1.12.1 (A:9-120) Purple acid phosphatase, N-terminal domain {Kidney bean (Phaseolus vulgaris) [TaxId: 3885]}
+RDMPLDSDVFRVPPGYNAPQQVHITQGDLVGRAMIISWVTMDEPGSSAVRYWSEKNGRKRIAKGKMSTYRFFNYSSGFIHHTTIRKLKYNTKYYYEVGLRNTTRRFSFITPP
+>d2qgma1 c.150.1.3 (A:33-445) Succinoglycan biosynthesis protein BC3205 {Bacillus cereus [TaxId: 1396]}
+SGQSVQKNIVKSIQSQANPLKTIEPSKPFEDLKPLKKMIGNAQYVGLGENTHGSSEIFTMKFRLVKYLVTEMGFTNFAMEEDWGNGLKLNEYIQTGKGNPREFLKLLYPTDEIIAMIEWMKDYNADPSNKKKIQFIGLDLKALDQGSFNKVIDYVRLHRPDLLAEVEENYKELSSFTGSIQEYMKLTPKLKEKFKANAERVARLLKDENEQANTEIIPSEYIWAKATASAIEKFTTMLLPNDYPSIIKLHEQYLADHAMWAQETFGGKTMVWAHNIHIAKGIIDEKLYPYVAGQFLKERLDNNYVTIGSTTTEGNFTLYSEYNPSTGGKITTDTIPQDVKSFNYTLGKVPYKMFLLDNRHLKGQAEKWVKAKRPLLSIGGQILPNSSVYFDTSLLEQFDIIFHIRKTSPSHIK
+>d2qhfa_ d.258.1.0 (A:) automated matches {Mycobacterium tuberculosis [TaxId: 1773]}
+MLRWITAGESHGRALVAVVEGMVAGVHVTSADIADQLARRRLGYGRGARMTFERDAVTVLSGIRHGSTLGGPIAIEIGNTEWPKWETVMAADPVDPAELADVARNAPLTRPRPGHADYAGMLKYGFDDARPVLERASARETAARVAAGTVARAFLRQALGVEVLSHVISIGASAPYEGPPPRAEDLPAIDASPVRAYDKAAEADMIAQIEAAKKDGDTLGGVVEAVALGLPVGLGSFTSGDHRLDSQLAAAVMGIQAIKGVEIGDGFQTARRRGSRAHDEMYPGPDGVVRSTNRAGGLEGGMTNGQPLRVRAAMKPISTVPRALATVDLATGDEAVAIHQRSDVCAVPAAGVVVETMVALVLARAALEKFGGDSLAETQRNIAAYQRSVADR
+>d2qklb1 a.242.1.1 (B:2-91) mRNA decapping enzyme Dcp2p, N-terminal domain {Fission yeast (Schizosaccharomyces pombe) [TaxId: 4896]}
+SFTNATFSQVLDDLSARFILNLPAEEQSSVERLCFQIEQAHWFYEDFIRAQNDQLPSLGLRVFSAKLFAHCPLLWKWSKVHEEAFDDFLR
+>d2qn6b1 d.58.51.1 (B:176-264) eIF-2-alpha, C-terminal domain {Sulfolobus solfataricus [TaxId: 2287]}
+KVKMSGLITVRTNEPLGVEKIKEVISKALENIEQDYESLLNIKIYTIGAPRYRVDVVGTNPKEASEALNQIISNLIKIGKEENVDISVV
+>d2qsba1 a.29.14.1 (A:2-86) Uncharacterized protein Ta0600 {Thermoplasma acidophilum [TaxId: 2303]}
+VRVDQNLFNEVMYLLDELSQDITVPKNVRKVAQDSKAKLSQENESLDLRCATVLSMLDEMANDPNVPAHGRTDLYTIISKLEALS
+>d2quda_ d.85.1.1 (A:) automated matches {Pseudomonas phage [TaxId: 12023]}
+GGSMSKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDSGLPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGR
+>d2r0xa_ b.45.1.0 (A:) automated matches {Haemophilus somnus [TaxId: 205914]}
+VEVSQFKDAMAQLASAVHIVTTSGETGQHGFTASAVCSVTDSPPTLLVCINSNARAYEHFVKNRVLMVNTLTAEQSSLSNIFASPLSQEERFSNASWTTLTTGSPMLQDALINFDCEITEIKHVGTHDILICKIVDIHQSNAKNALVYRNRVYHSV
+>d2r31a_ d.381.1.1 (A:) ATP12 ATPase {Paracoccus denitrificans [TaxId: 266]}
+HMSEWKARRFWASVGIHKEEGGWAVLLDERPLRTPGKQPLRLPTEALALAIAEEWQAVQEVIDPNAMPLTRSANSAIEKVAPQFDAVAAMLGDYGGTDLLSYRADAPEALVRAQAEGWDPLIDWAATELRAPLRITHGVIPVPQDPVVLLKLRAEVASLDPFGLTALHDLVTLPGSLILGLAVIRGRIDAPTAHALSRIDEEFQAERWGRDEEAEAQAASRLAAMRDSERFWHLTR
+>d2r4qa1 c.44.2.2 (A:171-273) Fructose-specific enzyme IIABC component FruA, middle domain {Bacillus subtilis [TaxId: 1423]}
+KILAVTACPTGIAHTFMAADALKEKAKELGVEIKVETNGSSGIKHKLTAQEIEDAPAIIVAADKQVEMERFKGKRVLQVPVTAGIRRPQELIEKAMNQDAPIY
+>d2rbka_ c.108.1.10 (A:) Sugar-phosphate phosphatase BT4131 {Bacteroides thetaiotaomicron [TaxId: 818]}
+MTKALFFDIDGTLVSFETHRIPSSTIEALEAAHAKGLKIFIATGRPKAIINNLSELQDRNLIDGYITMNGAYCFVGEEVIYKSAIPQEEVKAMAAFCEKKGVPCIFVEEHNISVCQPNEMVKKIFYDFLHVNVIPTVSFEEASNKEVIQMTPFITEEEEKEVLPSIPTCEIGRWYPAFADVTAKGDTKQKGIDEIIRHFGIKLEETMSFGDGGNDISMLRHAAIGVAMGQAKEDVKAAADYVTAPIDEDGISKAMKHFGII
+>d2rcfa1 b.40.15.1 (A:1-82) Carboxysome shell protein {Thiobacillus neapolitanus [TaxId: 927]}
+MKIMQVEKTLVSTNRIADMGHKPLLVVWEKPGAPRQVAVDAIGCIPGDWVLCVGSSAAREAAGSKSYPSDLTIIGIIDQWNG
+>d2rdea1 b.45.2.1 (A:138-247) Hypothetical protein VCA0042, C-terminal domain {Vibrio cholerae O395 [TaxId: 345073]}
+EPRFELNLAGKVLFDEHRGDCELRDLSRSGCRFITPPLGKTYQVGDLVALEIFSDLRGTKTFPPLTGKICNLQRSLHHARYGLEFNEEGRNNAKNLLAQLKFNGTKLTLN
+>d2rfra1 d.17.4.28 (A:1-153) Uncharacterized protein Saro3722 {Novosphingobium aromaticivorans [TaxId: 48935]}
+MDDLTNLAARLRLLEDREEIRELIARYGPLADSGDAEALSELWVEDGEYAVVGFATAKGRAAIAALIDGQTHRALMADGCAHFLGPATVTVEGDTATARCHSVVFRCVSGTFGSHRVSANRWTFRRTPAGWRAVRRENALLDGSAAARALLQF
+>d2rh2a_ b.34.4.1 (A:) automated matches {Escherichia coli [TaxId: 562]}
+NATFGMGDRVRKKSGAAWQGQIVGWYCTNLTPEGYAVESEAHPGSVQIYPVAALERIN
+>d2rk3a_ c.23.16.2 (A:) DJ-1 {Human (Homo sapiens) [TaxId: 9606]}
+ASKRALVILAKGAEEMETVIPVDVMRRAGIKVTVAGLAGKDPVQCSRDVVICPDASLEDAKKEGPYDVVVLPGGNLGAQNLSESAAVKEILKEQENRKGLIATICAGPTALLAHEIGFGSKVTTHPLAKDKMMNGGHYTYSENRVEKDGLILTSRGPGTSFEFALAIVEALNGKEVAAQVKAPLVLK
+>d2rkqa_ d.118.1.0 (A:) automated matches {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+EVPIVTRAEWNAKPPNGAIDSMVTPLPRAVIAHTAGGACADDVTCSQHMRNLQNFQMSKQKFSDIGYHYLIGGNGKVYEGRSPSQRGAFAGPNNDGSLGIAFIGNFEERAPNKEALDAAKELLEQAVKQAQLVEGYKLLGHRQVSATKSPGEALYALIQQWPNWSEEML
+>d2rlda1 a.29.16.1 (A:1-115) Uncharacterized protein BT0352 {Bacteroides thetaiotaomicron [TaxId: 818]}
+MREDMKDNVVKDKSLEFAVRIVNLYKFLVNEQKEFVMSKQILRSGTSIGANIREAEQAQSRADFINKLNIALKEANETEYWLELLIRTEYITREQYESINNDSTEINKLLISIIK
+>d2rsla_ c.53.1.1 (A:) gamma,delta resolvase, catalytic domain {Escherichia coli [TaxId: 562]}
+MRLFGYARVSTSQQSLDIQVRALKDAGVKANRIFTDKASGSSSDRKGLDLLRMKVEEGDVILVKKLDRLGRDTADMIQLIKEFDAQGVSIRFIDDGISTDGEMGKMVVTILSAVAQAERQRI
+>d2saka_ d.15.5.1 (A:) Staphylokinase {Staphylococcus aureus [TaxId: 1280]}
+SYFEPTGPYLMVNVTGVDSKGNELLSPHYVEFPIKPGTTLTKEKIEYYVEWALDATAYKEFRVVELDPSAKIEVTYYDKNKKKEETKSFPITEKGFVVPDLSEHIKNPGFNLITKVVIEKK
+>d2sici_ d.84.1.1 (I:) Subtilisin inhibitor {Streptomyces albogriseolus, s-3253 [TaxId: 1887]}
+YAPSALVLTVGKGVSATTAAPERAVTLTCAPGPSGTHPAAGSACADLAAVGGDLNALTRGEDVMCPMVYDPVLLTVDGVWQGKRVSYERVFSNECEMNAHGSSVFAF
+>d2tpsa_ c.1.3.1 (A:) Thiamin phosphate synthase {Bacillus subtilis [TaxId: 1423]}
+HGIRMTRISREMMKELLSVYFIMGSNNTKADPVTVVQKALKGGATLYQFREKGGDALTGEARIKFAEKAQAACREAGVPFIVNDDVELALNLKADGIHIGQEDANAKEVRAAIGDMILGVSAHTMSEVKQAEEDGADYVGLGPIYPTETKKDTRAVQGVSLIEAVRRQGISIPIVGIGGITIDNAAPVIQAGADGVSMISAISQAEDPESAARKFREEIQTYKTGR
+>d2uuia1 f.56.1.1 (A:2-147) Leukotriene C4 synthase {Human (Homo sapiens) [TaxId: 9606]}
+KDEVALLAAVTLLGVLLQAYFSLQVISARRAFRVSPPLTTGPPEFERVYRAQVNCSEYFPLFLATLWVAGIFFHEGAAALCGLVYLFARLRYFQGYARSAQLRLAPLYASARALWLLVALAALGLLAHFLPAALRAALLGRLRTLL
+>d2v03a_ c.79.1.1 (A:) automated matches {Escherichia coli [TaxId: 562]}
+MSTLEQTIGNTPLVKLQRMGPDNGSEVWLKLEGNNPAGSVKDRAALSMIVEAEKRGEIKPGDVLIEATSGNTGIALAMIAALKGYRMKLLMPDNMSQERRAAMRAYGAELILVTKEQGMEGARDLALEMANRGEGKLLDQFNNPDNPYAHYTTTGPEIWQQTGGRITHFVSSMGTTGTITGVSRFMREQSKPVTIVGLQPEEGSSIPGIRRWPTEYLPGIFNASLVDEVLDIHQRDAENTMRELAVREGIFCGVSSGGAVAGALRVAAANPDAVVVAIICDRGDRYLSTGVFGE
+>d2v3za1 c.55.2.1 (A:1-176) Aminopeptidase P {Escherichia coli [TaxId: 562]}
+SEISRQEFQRRRQALVEQMQPGSAALIFAAPEVTRSADSEYPYRQNSDFWYFTGFNEPEAVLVLIKSDDTHNHSVLFNRVRDLTAEIWFGRRLGQDAAPEKLGVDRALAFSEINQQLYQLLNGLDVVYHAQGEYAYADVIVNSALEKLRKGSRQNLTAPATMIDWRPVVHEMRLFK
+>d2v6xa_ a.7.14.0 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+SHMSTGDFLTKGIELVQKAIDLDTATQYEEAYTAYYNGLDYLMLALKYEKNPKSKDLIRAKFTEYLNRAEQLKKHLESEEAN
+>d2v89a_ g.50.1.2 (A:) automated matches {Mouse (Mus musculus) [TaxId: 10090]}
+SPEFGYWITCCPTCDVDINTWVPFYSTELNKPAMIYCSHGDGHWVHAQCMDLEERTLIHLSEGSNKYYCNEHVQIARA
+>d2v8qb1 d.353.1.1 (B:190-272) 5'-AMP-activated protein kinase subunit beta-2 {Human (Homo sapiens) [TaxId: 9606]}
+GQEMYAFRSEERFKSPPILPPHLLQVILNKDTNISCDPALLPEPNHVMLNHLYALSIKDSVMVLSATHRYKKKYVTTLLYKPI
+>d2v8ta_ a.25.1.3 (A:) automated matches {Thermus thermophilus [TaxId: 262724]}
+MFLRIDRLQIELPMPKEQDPNAAAAVQALLGGRFGEMSTLMNYMYQSFNFRGKKALKPYYDLIANIATEELGHIELVAATINSLLAKNPGKDLEEGVDPASTPLGFAKDVRNAAHFIAGGANSLVMGAMGEHWNGEYVFTSGNLILDLLHNFFLEVAARTHKLRVYEMTDNPVAREMIGYLLVRGGVHAAAYGKALESLTGVEMTKMLPIPKIDNSKIPEAKKYMDLGFHRNLYRFSPEDYRDLGLIWKGASPEDGTEVVVVDGPPTGGPVFDAGHDAAEFAPEFHPGELYEIAKKLYEKAK
+>d2v94a1 d.12.1.3 (A:1-93) Ribosomal protein S24e {Pyrococcus abyssi [TaxId: 29292]}
+MEIKITEVKENKLIGRKEIYFEIYHPGEPTPSRKDVKGKLVAMLDLNPETTVIQYIRSYFGSYKSKGYAKYYYDKDRMLYIEPEYILIRDGII
+>d2v9la_ c.74.1.1 (A:) L-rhamnulose-1-phosphate aldolase {Escherichia coli [TaxId: 562]}
+MQNITYSWFVQGMIKATTDAWLKGWDERNGGNLTLRLDDADIAPYHDNFHQQPRYIPLSQPMPLLANTPFIVTGSGKFFRNVQLDPAANLGIVKVDSDGAGYHILWGLTNEAVPTSELPAHFLSHCERIKATNGKDRVIMHCHATNLIALTYVLENDTAVFTRQLWEGSTECLVVFPDGVGILPWMVPGTDAIGQATAQEMQKHSLVLWPFHGVFGSGPTLDETFGLIDTAEKSAQVLVKVYSMGGMKQTISREELIALGKRFGVTPLASALAL
+>d2vapa1 c.32.1.1 (A:23-231) Cell-division protein FtsZ {Methanococcus jannaschii [TaxId: 2190]}
+SPEDKELLEYLQQTKAKITVVGCGGAGNNTITRLKMEGIEGAKTVAINTDAQQLIRTKADKKILIGKKLTRGLGAGGNPKIGEEAAKESAEEIKAAIQDSDMVFITCGLGGGTGTGSAPVVAEISKKIGALTVAVVTLPFVMEGKVRMKNAMEGLERLKQHTDTLVVIPNEKLFEIVPNMPLKLAFKVADEVLINAVKGLVELITKDGL
+>d2vapa2 d.79.2.1 (A:232-354) Cell-division protein FtsZ {Methanococcus jannaschii [TaxId: 2190]}
+INVDFADVKAVMNNGGLAMIGIGESDSEKRAKEAVSMALNSPLLDVDIDGATGALIHVMGPEDLTLEEAREVVATVSSRLDPNATIIWGATIDENLENTVRVLLVITGVQSRIEFTDTGLKRK
+>d2vb1a1 d.2.1.2 (A:1-129) Lysozyme {Chicken (Gallus gallus) [TaxId: 9031]}
+KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL
+>d2vbua_ b.43.5.2 (A:) CTP-dependent riboflavin kinase, Rfk {Methanococcus jannaschii [TaxId: 2190]}
+VKLMIIEGEVVSGLGEGRYFLSLPPYKEIFKKILGFEPYEGTLNLKLDREFDINKFKYIETEDFEFNGKRFFGVKVLPIKILIGNKKIDGAIVVPKKTYHSSEIIEIIAPMKLREQFNLKDGDVIKILIKG
+>d2vdra_ b.69.8.1 (A:) Integrin alpha N-terminal domain {Human (Homo sapiens), isoform IIb [TaxId: 9606]}
+LNLDPVQLTFYAGPNGSQFGFSLDFHKDSHGRVAIVVGAPRTLGPSQEETGGVFLCPWRAEGGQCPSLLFDLRDETRNVGSQTLQTFKARQGLGASVVSWSDVIVACAPWQHWNVLEKTEEAEKTPVGSCFLAQPESGRRAEYSPCRGNTLSRIYVENDFSWDKRYCEAGFSSVVTQAGELVLGAPGGYYFLGLLAQAPVADIFSSYRPGILLWHVSSQSLSFDSSNPEYFDGYWGYSVAVGEFDGDLNTTEYVVGAPTWSWTLGAVEILDSYYQRLHRLRGEQMASYFGHSVAVTDVNGDGRHDLLVGAPLYMESRADRKLAEVGRVYLFLQPRGPHALGAPSLLLTGTQLYGRFGSAIAPLGDLDRDGYNDIAVAAPYGGPSGRGQVLVFLGQSEGLRSRPSQVLDSPFPTGSAFGFSLRGAVDIDDNGYPDLIVGAYGANQVAVYRAQP
+>d2vfxa_ d.135.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GMALQLSREQGITARGSAEIVAEFFSFGINSILYQRGIYPSETFTRVQKYGLTLLVTTDLELIKYLNNVVEQLKDWLYKSSVQKLVVVISNIESGEVLERWQFDIESDKTAKDDSAPREKSQKAIQDEIRSVIRQITATVTFLPLLEVSCSFDLLIYTDKDLVVPEKWEESGPQFITNSEEVRLRSFTTTIHKVNSMVAYKIPVND
+>d2vhka_ b.25.1.1 (A:) automated matches {Ketemfe (Thaumatococcus daniellii) [TaxId: 4621]}
+ATFEIVNRCSYTVWAAASKGDAALDAGGRQLNSGESWTINVEPGTNGGKIWARTDCYFDDSGSGICKTGDCGGLLRCKRFGRPPTTLAEFSLNQYGKDYIDISNIKGFNVPMNFSPTTRGCRGVRCAADIVGQCPAKLKAPGGGCNDACTVFQTSEYCCTTGKCGPTEYSRFFKRLCPDAFSYVLDKPTTVTCPGSSNYRVTFCPT
+>d2vn6b_ a.139.1.0 (B:) automated matches {Clostridium cellulolyticum [TaxId: 1521]}
+VIVYGDYNNDGNVDSTDFAGLKKYIMAADHAYVKNLDVNLDNEVNAFDLAILKKYLLGMVSKLE
+>d2vwsa_ c.1.12.0 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+MNALLSNPFKERLRKGEVQIGLWLSSTTAYMAEIAATSGYDWLLIDGEHAPNTIQDLYHQLQAVAPYASQPVIRPVEGSKPLIKQVLDIGAQTLLIPMVDTAEQARQVVSATRYPPYGERGVGASVARAARWGRIENYMAQVNDSLCLLVQVESKTALDNLDEILDVEGIDGVFIGPADLSASLGYPDNAGHPEVQRIIETSIRRIRAAGKAAGFLAVAPDMAQQCLAWGANFVAVGVDTMLYSDALDQRLAMFKS
+>d2vxna_ c.1.1.1 (A:) Triosephosphate isomerase {Trypanosome (Leishmania mexicana) [TaxId: 5665]}
+AKPQPIAAANWKCNGTTASIEKLVQVFNEHTISHDVQCVVAPTFVHIPLVQAKLRNPKYVISAQNAIAKSGAFTGEVSMPILKDIGVHWVILGHSERRTYYGETDEIVAQKVSEACKQGFMVIACIGETLQQREANQTAKVVLSQTSAIAAKLTKDAWNQVVLAYEPVWAIGTGKVATPEQAQEVHLLLRKWVSENIGTDVAAKLRILYGGSVNAANAATLYAKPDINGFLVGGASLKPEFRDIIDATR
+>d2w6ka1 c.151.1.1 (A:1-139) Cobalamin biosynthesis protein CobE {Pseudomonas aeruginosa [TaxId: 287]}
+MPLPIPSLLIAGIGCRRGCSAEHLRALLERTLGEHGRSLAELDALASIDGKRDEPGLRQLATLLERPVHFLAPAVLHDYEPRLLSPSAVALRETGCSSVAEAAALALAERLGGGRADLLGAKRSDDRASIALARLLTER
+>d2we5a_ c.73.1.1 (A:) Carbamate kinase {Enterococcus faecalis [TaxId: 1351]}
+GKKMVVALGGNAILSNDASAHAQQQALVQTSAYLVHLIKQGHRLIVSHGNGPQVGNLLLQQQAADSEKNPAMPLDTCVAMTQGSIGYWLSNALNQELNKAGIKKQVATVLTQVVVDPADEAFKNPTKPIGPFLTEAEAKEAMQAGAIFKEDAGRGWRKVVPSPKPIDIHEAETINTLIKNDIITISCGGGGIPVVGQELKGVEAVIDKDFASEKLAELVDADALVILTGVDYVCINYGKPDEKQLTNVTVAELEEYKQAGHFAPGSMLPKIEAAIQFVESQPNKQAIITSLENLGSMSGDEIVGTVVTK
+>d2wfia_ b.62.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+QRPRCFFDIAINNQPAGRVVFELFSDVCPKTCENFRCLCTGEKGTGKSTQKPLHYKSCLFHRVVKDFMVQGGDFSEGNGRGGESIYGGFFEDESFAVKHNKEFLLSMANRGKDTNGSQFFITTKPTPHLDGHHVVFGQVISGQEVVREIENQKTDAASKPFAEVRILSCGEL
+>d2wjnl_ f.26.1.1 (L:) automated matches {Rhodopseudomonas viridis [TaxId: 1079]}
+ALLSFERKYRVRGGTLIGGDLFDFWVGPYFVGFFGVSAIFFIFLGVSLIGYAASQGPTWDPFAISINPPDLKYGLGAAPLLEGGFWQAITVCALGAFISWMLREVEISRKLGIGWHVPLAFCVPIFMFCVLQVFRPLLLGSWGHAFPYGILSHLDWVNNFGYQYLNWHYNPGHMSSVSFLFVNAMALGLHGGLILSVANPGDGDKVKTAEHENQYFRDVVGYSIGALSIHRLGLFLASNIFLTGAFGTIASGPFWTRGWPEWWGWWLDIPFWS
+>d2wkxa1 a.20.1.1 (A:180-261) Probable N-acetylmuramoyl-L-alanine amidase YbjR, C-terminal domain {Escherichia coli [TaxId: 562]}
+PDAQRVNFYLAGRAPHTPVDTASLLELLARYGYDVKPDMTPREQRRVIMAFQMHFRPTLYNGEADAETQAIAEALLEKYGQD
+>d2wlva_ a.73.1.1 (A:) automated matches {Human immunodeficiency virus type 2 (isolate d194) [TaxId: 11713]}
+PVQHVGGTYTHIPLSPRTLNAWVKLVEEKKFGAEVVPGFQALSEGCTPYDINQMLNCVGDHQAAMQIIREIINEEAAEWDVQHPIPGPLPAGQLREPRGSDIAGTTSTVEEQIQWMFRPQNPVPVGNIYRRWIQIGLQKCVRMY
+>d2wnpf_ d.171.1.0 (F:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SCATGPRNCKDLLDRGYFLSGWHTIYLPDCRPLTVLCDMDTDGGGWTVFQRRMDGSVDFYRDWAAYKQGFGSQLGEFWLGNDNIHALTAQGSSELRVDLVDFEGNHQFAKYKSFKVADEAEKYKLVLGAFVGGSAGNSLTGHNNNFFSTKDQDNDVSSSNCAEKFQGAWWYADCHASNLNGLYLMGPHESFANGINWSAAKGYKYSYKVSEMKVRPA
+>d2wnvb_ b.22.1.1 (B:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+TQKIAFSATRTINVPLRRDQTIRFDHVITNMNNNYEPRSGKFTCKVPGLYYFTYHASSRGNLCVNLMRGRERAQKVVTFCDYAYNTFQVTTGGMVLKLEQGENVFLQATDKNSLLGMEGANSIFSGFLLFPDM
+>d2wqfa_ d.90.1.0 (A:) automated matches {Lactococcus lactis [TaxId: 1358]}
+SFIKSLENRRTIYALGRNVQDEEKVIETIKEAVRFSPTAFNSQTGRLLILTGDAQDKLWDEIVAPELKAAMEAQGVPESAWDNTRAKLDGFKAAFGTILFFEDQAVVKNLQEQFALYADNFPVWSEQGSGIISVNVWTALAELGLGANLQHYNPLIDEAVAKEWNLPESWKLRGQLVFGSIEAPAGEKTFMDDADRFIVAK
+>d2wqka_ c.106.1.0 (A:) automated matches {Aquifex aeolicus [TaxId: 224324]}
+PTFLLVNDDGYFSPGINALREALKSLGRVVVVAPDRNLSGVGHSLTFTEPLKMRKIDTDFYTVIDGTPADCVHLGYRVILEEKKPDLVLSGINEGPNLGEDITYSGTVSGAMEGRILGIPSIAFSAFGRENIMFEEIAKVCVDIVKKVLNEGIPEDTYLNVNIPNLRYEEIKGIKVTRQGKRAYKERVFKYIDPYGKPFYWIAAEEFGWHAEEGTDYWAVLNGYVSVTPLHLDLTNYKVMKSIKYLED
+>d2wura_ d.22.1.1 (A:) automated matches {Jellyfish (Aequorea victoria) [TaxId: 6100]}
+KGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKTRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHG
+>d2wyta_ b.1.8.1 (A:) Cu,Zn superoxide dismutase, SOD {Human (Homo sapiens) [TaxId: 9606]}
+ATKAVCVLKGDGPVQGIINFEQKESNGPVKVWGSIKGVTEGLHGFHVHEFGDNTAGCTSAGPHFNPLSRKHGGPKDEERHVGDLGNVTADKDGVADVSIEDSVISLSGDHCIIGRTLVVHEKADDLGKGGNEESTKTGNAGSRLACGVIGIAQ
+>d2wzba_ c.86.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+LSNKLTLDKLDVKGKRVVMRVDFNVPMKNNQITNNQRIKAAVPSIKFCLDNGAKSVVLMSHLGRPDGVPMPDKYSLEPVAVELKSLLGKDVLFLKDCVGPEVEKACANPAAGSVILLENLRFHVEEEGKGKDASGNKVKAEPAKIEAFRASLSKLGDVYVNDAFGTAHRAHSSMVGVNLPQKAGGFLMKKELNYFAKALESPERPFLAILGGAKVADKIQLINNMLDKVNEMIIGGGMAFTFLKVLNNMEIGTSLFDEEGAKIVKDLMSKAEKNGVKITLPVDFVTADKFDENAKTGQATVASGIPAGWMGLDCGPESSKKYAEAVTRAKQIVWNGPVGVFEWEAFARGTKALMDEVVKATSRGCITIIGGGDTATCCAKWNTEDKVSHVSTGGGASLELLEGKVLPGVDALSNI
+>d2x55a_ f.4.4.0 (A:) automated matches {Yersinia pestis [TaxId: 632]}
+QLIPNISPDSFTVAASTGMLSGKSHEMLYDAETGRKISQLDWKIKNVAILKGDISWDPYSFLTLNARGWTSLASGSGNMDDYDWMNENQSEWTDHSSHPATNVNHANEYDLNVKGWLLQDENYKAGITAGYQETRFSWTATGGSYSYNNGAYTGNFPKGVRVIGYNQRFSMPYIGLAGQYRINDFELNALFKFSDWVRAHDNDEHYMRDLTFREKTSGSRYYGTVINAGYYVTPNAKVFAEFTYSKYDEGKGGTQTIDKNSGDSVSIGGDAAGISNKNYTVTAGLQYRFG
+>d2x61a_ c.130.1.1 (A:) Alpha-2,3/8-sialyltransferase CstII {Campylobacter jejuni [TaxId: 197]}
+KKVIIAGNGPSLKEIDYSRLPNDFDVFRCNQFYFEDKYYLGKKCKAVFYNPSLFFEQYYTLKHLIQNQEYETELIMCSNYNQAHLENENFVKTFYDYFPDAHLGYDFFKQLKDFNAYFKFHEIYFNQRITSGVYMCAVAIALGYKEIYLSGIDFYQNGSSYAFDTKQKNLLKLAPNFKNDNSHYIGHSKNTDIKALEFLEKTYKIKLYCLCPNSLLANFIGLAPNLNSNFIIQEKNNYTKDILIPSSEAYGKFSKNI
+>d2xcmc_ b.15.1.0 (C:) automated matches {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+AKYRHEYYQKPEEVVVTVFAKGIPKQNVNIDFGEQILSVVIEVPGEDAYYLQPRLFGKIIPDKCKYEVLSTKIEICLAKADIITWASLEHGK
+>d2xi8a_ a.35.1.3 (A:) Putative transcription regulator CylR2 {Enterococcus faecalis [TaxId: 1351]}
+MIINNLKLIREKKKISQSELAALLEVSRQTINGIEKNKYNPSLQLALKIAYYLNTPLEDIFQWQPE
+>d2xola_ a.184.1.1 (A:) automated matches {Archaeoglobus fulgidus [TaxId: 2234]}
+GAMTIGRAKVYATLSKIFYHLFYDEAIPKDCREIIEKFGEIDFNLRSVLVRELRGSVLIKDMPQSLAEVYESVMKDFYERYGFQASELHADHIAVELAFMSKLVEREISLAQQMKEEELYKIRAAQHRFIKAHLQPLVKNLPSAPLLNFVRDFVREDAKYLYSSLVGE
+>d2xova_ f.51.1.1 (A:) GlpG {Escherichia coli [TaxId: 562]}
+ERAGPVTWVMMIACVVVFIAMQILGDQEVMLWLAWPFDPTLKFEFWRYFTHALMHFSLMHILFNLLWWWYLGGAVEKRLGSGKLIVITLISALLSGYVQQKFSGPWFGGLSGVVYALMGYVWLRGERDPQSGIYLQRGLIIFALIWIVAGWFDLFGMSMANGAHIAGLAVGLAMAFVDSLN
+>d2xw6a_ c.24.1.2 (A:) automated matches {Thermus sp. [TaxId: 405418]}
+SHMRALALIAHDAKKEEMVAFCQRHREVLARFPLVATGTTGRRIEEATGLTVEKLLSGPLGGDQQMGARVAEGRILAVIFFRDPLTAQPHEPDVQALLRVCDVHGVPLATNPMAAEALIPWLQSLVGYQT
+>d2y0ta_ a.274.1.1 (A:) automated matches {Archaeoglobus fulgidus [TaxId: 2234]}
+TITRPIIELSNTFDKIAEGNLEAEVPHQNRADEIGILAKSIERLRRSLKVAM
+>d2y5fl_ g.3.11.1 (L:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+KLCSLDNGDCDQFCHEEQNSVVCSCARGYTLADNGKACIPTGPYPCGKQTLERR
+>d2y71a_ c.23.13.1 (A:) Type II 3-dehydroquinate dehydratase {Mycobacterium tuberculosis [TaxId: 1773]}
+LIVNVINGPNLGRLGRREPAVYGGTTHDELVALIEREAAELGLKAVVRQSDSEAQLLDWIHQAADAAEPVILNAGGLTHTSVALRDACAELSAPLIEVHISNVHAREEFRRHSYLSPIATGVIVGLGIQGYLLALRYLAEH
+>d2ykza_ a.24.3.2 (A:) automated matches {Achromobacter xylosoxidans [TaxId: 85698]}
+EFAKPEDAVKYRQSALTLMASHFGRMTPVVKGQAPYDAVQIKANVEVLKTLSALPWAAFGPGTEGGDARPEIWSDAASFKQKQQAFQDNIVKLSAAADAGDLDKLRAAFGDVGASCKACHDAYRKKK
+>d2ylba_ b.38.1.2 (A:) automated matches {Salmonella enterica [TaxId: 99287]}
+SLQDPFLNALRRERVPVSIYLVNGIKLQGQIESFDQFVILLKNTVSQMVYKHAISTVVPSRPVSH
+>d2z16a_ a.95.1.1 (A:) automated matches {Influenza A virus [TaxId: 11320]}
+SSGMSLLTEVETYVLSIIPSGPLKAEIAQKLEDVFAGKNTDLEALMEWLKTRPILSPLTKGILGFVFTLTVPSERGLQRRRFVQNALNGNGDPNNMDRAVKLYKKLKREITFHGAKEVALSYSTGALASCMGLIYNRMGTVTTEVAFGLVCATCEQIADSQ
+>d2z6ra_ c.90.1.1 (A:) Diphthine synthase, DphB {Pyrococcus horikoshii [TaxId: 53953]}
+VLYFIGLGLYDERDITVKGLEIAKKCDYVFAEFYTSLMAGTTLGRIQRLIGKEIRVLSREDVELNFENIVLPLAKENDVAFLTPGDPLVATTHAELRIRAKRAGVESYVIHAPSIYSAVGITGLHIYKFGKSATVAYPEGNWFPTSYYDVIKENAERGLHTLLFLDIKAEKRMYMTANEAMELLLKVEDMKKGGVFTDDTLVVVLARAGSLNPTIRAGYVKDLIREDFGDPPHILIVPGKLHIVEAEYLVEIAGAPREILRVNV
+>d2za4b_ c.9.1.1 (B:) automated matches {Bacillus amyloliquefaciens [TaxId: 1390]}
+MKKAVINGEQIRSISDLHQTLKKELALPEYYGENLDALWAALTGWVEYPLVLEWRQFEQSKQLTENGAESVLQVFREAKAEGADITIILS
+>d2zcwa2 b.82.3.2 (A:5-116) Transcriptional regulator TTHA1359, N-terminal domain {Thermus thermophilus [TaxId: 274]}
+ETVSFKAGDVILYPGVPGPRDRAYRVLEGLVRLEAVDEEGNALTLRLVRPGGFFGEEALFGQERIYFAEAATDVRLEPLPENPDPELLKDLAQHLSQGLAEAYRRIERLATQ
+>d2zhja_ a.65.1.1 (A:) automated matches {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ETKGGTVKAASGFNATEDAQVLRKAMKGLGTDEDAIIGVLACRNTAQRQEIRTAYKSTIGRDLLEDLKSELSSNFEQVILGMMTPTVLYDVQELRRAMKGAGTDEGCLIEILASRNPEEIRRINQTYQQQYGRSLEEDICSDTSFMFQRVLVSLTAGGRDEGNYLDDALVKQDAQDLYEAGEKRWGTDEVKFLSILCSRNRNHLLHVFDEYKRISQKDIEQSIKSETSGSFEDALLAIVKCMRNKPAYFAERLYKSMKGLGTDDSTLIRVMVSRAEIDMLDIRANFKRLYGKSLYSFIKGDTSGDYRKVLLILCG
+>d2zkoa_ a.16.1.1 (A:) automated matches {Influenza A virus [TaxId: 11320]}
+MDPNTVSSFQVDCFLWHVRKRVADQELGDAPFLDRLRRDQKSLRGRGSTLGLDIETATRAGKQIVERILK
+>d2zw2a_ d.284.1.0 (A:) automated matches {Sulfolobus tokodaii [TaxId: 111955]}
+MLYRVELIITNKEGVRDPEGETIQRYVVSRFSDKIIETRAGKYLVFRVNSSSQQEATELVKKLADEMRLYNPIVHKIEIRANRIE
+>d3a02a_ a.4.1.1 (A:) automated matches {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+TFTSFQLEELEKAFSRTHYPDVFTREELAMKIGLTEARIQVWFQNRRAKWR
+>d3a38a_ g.35.1.1 (A:) HIPIP (high potential iron protein) {Thermochromatium tepidum [TaxId: 1050]}
+AAPANAVTADDPTAIALKYNQDATKSERVAAARPGLPPEEQHCANCQFMQANVGEGDWKGCQLFPGKLINVNGWCASWTLKAG
+>d3a4ra_ d.15.1.0 (A:) automated matches {Mouse (Mus musculus) [TaxId: 10090]}
+GPLGSQELRLRVQGKEKHQMLEISLSPDSPLKVLMSHYEEAMGLSGHKLSFFFDGTKLSGKELPADLGLESGDLIEVWG
+>d3a8ga_ d.149.1.1 (A:) automated matches {Rhodococcus erythropolis [TaxId: 1833]}
+ENAAPAQAPVSDRAWALFRALDGKGLVPDGYVEGWKKTFEEDFSPRRGAELVARAWTDPEFRQLLLTDGTAAVAQYGYLGPQGEYIVAVEDTPTLKNVIVCSLCACTAWPILGLPPTWYKSFEYRARVVREPRKVLSEMGTEIASDIEIRVYDTTAETRYMVLPQRPAGTEGWSQEQLQEIVTKDCLIGVAIPQVPT
+>d3aa0a_ e.43.1.1 (A:) automated matches {Chicken (Gallus gallus) [TaxId: 9031]}
+RVSDEEKVRIAAKFITHAPPGEFNEVFNDVRLLLNNDNLLREGAAHAFAQYNMDQFTPVKIEGYDDQVLITEHGDLGNGRFLDPRNKISFKFDHLRKEASDPQPEDTESALKQWRDACDSALRAYVKDHYPNGFCTVYGKSIDGQQTIIACIESHQFQPKNFWNGRWRSEWKFTITPPTAQVAAVLKIQVHYYEDGNVQLVSHKDIQDSVQVSSDVQTAKEFIKIIENAENEYQTAISENYQTMSDTTFKALRRQLPVTRTKIDWNKILS
+>d3ag3a_ f.24.1.1 (A:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+MFINRWLFSTNHKDIGTLYLLFGAWAGMVGTALSLLIRAELGQPGTLLGDDQIYNVVVTAHAFVMIFFMVMPIMIGGFGNWLVPLMIGAPDMAFPRMNNMSFWLLPPSFLLLLASSMVEAGAGTGWTVYPPLAGNLAHAGASVDLTIFSLHLAGVSSILGAINFITTIINMKPPAMSQYQTPLFVWSVMITAVLLLLSLPVLAAGITMLLTDRNLNTTFFDPAGGGDPILYQHLFWFFGHPEVYILILPGFGMISHIVTYYSGKKEPFGYMGMVWAMMSIGFLGFIVWAHHMFTVGMDVDTRAYFTSATMIIAIPTGVKVFSWLATLHGGNIKWSPAMMWALGFIFLFTVGGLTGIVLANSSLDIVLHDTYYVVAHFHYVLSMGAVFAIMGGFVHWFPLFSGYTLNDTWAKIHFAIMFVGVNMTFFPQHFLGLSGMPRRYSDYPDAYTMWNTISSMGSFISLTAVMLMVFIIWEAFASKREVLTVDLTTTNLEWLNGCPPPYHTFEEPTYVNLK
+>d3ag3c_ f.25.1.1 (C:) Mitochondrial cytochrome c oxidase, subunit III {Cow (Bos taurus) [TaxId: 9913]}
+HQTHAYHMVNPSPWPLTGALSALLMTSGLTMWFHFNSMTLLMIGLTTNMLTMYQWWRDVIRESTFQGHHTPAVQKGLRYGMILFIISEVLFFTGFFWAFYHSSLAPTPELGGCWPPTGIHPLNPLEVPLLNTSVLLASGVSITWAHHSLMEGDRKHMLQALFITITLGVYFTLLQASEYYEAPFTISDGVYGSTFFVATGFHGLHVIIGSTFLIVCFFRQLKFHFTSNHHFGFEAAAWYWHFVDVVWLFLYVSIYWWGS
+>d3ag3d_ f.23.1.1 (D:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+SVVKSEDYALPSYVDRRDYPLPDVAHVKNLSASQKALKEKEKASWSSLSIDEKVELYRLKFKESFAEMNRSTNEWKTVVGAAMFFIGFTALLLIWEKHYVYGPIPHTFEEEWVAKQTKRMLDMKVAPIQGFSAKWDYDKNEWKK
+>d3ag3e_ a.118.11.1 (E:) Cytochrome c oxidase subunit E {Cow (Bos taurus) [TaxId: 9913]}
+HETDEEFDARWVTYFNKPDIDAWELRKGMNTLVGYDLVPEPKIIDAALRACRRLNDFASAVRILEVVKDKAGPHKEIYPYVIQELRPTLNELGISTPEELGLDKV
+>d3ag3g_ f.23.2.1 (G:) Mitochondrial cytochrome c oxidase subunit VIa {Cow (Bos taurus) [TaxId: 9913]}
+ASAAKGDHGGTGARTWRFLTFGLALPSVALCTLNSWLHSGHRERPAFIPYHHLRIRTKPFSWGDGNHTFFHNPRVNPLPTGYEK
+>d3ag3h_ a.51.1.1 (H:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+KIKNYQTAPFDSRFPNQNQTRNCWQNYLDFHRCEKAMTAKGGDVSVCEWYRRVYKSLCPISWVSTWDDRRAEGTFPGKI
+>d3ag3i_ f.23.3.1 (I:) Mitochondrial cytochrome c oxidase subunit VIc {Cow (Bos taurus) [TaxId: 9913]}
+STALAKPQMRGLLARRLRFHIVGAFMVSLGFATFYKFAVAEKRKKAYADFYRNYDSMKDFEEMRKAGIFQSAK
+>d3ag3j_ f.23.4.1 (J:) Mitochondrial cytochrome c oxidase subunit VIIa {Cow (Bos taurus) [TaxId: 9913]}
+FENRVAEKQKLFQEDNGLPVHLKGGATDNILYRVTMTLCLGGTLYSLYCLGWASFPHK
+>d3ag3k_ f.23.5.1 (K:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+APDFHDKYGNAVLASGATFCVAVWVYMATQIGIEWNPSPVGRVTPKEWR
+>d3ag3l_ f.23.6.1 (L:) Mitochondrial cytochrome c oxidase subunit VIIc (aka VIIIa) {Cow (Bos taurus) [TaxId: 9913]}
+HYEEGPGKNIPFSVENKWRLLAMMTLFFGSGFAAPFFIVRHQLLKK
+>d3ag3m_ f.23.7.1 (M:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+ITAKPAKTPTSPKEQAIGLSVTFLSFLLPAGWVLYHLDNYKKS
+>d3agna_ d.1.1.4 (A:) RNase U2 {Ustilago sphaerogena [TaxId: 5271]}
+CDIPQSTNCGGNVYSNDDINTAIQGALDDVANGDRPDNYPHQYYDEASEDITLCCGSGPWSEFPLVYNGPYYSSRDNYVSPGPDRVIYQTNTGEFCATVTHTGAASYDGFTQCS
+>d3amra_ b.68.3.1 (A:) automated matches {Bacillus subtilis [TaxId: 1423]}
+LSDPYHFTVNAAAETEPVDTAGDAADDPAIWLDPKTPQNSKLITTNKKSGLVVYSLDGKMLHSYNTGKLNNVDIRYDFPLNGKKVDIAAASNRSEGKNTIEIYAIDGKNGTLQSMTDPDHPIATAINEVYGFTLYHSQKTGKYYAMVTGKEGEFEQYELKADKNGYISGKKVRAFKMNSQTEGMAADDEYGRLYIAEEDEAIWKFSAEPDGGSNGTVIDRADGRHLTRDIEGLTIYYAADGKGYLMASSQGNSSYAIYDRQGKNKYVADFRITDGPETDGTSDTDGIDVLGFGLGPEYPFGIFVAQDGENIDHGQKANQNFKIVPWERIADQIGFRPLANEQVDPRKLTDRS
+>d3arcb_ f.55.1.1 (B:) automated matches {Thermosynechococcus vulcanus [TaxId: 32053]}
+GLPWYRVHTVLINDPGRLIAAHLMHTALVAGWAGSMALYELATFDPSDPVLNPMWRQGMFVLPFMARLGVTGSWSGWSITGETGIDPGFWSFEGVALAHIVLSGLLFLAACWHWVYWDLELFRDPRTGEPALDLPKMFGIHLFLAGLLCFGFGAFHLTGLFGPGMWVSDPYGLTGSVQPVAPEWGPDGFNPYNPGGVVAHHIAAGIVGIIAGLFHILVRPPQRLYKALRMGNIETVLSSSIAAVFFAAFVVAGTMWYGSATTPIELFGPTRYQWDSSYFQQEINRRVQASLASGATLEEAWSAIPEKLAFYDYIGNNPAKGGLFRTGPMNKGDGIAQAWKGHAVFRNKEGEELFVRRMPAFFESFPVILTDKNGVVKADIPFRRAESKYSFEQQGVTVSFYGGELNGQTFTDPPTVKSYARKAIFGEIFEFDTETLNSDGIFRTSPRGWFTFAHAVFALLFFFGHIWHGARTLFRDVFSGIDPELSPEQVEWGFYQKVGDVTTR
+>d3arce_ f.23.38.1 (E:) Cytochrome b559 subunit alpha, PsbE {Thermosynechococcus vulcanus [TaxId: 32053]}
+TTGERPFSDIITSVRYWVIHSITIPALFIAGWLFVSTGLAYDVFGTPRPDSYYAQEQRSIPLVTDRFEAKQQVETFLEQLK
+>d3arch_ f.23.33.1 (H:) automated matches {Thermosynechococcus vulcanus [TaxId: 32053]}
+ARRTWLGDILRPLNSEYGKVAPGWGTTPLMAVFMGLFLVFLLIILEIYNSTLILDGVNVSWKALG
+>d3arcj_ f.23.32.1 (J:) automated matches {Thermosynechococcus vulcanus [TaxId: 32053]}
+SEGGRIPLWIVATVAGMGVIVIVGLFFYGAYAGLGSSL
+>d3arck_ f.23.36.1 (K:) Photosystem II reaction center protein K, PsbK {Thermosynechococcus vulcanus [TaxId: 32053]}
+KLPEAYAIFDPLVDVLPVIPVLFLALAFVWQAAVGFR
+>d3arcl_ f.23.31.1 (L:) automated matches {Thermosynechococcus vulcanus [TaxId: 32053]}
+MEPNPNRQPVELNRTSLYLGLLLILVLALLFSSYFFN
+>d3arcm_ f.23.35.1 (M:) Photosystem II reaction center protein M, PsbM {Thermosynechococcus vulcanus [TaxId: 32053]}
+MEVNQLGLIATALFVLVPSVFLIILYVQTESQQK
+>d3arcz_ f.17.5.1 (Z:) Photosystem II reaction center protein Z, PsbZ {Thermosynechococcus vulcanus [TaxId: 32053]}
+MTILFQLALAALVILSFVMVIGVPVAYASPQDWDRSKQLIFLGSGLWIALVLVVGVLNFFVV
+>d3b7la_ a.128.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+DVYAQEKQDFVQHFSQIVRVLTEDEMGHPEIGDAIARLKEVLEYNAIGGKYNRGLTVVVAFRELVEPRKQDADSLQRAWTVGWCVELLQAFFLVADDIMDSSLTRRGQICWYQKPGVGLDAINDANLLEACIYRLLKLYCREQPYYLNLIELFLQSSYQTEIGQTLDLLTAPQGNVDLVRFTEKRYKSIVKYKTAFYSFYLPIAAAMYMAGIDGEKEHANAKKILLEMGEFFQIQDDYLDLFGDPSVTGKIGTDIQDNKCSWLVVQCLQRATPEQYQILKENYGQKEAEKVARVKALYEELDLPAVFLQYEEDSYSHIMALIEQYAAPLPPAVFLGLARKIYK
+>d3b7sa2 b.98.1.1 (A:1-208) Leukotriene A4 hydrolase N-terminal domain {Human (Homo sapiens) [TaxId: 9606]}
+PEIVDTCSLASPASVCRTKHLHLRCSVDFTRRTLTGTAALTVQSQEDNLRSLVLDTKDLTIEKVVINGQEVKYALGERQSYKGSPMEISLPIALSKNQEIVIEISFETSPKSSALQWLTPEQTSGKEHPYLFSQCQAIHCRAILPCQDTPSVKLTYTAEVSVPKELVALMSAIRDGETPDPEDPSRKIYKFIQKVPIPCYLIALVVGA
+>d3b8oa1 d.58.60.1 (A:55-319) Lipopolysaccharide biosynthesis protein WzzE {Escherichia coli [TaxId: 562]}
+EWSSTAITDRPTVNMLGGYYSQQQFLRNLDVRSNMASADQPSVMDEAYKEFVMQLASWDTRREFWLQTDYYKQRMVGNSKADAALLDEMINNIQFIPGDFTRAVNDSVKLIAETAPDANNLLRQYVAFASQRAASHLNDELKGAWAARTIQMKAQVKRQEEVAKAIYDRRMNSIEQALKIAEQHNISRSATDVPAEELPDSEMFLLGRPMLQARLENLQAVGPAFDLDYDQNRAMLNTLNVGPTLDPRFQTYRYLRTPEEPVKRD
+>d3bbba_ d.58.6.1 (A:) Nucleoside diphosphate kinase, NDK {Human (Homo sapiens) [TaxId: 9606]}
+ANLERTFIAIKPDGVQRGLVGEIIKRFEQKGFRLVAMKFLRASEEHLKQHYIDLKDRPFFPGLVKYMNSGPVVAMVWEGLNVVKTGRVMLGETNPADSKPGTIRGDFCIQVGRNIIHGSDSVKSAEKEISLWFKPEELVDYKSCAHDWVYE
+>d3beca1 b.105.1.1 (A:263-355) Penicillin-binding protein 5, C-terminal domain {Escherichia coli [TaxId: 562]}
+FETVNPLKVGKEFASEPVWFGDSDRASLGVDKDVYLTIPRGRMKDLKASYVLNSSELHAPLQKNQVVGTINFQLDGKTIEQRPLVVLQEIPEG
+>d3bgea1 a.80.1.2 (A:251-434) Uncharacterized protein NTHI1458 {Haemophilus influenzae [TaxId: 727]}
+GDRFYDLISALHKSVRGSAPDAALYWYARILTAGGDPLYVARRLLAIASEDVGNADPRAMQVALAAWDCFTRVGAYEGERAIAQAIIYLSVAPKSNAVYTAFNTAKQQAKDLPDYDVPPHLRNAPTNLMKELGYGAEYRYAHDEPNAYAAGENYFPPELKDTQYYFPTNRGMEIQIKEKLERLR
+>d3bhpa_ a.2.21.1 (A:) automated matches {Bacillus subtilis [TaxId: 1423]}
+MISNAKIARINELAAKAKAGVITEEEKAEQQKLRQEYLKGFRSSMKNTLKSV
+>d3bi1a1 a.48.2.1 (A:594-750) Glutamate carboxypeptidase II {Human (Homo sapiens) [TaxId: 9606]}
+PFDCRDYAVVLRKYADKIYSISMKHPQEMKTYSVSFDSLFSAVKNFTEIASKFSERLQDFDKSNPIVLRMMNDQLMFLERAFIDPLGLPDRPFYRHVIYAPSSHNKYAGESFPGIYDALFDIESKVDPSKAWGEVKRQIYVAAFTVQAAAETLSEVA
+>d3bi1a2 c.8.4.1 (A:118-350) Glutamate carboxypeptidase II {Human (Homo sapiens) [TaxId: 9606]}
+SYPNKTHPNYISIINEDGNEIFNTSLFEPPPPGYENVSDIVPPFSAFSPQGMPEGDLVYVNYARTEDFFKLERDMKINCSGKIVIARYGKVFRGNKVKNAQLAGAKGVILYSDPADYFAPGVKSYPDGWNLPGGGVQRGNILNLNGAGDPLTPGYPANEYAYRRGIAEAVGLPSIPVHPIGYYDAQKLLEKMGGSAPPDSSWRGSLKVPYNVGPGFTGNFSTQKVKMHIHSTN
+>d3blda_ c.1.20.1 (A:) Queosine tRNA-guanine transglycosylase {Zymomonas mobilis [TaxId: 542]}
+RPRFSFSIAAREGKARTGTIEMKRGVIRTPAFMPVGTAATVKALKPETVRATGADIILGNTYHLMLRPGAERIAKLGGLHSFMGWDRPILTDSGGFQVMSLSSLTKQSEEGVTFKSHLDGSRHMLSPERSIEIQHLLGSDIVMAFDECTPYPATPSRAASSMERSMRWAKRSRDAFDSRKEQAENAALFGIQQGSVFENLRQQSADALAEIGFDGYAVGGLAGGEGQDEMFRVLDFSVPMLPDDKPHYLMGVGKPDDIVGAVERGIDMFDCVLPTRSGRNGQAFTWDGPINIRNARFSEDLKPLDSECHCAVCQKWSRAYIHHLIRAGEILGAMLMTEHNIAFYQQLMQKIRDSISEGRFSQFAQDFRARYF
+>d3bn0a1 d.27.1.1 (A:2-102) Ribosomal protein S16 {Aquifex aeolicus [TaxId: 63363]}
+AVRIRLAKFGRKHHPIYRIVVMDAKSPREGKYIDILGTYDPKRKVLINVYPEKVKEWVLKGVELSHRAKAILWNHGILKEVVPEGYEMKRVGDYYVFEKRE
+>d3bnea1 a.119.1.1 (A:150-839) Lipoxigenase, C-terminal domain {Soybean (Glycine max), isozyme L1 [TaxId: 3847]}
+VPSETPAPLVEYREEELKSLRGNGTGERKEYDRIYDYDVYNDLGNPDKSEKLARPVLGGSSTFPYPRRGRTGRGPTVTDPNTEKQGEVFYVPRDENLGHLKSKDALEIGTKSLSQIVQPAFESAFDLKSTPIEFHSFQDVHDLYEGGIKLPRDVISTIIPLPVIKELYRTDGQHILKFPQPHVVQVSQSAWMTDEEFAREMIAGVNPCVIRGLEEFPPKSNLDPAIYGDQSSKITADSLDLDGYTMDEALGSRRLFMLDYHDIFMPYVRQINQLNSAKTYATRTILFLREDGTLKPVAIELSLPHSAGDLSAAVSQVVLPAKEGVESTIWLLAKAYVIVNDSCYHQLMSHWLNTHAAMEPFVIATHRHLSVLHPIYKLLTPHYRNNMNINALARQSLINANGIAETTFLPSKYSVEMSSAVYKNWVFTDQALPADLIKRGVAIKDPSTPHGVRLLIEDYPYAADGLEIWAAIKTWVQEYVPLYYARDDDVKNDSELQHWWKEAVEKGHGDLKDKPWWPKLQTLEDLVEVCLIIIWIASALHAAVNFGQYPYGGLIMNRPTASRRLLPEKGTPEYEEMINNHEKAYLRTITSKLPTLISLSVIEILSTHASDEVYLGQRDNPHWTSDSKALQAFQKFGNKLKEIEEKLVRRNNDPSLQGNRLGPVQLPYTLLYPSSEEGLTFRGIPNSISI
+>d3bnea2 b.12.1.1 (A:7-149) Plant lipoxigenase {Soybean (Glycine max), isozyme L1 [TaxId: 3847]}
+KIKGTVVLMPKNELEVNPDGSAVDNLNAFLGRSVSLQLISATKADAHGKGKVGKDTFLEGINTSLPTLGAGESAFNIHFEWDGSMGIPGAFYIKNYMQVEFFLKSLTLEAISNQGTIRFVCNSWVYNTKLYKSVRIFFANHTY
+>d3boea_ c.154.1.1 (A:) Cadmium-specific carbonic anhydrase CdCA1 {Thalassiosira weissflogii [TaxId: 67004]}
+ISPAQIAEALQGRGWDAEIVTDASMAGQLVDVRPEGILKCVDGRGSDNTRMGGPKMPGGIYAIAHNRGVTSIEGLKQITKEVASKGHLPSVHGDHSSDMLGCGFFKLWVTGRFDDMGYPRPQFDADQGANAVKDAGGIIEMHHGSHTEKVVYINLLANKTLEPNENDQRFIVDGWAADKFGLDVPKFLIAAAATVEMLGGPKNAKIVVP
+>d3bofa2 c.1.26.1 (A:1-300) Cobalamin-dependent methionine synthase MetH, N-terminal domain {Thermotoga maritima [TaxId: 2336]}
+MRNRREVSKLLSERVLLLDGAYGTEFMKYGYDDLPEELNIKAPDVVLKVHRSYIESGSDVILTNTFGATRMKLRKHGLEDKLDPIVRNAVRIARRAAGEKLVFGDIGPTGELPYPLGSTLFEEFYENFRETVEIMVEEGVDGIIFETFSDILELKAAVLAAREVSRDVFLIAHMTFDEKGRSLTGTDPANFAITFDELDIDALGINCSLGPEEILPIFQELSQYTDKFLVVEPNAGKPIVENGKTVYPLKPHDFAVHIDSYYELGVNIFGGCCGTTPEHVKLFRKVLGNRKPLQRKKKRI
+>d3bp3a_ d.95.1.1 (A:) Glucose permease domain IIB {Escherichia coli [TaxId: 562]}
+TGTSEMAPALVAAFGGKENITNLDACITRLRVSVADVSKVDQAGLKKLGAAGVVVAGSGVQAIFGTKSDNLKTEMDEYIRN
+>d3bqoa_ a.146.1.1 (A:) TRF1 {Human (Homo sapiens) [TaxId: 9606]}
+EDAGLVAEAEAVAAGWMLDFLCLSLCRAFRDGRSEDFRRTRNSAEAIIHGLSSLTACQLRTIYICQFLTRIAAGKTLDAQFENDERITPLESALMIWGSIEKEHDKLHEEIQNLIKIQAIAVCMENGNFKEAEEVFERIFGDPNSHMPFKSKLLMIISQKDTFHSFFQHFSYNHMMEKIKSYVNYVLSEKSSTFLMKAAAKVVESKR
+>d3brda3 b.42.7.1 (A:381-541) DNA-binding protein LAG-1 (CSL) {Nematode (Caenorhabditis elegans) [TaxId: 6239]}
+CKYLCIASGTKVALFNRLRSQTVSTRYLHVEGNAFHASSTKWGAFTIHLFDDERGLQETDNFAVRDGFVYYGSVVKLVDSVTGIALPRLRIRKVDKQQVILDASCSEEPVSQLHKCAFQMIDNELVYLCLSHDKIIQHQATAINEHRHQINDGAAWTIIST
+>d3bula1 a.46.1.1 (A:651-740) Methionine synthase domain {Escherichia coli [TaxId: 562]}
+QAEWRSWEVNKRLEYSLVKGITEFIEQDTEEARQQATRPCEVIEGPLMDGMNVVGDLFGEGKMFLPQVVKSARVMKQAVAYLEPFIEASK
+>d3buxb2 a.48.1.1 (B:48-177) N-terminal domain of cbl (N-cbl) {Human (Homo sapiens) [TaxId: 9606]}
+PGTVDKKMVEKCWKLMDKVVRLCQNPKLALKNSPPYILDLLPDTYQHLRTILSRYEGKMETLGENEYFRVFMENLMKKTKQTISLFKEGKERMYEENSQPRRNLTKLSLIFSHMLAELKGIFPSGLFQGD
+>d3bvua1 a.8.3.1 (A:412-522) Golgi alpha-mannosidase II {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+DNYWSGYYTSRPYHKRMDRVLMHYVRAAEMLSAWHSWDGMARIEERLEQARRELSLFQHHDGITGTAKTHVVVDYEQRMQEALKACQMVMQQSVYRLLTKPSIYSPDFSFS
+>d3bvua2 b.30.5.6 (A:523-1044) Golgi alpha-mannosidase II {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+YFTLDDSRWPGSGVEDSRTTIILGEDILPSKHVVMHNTLPHWREQLVDFYVSSPFVSVTDLANNPVEAQVSPVWSWHHDTLTKTIHPQGSTTKYRIIFKARVPPMGLATYVLTISDSKPEHTSYASNLLLRKNPTSLPLGQYPEDVKFGDPREISLRVGNGPTLAFSEQGLLKSIQLTQDSPHVPVHFKFLKYGVRSHGDRSGAYLFLPNGPASPVELGQPVVLVTKGKLESSVSVGLPSVVHQTIMRGGAPEIRNLVDIGSLDNTEIVMRLETHIDSGDIFYTDLNGLQFIKRRRLDKLPLQANYYPIPSGMFIEDANTRLTLLTGQPLGGSSLASGELEIMQDRRLASDDERGLGQGVLDNKPVLHIYRLVLEKVNNCVRPSKLHPAGYLTSAAHKASQSLLDPLDKFIFAENEWIGAQGQFGGDHPSAREDLDVSVMRRLTKSSAKTQRVGYVLHRTNLMQCGTPEEHTQKLDVCHLLPNVARCERTTLTFLQNLEHLDGMVAPEVCPMETAAYVSSHS
+>d3bwha_ d.165.1.1 (A:) automated matches {Cushaw squash (Cucurbita moschata) [TaxId: 3662]}
+NVRFDLSSATSSSYKTFIKNLREALPKDGKVYDIPVLLSTVMDSRRFILIDLVNYDGQSITAAIDVLNVYIVAYSTGTVSYFFQQVPAQAPKLLFKGTQQRTLPYTGNYENLQTAAKKLRENIELGLPALDSAITTLFHYNAEAAASALLVLIQTTSEAARFRYIELQIANNVGTKFKPSQTIISLENNWSALSKQIQIAKNKNGQFETPVILIDPQGNRVQITNVTSNVVTQNIQLLLNIGAT
+>d3bwuc1 b.1.11.1 (C:1-121) Periplasmic chaperone FimC {Escherichia coli [TaxId: 562]}
+GVALGATRVIYPAGQKQEQLAVTNNDENSTYLIQSWVENADGVKDGRFIVTPPLFAMKGKKENTLRILDATNNQLPQDRESLFWMNVKAIPSMDKSKLTENTLQLAIISRIKLYYRPAKLA
+>d3bwuc2 b.7.2.1 (C:122-205) FimC {Escherichia coli [TaxId: 562]}
+LPPDQAAEKLRFRRSANSLTLINPTPYYLTVTELNAGTRVLENALVPPMGESTVKLPSDAGSNITYRTINDYGALTPKMTGVME
+>d3bwud_ b.167.1.1 (D:) Outer membrane usher protein FimD {Escherichia coli [TaxId: 562]}
+LYFNPRFLADDPQAVADLSRFENGQELPPGTYRVDIYLNNGYMATRDVTFNTGDSEQGIVPCLTRAQLASMGLNTASVAGMNLLADDACVPLTTMVQDATAHLDVGQQRLNLTIPQAFMSN
+>d3bypa1 d.52.9.1 (A:6-87) Putative Zinc transporter CzrB {Thermus thermophilus [TaxId: 274]}
+GLPPEEVERIRAFLQERIRGRALEVHDLKTRRAGPRSFLEFHLVVRGDTPVEEAHRLCDELERALAQAFPGLQATIHVEPEG
+>d3byqa1 d.79.9.1 (A:2-192) Uncharacterized protein BB2672 {Bordetella bronchiseptica [TaxId: 518]}
+SLIEIRKRTLIVETTYHENGPAPAQPLKLAASCAVIRNPYAGRYEPDLMPFMAELRSLGTLLATELVDTLGKDNIEVYSKAAIVGVDGEMEHGAVWHEAGGWAMRSVLGEPKAMVPAVKAVATAGYRMMVPVHYIHASYVRSHFNSIEIGIQDAPRPREILFALVMGTGARVHARLGGLTKEAVSVHDGQR
+>d3bz7a1 b.34.3.1 (A:34-79) Myosin S1 fragment, N-terminal domain {Slime mold (Dictyostelium discoideum) [TaxId: 44689]}
+YIWYNPDPKERDSYECGEIVSETSDSFTFKTVDGQDRQVKKDDANQ
+>d3bzka3 a.294.1.1 (A:1-324) Transcriptional accessory factor Tex {Pseudomonas aeruginosa [TaxId: 287]}
+MDSINTRIAEELSALPSGRVQPQQVAAAVALLDEGSTVPFIARYRKEVTGSLDDTQLRMLEERLRYLRELEERRGAILASIEEQGKLTPELARDIKLADTKTRLEDLYLPYKQKRRTKGQIALEAGLGALADALFDDPTLVPESEAARFVDAEKGFADVKAVLEGAKYILMERFAEDATLLDKLRVFMKNEATLTARVVPGKEQEGAKFSDYFEHDEPLKSAPSHRALAIFRGRNEGVLSASLKVGEEAPGTLHPCEVMIAERFGLSNQGRAADKWLAEVVRWTWKVKLYTHLETDLFGELRDGAEDEAISVFARNLHDLLLAA
+>d3c0na2 f.8.1.1 (A:85-468) (Pro)aerolysin, pore-forming lobe {Aeromonas hydrophila [TaxId: 644]}
+IPTLSALDIPDGDEVDVQWRLVHDSANFIKPTSYLAHYLGYAWVGGNHSQYVGEDMDVTRDGDGWVIRGNNDGGCDGYRCGDKTAIKVSNFAYNLDPDSFKHGDVTQSDRQLVKTVVGWAVNDSDTPQSGYDVTLRGDTATNWSKTNTYGLSEKVTTKNKFKWPLVGETELSIEIAANQSWASQNGGSTTTSLSQSVRPTVPARSKIPVKIELYKADISYPYEFKADVSYDLTLSGFLRWGGNAWYTHPDNRPNWNHTFVIGPYKDKASSIRYQWDKRYIPGEVKWWDWNWTIQQNGLSTMQNNLARVLRPVRAGITGDFSAESQFAGNIEIGAPVPLAADSKVRRARSVDGAGQGLRLEIPLDAQELSGLGFNNVSLSVTPAA
+>d3c8ga1 a.285.1.1 (A:1-168) Putative transcriptional regulator YggD {Shigella flexneri [TaxId: 623]}
+MATLTEDDVLEQLDAQDNLFSFMKTAHSILLQGIRQFLPSLFVDNDEEIVEYAVKPLLAQSGPLDDIDVALRLIYALGKMDKWLYADITHFSQYWHYLNEQDETPGFADDITWDFISNVNSITRNATLYDALKAMKFADFAVWSEARFSGMVKTALTLAVTTTLKELT
+>d3c8wa1 d.347.1.1 (A:5-254) Acetoacetate decarboxylase {Legionella pneumophila [TaxId: 446]}
+LSANSLEGVIDNEFSMPAPRWLNTYPAGPYRFINREFFIIAYETDPDLLQAILPPDMELLEPVVKFEFIRMPDSTGFGDYTESGQVVPVRYKGEEGGFTISMFLDCHAPIAGGREIWGFPKKLAKPKLFVEEDTLIGILKYGSIDIAIATMGYKHRPLDAEKVLESVKKPVFLLKNIPNVDGTPLVNQLTKTYLTDITVKGAWTGPGSLELHPHALAPISNLYIKKIVSVSHFITDLTLPYGKVVADYLA
+>d3c8ya1 c.96.1.1 (A:210-574) Fe-only hydrogenase, catalytic domain {Clostridium pasteurianum [TaxId: 1501]}
+HMDRVKNALNAPEKHVIVAMAPSVRASIGELFNMGFGVDVTGKIYTALRQLGFDKIFDINFGADMTIMEEATELVQRIENNGPFPMFTSCCPGWVRQAENYYPELLNNLSSAKSPQQIFGTASKTYYPSISGLDPKNVFTVTVMPCTSKKFEADRPQMEKDGLRDIDAVITTRELAKMIKDAKIPFAKLEDSEADPAMGEYSGAGAIFGATGGVMEAALRSAKDFAENAELEDIEYKQVRGLNGIKEAEVEINNNKYNVAVINGASNLFKFMKSGMINEKQYHFIEVMACHGGCVNGGGQPHVNPKDLEKVDIKKVRASVLYNQDEHLSKRKSHENTALVKMYQNYFGKPGEGRAHEILHFKYKK
+>d3c9ua1 d.79.4.1 (A:1-137) Thiamine monophosphate kinase (ThiL) N-terminal domain {Aquifex aeolicus [TaxId: 63363]}
+MRLKELGEFGLIDLIKKTLESKVIGDDTAPVEYCSKKLLLTTDVLNEGVHFLRSYIPEAVGWKAISVNVSDVIANGGLPKWALISLNLPEDLEVSYVERFYIGVKRACEFYKCEVVGGNISKSEKIGISVFLVGETE
+>d3c9ua2 d.139.1.1 (A:138-300) Thiamine monophosphate kinase (ThiL) C-terminal domain {Aquifex aeolicus [TaxId: 63363]}
+RFVGRDGARLGDSVFVSGTLGDSRAGLELLLMEKEEYEPFELALIQRHLRPTARIDYVKHIQKYANASMDISDGLVADANHLAQRSGVKIEILSEKLPLSNELKMYCEKYGKNPIEYALFGGEDYQLLFTHPKERWNPFLDMTEIGRVEEGEGVFVDGKKVEP
+>d3ccda_ d.94.1.1 (A:) Histidine-containing phosphocarrier protein (HPr) {Escherichia coli [TaxId: 562]}
+MFEQEVTITAPNGLDTRPAAQFVKEAKGFTSEITVTSNGKSASAKSLFKLQTLGLTQGTVVTISAEGEDEQKAVEHLVKLMAELE
+>d3cdda1 b.106.1.1 (A:181-348) Baseplate protein gpP {Shewanella oneidensis [TaxId: 70863]}
+ASKTKAGVSLILGDNVKAARGRFSWRQRFSKFTIKAAGAAHGQWDSAGLPTVGGIKADVTDSEIGRYRPLIIVNEEVTTAEGAAKRGQWERQRSIGKSNMAEYTVTGWRIPQTGKLWNINTLVPVIDEIMGLDEEMLIASILFSEDDAGRLAVISVVRPDAMDIPAQI
+>d3chbd_ b.40.2.1 (D:) Cholera toxin {Vibrio cholerae [TaxId: 666]}
+TPQNITDLCAEYHNTQIHTLNDKIFSYTESLAGKREMAIITFKNGATFQVEVPGSQHIDSQKKAIERMKDTLRIAYLTEAKVEKLCVWNNKTPRAIAAISMAN
+>d3ci0k1 a.60.16.1 (K:204-274) Pseudopilin GspK {Escherichia coli [TaxId: 562]}
+QQININTLDVTQSVILEALFDPWLSPVQARALLQQRPAKGWEDVDQFLAQPLLADVDERTKKQLKTVLSVD
+>d3ci3a_ a.25.2.0 (A:) automated matches {Lactobacillus reuteri [TaxId: 1598]}
+VKIYTKNGDKGQTRIIGKQILYKNDPRVAAYGEVDELNSWVGYTKSLINSHTQVLSNELEEIQQLLFDCGHDLATPADDERHSFKFKQEQPTVWLEEKIDNYTQVVPAVKKFILPGGTQLASALHVARTITRRAERQIVQLMREEQINQDVLIFINRLSDYFFAAARYANYLEQQPDMLYRNSKDVFR
+>d3cjrb1 a.4.7.1 (B:71-137) Ribosomal protein L11, C-terminal domain {Thermus thermophilus [TaxId: 274]}
+TPPASYLIRKAAGLEKGAHKPGREKVGRITWEQVLEIAKQKMPDLNTTDLEAAARMIAGSARSMGVE
+>d3cjsb1 d.47.1.1 (B:1-70) Ribosomal protein L11, N-terminal domain {Thermus thermophilus [TaxId: 274]}
+MKKVVAVVKLQLPAGKATPAPPVGPALGQHGANIMEFVKAFNAATANMGDAIVPVEITIYADRSFTFVTK
+>d3cq1a_ d.52.8.2 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+ARNPLEAQAWALLEAVYDPELGLDVVNLGLIYDLVVEPPRAYVRMTLTTPGCPLHDSLGEAVRQALSRLPGVEEVEVEVTFEPPWTLARLSEKARRLLG
+>d3cr3a1 a.208.1.1 (A:1-192) PTS-dependent dihydroxyacetone kinase, ADP-binding subunit DhaL {Lactococcus lactis [TaxId: 1358]}
+LLTIDTTIEWLGKFNEKIQENKAYLSELDGPIGDGDHGANMARGMSETMKALEVSNFGNVSEIFKKVAMTLMSKVGGASGPLYGSAFLAMSKTAIETLDTSELIYAGLEAIQKRGKAQVGEKTMVDIWSAFLNDLQTDSASKDNLEKVVKASAGLLATKGRASYLGERSIGHIDPGTQSSAYLFETLLEVVA
+>d3ct6a1 c.54.1.2 (A:1-123) PTS-dependent dihydroxyacetone kinase, phosphotransferase subunit DhaM {Lactococcus lactis [TaxId: 1358]}
+MTYGIVIVSHSPEIASGLKKLIREVAKNISLTAIGGLENGEIGTSFDRVMNAIEENEADNLLTFFDLGSARMNLDLVSEMTDKELTIFNVPLIEGAYTASALLEAGATFEAIKEQLEKMLIEK
+>d3cu9a_ b.67.2.1 (A:) automated matches {Geobacillus stearothermophilus [TaxId: 1422]}
+VHFHPFGNVNFYEMDWSLKGDLWAHDPVIAKEGSRWYVFHTGSGIQIKTSEDGVHWENMGWVFPSLPDWYKQYVPEKDEDHLWAPDICFYNGIYYLYYSVSTFGKNTSVIGLATNQTLDPRDPDYEWKDMGPVIHSTASDNYNAIDPNVVFDQEGQPWLSFGSFWSGIQLIQLDTETMKPAAQAELLTIASRGEEPNAIEAPFIVCRNGYYYLFVSFDFCCRGIESTYKIAVGRSKDITGPYVDKNGVSMMQGGGTILDEGNDRWIGPGHCAVYFSGVSAILVNHAYDALKNGEPTLQIRPLYWDDEGWPYLSV
+>d3cwca_ c.141.1.0 (A:) automated matches {Salmonella typhimurium [TaxId: 90371]}
+AMKIVIAPDSYKESLSALEVATAIEQGFREIWPDADYLKLPLADGGEGTVEAMVEATAGRIVHVEVTGPLGHRVNAFYGLSGDARSAFIEMAAASGLEQVPPAQRDPLKTTSWGTGELIRHALDAGVEHIIIGIGGSATNDGGAGMVQALGARLRDAQGNDIAQGGIGLETLASIDISGLDKRLSACHIEVACDVTNPLTGKEGASAVFGPQKGATPEMIERLDTALTRYAHLIARDLHVDVLDLAGGGAAGGMGAALYAFCGAQLRRGIEIVTDALHLEACLADADLVITGEGRIDSQTIHGKVPIGVANIAKRYNKPVIGIAGSLTADVSVVHEHGLDAVFSVIYTICTLEDALKNASENVRMTARNVAATLKAGQQLR
+>d3czza_ b.89.1.1 (A:) automated matches {Nostoc ellipsosporum [TaxId: 45916]}
+LGKFSQTCYNSAIQGSVLTSTCERTNGGYNTSSIDLNSVIAAVDGSLKWQGSNFIEACRNTQLAGSSELAAECKTAAGQFVSTKINLDDHIANIDGTLKYE
+>d3d06a_ b.2.5.2 (A:) p53 tumor suppressor, DNA-binding domain {Human (Homo sapiens) [TaxId: 9606]}
+VPSQKTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQLWVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGNLRVEYLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRSPILTIITLEDSSGNLLGRNSFEVRVCACPGRDRRTEEEN
+>d3d36c_ a.2.12.1 (C:) automated matches {Geobacillus stearothermophilus [TaxId: 272567]}
+MKHLSDELLIESYFKAKELNLSPEFIELIEKEIQRRSLTHKI
+>d3d3ba_ a.79.1.1 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+MEPAARRRARECAVQALYSWQLSQNDIADVEYQFLAEQDVKDVDVLYFRELLAGVATNTAYLDGLMKPYLSRLLEELGQVEKAVLRIALYELSKRSDVPYKVAINEAIELAKSFGAEDSHKFVNGVLDKAAPVIRPNKK
+>d3d3ra1 b.40.14.1 (A:1-76) Hydrogenase expression/formation protein HypC {Shewanella oneidensis [TaxId: 70863]}
+MCLSIPSQVVAVDNERQSVTVDTLGVRRDVSSHLMTEPLAIGDYVLIHIGFVMNKIDRNDALQSLELYQEIVSKLE
+>d3db7a_ d.98.2.1 (A:) automated matches {Bacteroides thetaiotaomicron [TaxId: 818]}
+GADDDKPIQVTQMPQLAQQFIKQHFSDSKVALAKMESDFLYKSYEVIFTNGNKVEFDKKGNWEEVDCKHTSVPVAIIPAAIQKYVTTNYPDAKVLKIERDKKDYEVKLSNRTELKFDLKFNLIDIDN
+>d3dbya1 a.29.13.1 (A:5-125) Uncharacterized protein BCE_G9241_0798 {Bacillus cereus [TaxId: 1396]}
+NYEESALFEHQFWLKVLTDHAQFLLDALAPKEKEDIKKATYFVETFTNLLNKVRNVNLMAFSKEAEQAAKEIRAFKLNIIQKQLEGKITIHFTPTFINHMVNEVEEYIAVLEFLKKGEVPP
+>d3ddta_ g.43.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GAMGSHPMCKEHEDEKINIYCLTCEVPTCSMCKVFGIHKACEVAPLQS
+>d3dgpb_ d.295.1.0 (B:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+ARARKGALVQCDPSIKALILQIDAKMSDIVLEELDDTHLLVNPSKVEFVKHELNRLLSKNIYN
+>d3dkma_ b.34.19.1 (A:) E3 ubiquitin-protein ligase hectd1 {Human (Homo sapiens) [TaxId: 9606]}
+GRENLYFQGLKYMVPGARVTRGLDWKWRDQDGSPQGEGTVTGELHNGWIDVTWDAGGSNSYRMGAEGKFDLKLAPGYDP
+>d3dnja_ d.45.1.2 (A:) automated matches {Caulobacter vibrioides [TaxId: 155892]}
+LYRVLILNDDYTPMEFVVYVLERFFNKSREDATRIMLHVHQNGVGVCGVYTYEVAETKVAQVIDSARRHQHPLQCTMEKD
+>d3e7da_ c.23.17.1 (A:) automated matches {Brucella abortus [TaxId: 235]}
+YIRDGQAIYDRSFAIIRAEADLRHIPADLEKLAVRVIHACGMVDVANDLAFSEGAGKAGRNALLAGAPILCDARMVAEGITRSRLPADNRVIYTLSDPSVPELAKKIGNTRSAAALDLWLPHIEGSIVAIGNAPTALFRLFELLDAGAPKPALIIGMPVGFVGAAESKDELAANSRGVPYVIVRGRRGGSAMTAAAVNALAS
+>d3e9va1 d.370.1.1 (A:9-128) NGF-inducible anti-proliferative protein PC3 (BTG2) {Human (Homo sapiens) [TaxId: 9606]}
+DMLPEIAAAVGFLSSLLRTRGCVSEQRLKVFSGALQEALTEHYKHHWFPEKPSKGSGYRCIRINHKMDPIISRVASQIGLSQPQLHQLLPSELTLWVDPYEVSYRIGEDGSICVLYEEAP
+>d3eeqa2 c.152.1.1 (A:8-214) Cobalamin biosynthesis protein G, CbiG {Sulfolobus solfataricus [TaxId: 2287]}
+SLIENLWRGICIISASEDAFSAGETIKEKLKSFEIPVVHYRYKDAEIETIWKCYDAIVFVMALEGATRIVCKYAKSKTEDPAIVCIDDKINYVIPLLGGHWGANDIARELSVILNSTPIITTAAEIKGKLSIERIANILIAKIINPENIVKINAALLRDESICIDGIDVNVNFPENIKVNSEECSYIISLRGDKEYKDKIVVWLKPL
+>d3eera_ d.227.1.0 (A:) automated matches {Vibrio cholerae [TaxId: 243277]}
+MSTIYQTSATASAGRNGVVSTEDKLLELNLSYPKEMGGSGTATNPEQLFAVGYAACFSNAILHVAREAKVALKEAPVTATVGIGPNGQGGFALSVALAAHIALEDEQARQLVTVAHQVCPYSNAVRGNIDVQVSVNGLAL
+>d3eipa_ d.26.2.1 (A:) Colicin E3 immunity protein {Escherichia coli [TaxId: 562]}
+GLKLDLTWFDKSTEDFKGEEYSKDFGDDGSVMESLGVPFKDNVNNGCFDVIAEWVPLLQPYFNHQIDISDNEYFVSFDYRDGDW
+>d3eoja_ b.75.1.1 (A:) Bacteriochlorophyll A protein {Prosthecochloris aestuarii, strain 2k [TaxId: 1102]}
+DTTTAHSDYEIILEGGSSSWGQVKGRAKVNVPAAIPLLPTDCNIRIDAKPLDAQKGVVRFTTKIESVVDSVKNTLNVEVDIANETKDRRIAVGEGSLSVGDFSHSFSFEGSVVNMYYYRSDAVRRNIPNPIYMQGRQFHDILMKVPLDNNDLVDTWEGFQQSISGGGANFGDWIREFWFIGPAFAAINEGGQRISPIVVNSSNVEGGEKGPVGVTRWKFSHAGSGVVDSISRWTELFPVEQLNKPASIEGGFRSDSQGIEVKVDGNLPGVSRDAGGGLRRILNHPLIPLVHHGMVGKFNDFTVDTQLKIVLPKGYKIRYAAPQFRSQNLEEYRWSGGAYARWVEHVCKGGTGQFEVLYAQ
+>d3epwa_ c.70.1.1 (A:) automated matches {Trypanosoma vivax [TaxId: 5699]}
+AKNVVLDHDGNLDDFVAMVLLASNTEKVRLIGALCTDADCFVENGFNVTGKIMCLMHNNMNLPLFPIGKSAATAVNPFPKEWRCLAKNMDDMPILNIPENVELWDKIKAENEKYEGQQLLADLVMNSEEKVTICVTGPLSNVAWCIDKYGEKFTSKVEECVIMGGAVDVRGNVFLPSTDGTAEWNIYWDPASAKTVFGCPGLRRIMFSLDSTNTVPVRSPYVQRFGEQTNFLLSILVGTMWAMCTHCELLRDGDGYYAWDALTAAYVVDQKVANVDPVPIDVVVDKQPNEGATVRTDAENYPLTFVARNPEAEFFLDMLLRSARAC
+>d3er9b_ e.69.1.1 (B:) automated matches {Vaccinia virus wr [TaxId: 10254]}
+NITLKIIETYLGRVPSVNEYHMLKSQARNIQKITVFNKDIFVSLVKKNKKRFFSDVNTSASEIKDRILSYFSKQTQTYNIGKLFTIIELQSVLVTTYTDILGVLTIKAPNVISSKISYNVTSMEELARDMLNSMNVAVIDKAKVMGRHNVSSLVKNVNKLMEEYLRRHNKSCICYGSYSLYLINPNIRYGDIDILQTNSRTFLIDLAFLIKFITGNNIILSKIPYLRNYMVIKDENDNHIIDSFNIRQDTMNVVPKIFIDNIYIVDPTFQLLNMIKMFSQIDRLEDLSKDPEKFNARMATMLEYVRYTHGIVFDGKRNNMPMKCIIDENNRIVTVTTKDYFSFKKCLVYLDENVLSSDILDLNADTSCDFESVTNSVYLIHDNIMYTYFSNTILLSDKGKVHEISARGLCAHILLYQMLTSGEYKQCLSDLLNSMMNRDKIPIYSHTERDKKPGRHGFINIEKDIIVF
+>d3eyea_ c.38.1.0 (A:) automated matches {Escherichia coli O157:H7 [TaxId: 83334]}
+NILLTRIDNRLVHGQVGVTWTSTIGANLLVVVDDVVANDDIQQKLMGITAETYGFGIRFFTIEKTINVIGKAAPHQKIFLICRTPQTVRKLVEGGIDLKDVNVGNMHFSEGKKQISSKVYVDDQDLTDLRFIKQRGVNVFIQDVPGDQKEQIP
+>d3f6ya_ c.23.14.3 (A:) ADP ribosyl cyclase {Human (Homo sapiens) [TaxId: 9606]}
+FWRQTWSGPGTTKRFPETVLARCVKYTEIHPEMRHVDCQSVWDAFKGAFISKHPCDITEEDYQPLMKLGTQTVPCNKILLWSRIKDLAHQFTQVQRDMFTLEDTLLGYLADDLTWCGEFDTSKINYQSCPDWRKDCSNNPVSVFWKTVSRRFAEAACDVVHVMLDGSRSKIFDKDSTFGSVEVHNLQPEKVQTLEAWVIHGGREDSRDLCQDPTIKELESIISKRNIQFSCKNIY
+>d3fapb_ a.24.7.1 (B:) FKBP12-rapamycin-binding domain of FKBP-rapamycin-associated protein (FRAP) {Human (Homo sapiens) [TaxId: 9606]}
+VAILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGRDLMEAQEWCRKYMKSGNVKDLTQAWDLYYHVFRRIS
+>d3faua_ d.68.8.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SLDLHGLHVDEALEHLMRVLEKKTEEFKQNGGKPYLSVITGRGNHSQGGVARIKPAVIKYLISHSFRFSEIKPGCLKVML
+>d3fava_ a.25.3.1 (A:) automated matches {Mycobacterium tuberculosis [TaxId: 83332]}
+LAQEAGNFERISGDLKTQIDQVESTAGSLQGQWRGAAGTAAQAAVVRFQEAANKQKQELDEISTNIRQAGVQYS
+>d3feaa_ a.42.1.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+QVRPKLPLLKILHAAGAQGEMFTVKEVMHYLGQYIMVKQLYDQQEQHMVYCGGDLLGELLGRQSFSVKDPSPLYDMLRKNLVT
+>d3fila_ d.15.7.1 (A:) Immunoglobulin-binding protein G, different constituent domains {Streptococcus sp., group G [TaxId: 1306]}
+MQYKLILNGKTLKGVLTIEAVDAATAEKVFKQYANDLGVDGEWTYDDATKTFTVTE
+>d3fsoa_ b.1.27.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+MRDVVSFEQPEFSVSRGDQVARIPVIRRVLDGGKSQVSYRTQDGTAQGNRDYIPVEGELLFQPGEAWKELQVKLLELQEVDSLLRGRQVRRFHVQLSNPKFGAHLGQPHSTTIIIRDP
+>d3ft1a_ b.7.3.0 (A:) automated matches {Timothy grass (Phleum pratense) [TaxId: 15957]}
+AVQVTFTVQKGSDPKKLVLDIKYTRPGDSLAEVELRQHGSEEWEPLTKKGNVWEVKSSKPLVGPFNFRFMSKGGMRNVFDEVIPTAFSIGKTYKPEEQEF
+>d3fuca_ c.56.2.1 (A:) Purine nucleoside phosphorylase, PNP {Cow (Bos taurus) [TaxId: 9913]}
+NGYTYEDYQDTAKWLLSHTEQRPQVAVICGSGLGGLVNKLTQAQTFDYSEIPNFPESTVPGHAGRLVFGILNGRACVMMQGRFHMYEGYPFWKVTFPVRVFRLLGVETLVVTNAAGGLNPNFEVGDIMLIRDHINLPGFSGENPLRGPNEERFGVRFPAMSDAYDRDMRQKAHSTWKQMGEQRELQEGTYVMLGGPNFETVAECRLLRNLGADAVGMSTVPEVIVARHCGLRVFGFSLITNKVIMDYESQGKANHEEVLEAGKQAAQKLEQFVSLLMASIPV
+>d3fx7a_ a.25.5.1 (A:) automated matches {Helicobacter pylori [TaxId: 210]}
+QMDTEEVREFVGHLERFKELLREEVNSLSNHFHNLESWRDARRDKFSEVLDNLKSTFNEFDEAAQEQIAWLKERIRVLEEDYLE
+>d3g0ma_ d.224.1.1 (A:) automated matches {Salmonella typhimurium [TaxId: 99287]}
+MAALPDKEKLLRNFTRCANWEEKYLYIIELGQRLAELNPQDRNPQNTIHGCQSQVWIVMRRNANGIIELQGDSDAAIVKGLMAVVFILYHQMTAQDIVHFDVRPWFEKMALAQHLTPSRSQGLEAMIRAIRAKAATLS
+>d3g46a_ a.1.1.2 (A:) Hemoglobin I {Ark clam (Scapharca inaequivalvis) [TaxId: 6561]}
+PSVYDAAAQLTADVKKDLRDSWKVIGSDKKGNGVALMTTLFADNQETIGYFKRLGDVSQGMANDKLRGHSITLMYALQNFIDQLDNPDDLVCVVEKFAVNHITRKISAAEFGKINGPIKKVLASKNFGDKYANAWAKLVAVVQAAL
+>d3ge3c_ d.15.12.0 (C:) automated matches {Pseudomonas mendocina [TaxId: 300]}
+SAFPVHAAFEKDFLVQLVVVDLNDSMDQVAEKVAYHCVNRRVAPREGVMRVRKHRSTELFPRDMTIAESGLNPTEVIDVVFEE
+>d3ge3e_ d.137.1.1 (E:) Toluene-4-monooxygenase catalytic effector protein {Pseudomonas mendocina [TaxId: 300]}
+STLADQALHNNNVGPIIRAGDLVEPVIETAEIDNPGKEITVEDRRAYVRIAAEGELILTRKTLEEQLGRPFNMQELEINLASFAGQIQADEDQIRFYFDKTM
+>d3giua_ c.56.4.0 (A:) automated matches {Staphylococcus aureus [TaxId: 93062]}
+MHILVTGFAPFDNQNINPSWEAVTQLEDIIGTHTIDKLKLPTSFKKVDNIINKTLASNHYDVVLAIGQAGGRNAITPERVAINIDDARIPDNDDFQPIDQAIHLDGAPAYFSNLPVKAMTQSIINQGLPGALSNSAGTFVCNHTLYHLGYLQDKHYPHLRFGFIHVPYIPEQVIGKPDTPSMPLEKIVAGLTAAIEAISNDEDLHLALGTTE
+>d3gmxa_ d.98.1.0 (A:) automated matches {Streptomyces clavuligerus [TaxId: 1901]}
+YTGFTPERYNKIQFGMDRTLVWQLAGADQSCSDQVERIICYNNPDHYGPQGHFFFNAADKLIHKRQMELFPAPKPTMRLATYNKTQTGMTEAQFWAAVPSDTCSALAEQYPNWPATNGNLREYVCPSKAERFAPSAYFTFTDGKLTSRSQSQLP
+>d3gp6a_ f.4.1.2 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+MNADEWMTTFRENIAQTWQQPEHYDLYIPAITWHARFAYDKEKTDRYNERPWGGGFGLSRWDEKGNWHGLYAMAFKDSWNKWEPIAGYGWESTWRPLADENFHLGLGFTAGVTARDNWNYIPLPVLLPLASVGYGPVTFQMTYIPGTYNNGNVYFAWMRFQFL
+>d3grsa3 d.87.1.1 (A:364-478) Glutathione reductase {Human (Homo sapiens) [TaxId: 9606]}
+YNNIPTVVFSHPPIGTVGLTEDEAIHKYGIENVKTYSTSFTPMYHAVTKRKTKCVMKMVCANKEEKVVGIHMQGLGCDEMLQGFAVAVKMGATKADFDNTVAIHPTSSEELVTLR
+>d3h0na_ d.380.1.1 (A:) Uncharacterized protein Jann2411 {Jannaschia sp. CCS1 [TaxId: 290400]}
+MNLDSYERTGLRVSLDLVNIATPGSRRGTPHTGGCVIEDLHDLLKDDPASVAQLGDDHVEGFVELARLLHTAIDALSNGQVATAATALNHLLRKHPATPELAQDPDGTWRLHHHPLDAELVPMWTAICAEGLAREIGHQNVRRFGICNAHRCDRVYFDTSRNGTRQYCSLACQNRVKAAAFRER
+>d3h4ta_ c.87.1.5 (A:) TDP-epi-vancosaminyltransferase GtfA {Amycolatopsis orientalis [TaxId: 31958]}
+GVLITGCGSRGDTEPLVALAARLRELGADARMCLPPDYVERCAEVGVPMVPVGRAVRAGAREPGELPPGAAEVVTEVVAEWFDKVPAAIEGCDAVVTTGLLPAAVAVRSMAEKLGIPYRYTVLSPDHLPSEQSQAERDMYNQGADRLFGDAVNSHRASIGLPPVEHLYDYGYTDQPWLAADPVLSPLRPTDLGTVQTGAWILPDQRPLSAELEGFLRAGSPPVYVGFGSGPAPAEAARVAIEAVRAQGRRVVLSSGWAGLGRIDEGDDCLVVGEVNHQVLFGRVAAVVHHGGAGTTTAVTRAGAPQVVVPQKADQPYYAGRVADLGVGVAHDGPTPTVESLSAALATALTPGIRARAAAVAGTIRTDGTTVAAKLLLEAISRQRSSVPAAKLAAALE
+>d3h63a_ d.159.1.3 (A:) Serine/threonine protein phosphatase 5, PP5 {Human (Homo sapiens) [TaxId: 9606]}
+YSGPKLEDGKVTISFMKELMQWYKDQKKLHRKCAYQILVQVKEVLSKLSTLVETTLKETEKITVCGDTHGQFYDLLNIFELNGLPSETNPYIFNGDFVDRGSFSVEVILTLFGFKLLYPDHFHLLRGNHETDNMNQIYGFEGEVKAKYTAQMYELFSEVFEWLPLAQCINGKVLIMHGGLFSEDGVTLDDIRKIERNRQPPDSGPMCDLLWSDPQPQNGRSISKRGVSCQFGPDVTKAFLEENNLDYIIRSHEVKAEGYEVAHGGRCVTVFSAPNYCDQMGNKASYIHLQGSDLRPQFHQFTAVPHPNVKPMAYA
+>d3hkwa_ e.8.1.4 (A:) automated matches {Hepatitis c virus subtype 1a [TaxId: 31646]}
+SMSYSWTGALVTPCAAEEQKLPINALSNSLLRHHNMVYSTTSRSACQRQKKVTFDRLQVLDSHYQDVLKEVKAAASKVKANLLSVEEACSLTPPHSARSKFGYGAKDVRCHARKAVTHINSVWKDLLEDSVTPIDTTIMAKNEVFCVQPEKGGRKPARLIVFPDLGVRVCEKMALYDVVSKLPQAVMGSSYGFQYSPGQRVEFLVQAWKSKKSPMGFSYDTRCFDSTVTESDIRTEEAIYQCCDLDPQARVAIKSLTERLYVGGPLTNSKGENCGYRRCRASGVLTTSCGNTLTCYIKARAACRAAGLQDCTMLVCGDDLVVICESAGVQEDAASLRAFTEAMTRYSAPPGDPPQPEYDLELITSCSSNVSVAHDGAGKRVYYLTRDPTTPLARAAWETARHTPVNSWLGNIIMFAPTLWARMILMTHFFSVLIARDQLEQALDCEIYGACYSIEPLDLPPIIQRLHGLSAFSLHSYSPGEINRVAACLRKLGVPPLRAWRHRARSVRAKLLSRGGRAAICGKYLFNWAVRTKLKLTPIAAAGQLDLSGWFTAGYSGGDIYHS
+>d3hlxa_ a.132.1.4 (A:) Coenzyme PQQ synthesis protein C, PqqC {Klebsiella pneumoniae [TaxId: 272620]}
+LITDTLSPQAFEEALRAKGDFYHIHHPYHIAMHNGNATREQIQGWVANRFYYQTTIPLKDAAIMANCPDAQTRRKWVQRILDHDGSHGEDGGIEAWLRLGEAVGLSRDDLLSERHVLPGVRFAVDAYLNFARRACWQEAACSSLTELFAPQIHQSRLDSWPQHYPWIKEEGYFFFRSRLSQANRDVEHGLALAKAYCDSAEKQNRMLEILQFKLDILWSMLDAMTMAYALQRPPYHTVTDKAAWHTTRLVLEHH
+>d3hmsa_ g.10.1.1 (A:) Hepatocyte growth factor {Human (Homo sapiens) [TaxId: 9606]}
+RNTIHEFKKSAKTTLIKIDPALKIKTKKVNTADQCANRCTRNKGLPFTCKAFVFDKARKQCLWFPFNSMSSGVKKEFGHEFDLYENKDYIR
+>d3htna_ d.290.1.0 (A:) automated matches {Bacteroides thetaiotaomicron [TaxId: 226186]}
+NMYSYKKIGNKYIVSINNHTEIVKALNAFCKEKGILSGSINGIGAIGELTLRFFNPKTKAYDDKTFREQMEISNLTGNISSMNEQVYLHLHITVGRSDYSALAGHLLSAIQNGAGEFVVEDYSERISRTYNPDLGLNIYDFER
+>d3i06a_ d.3.1.1 (A:) Cruzain {Trypanosoma cruzi [TaxId: 5693]}
+APAAVDWRARGAVTAVKDQGQCGSCWAFSAIGNVECQWFLAGHPLTNLSEQMLVSCDKTDSGCSGGLMNNAFEWIVQENNGAVYTEDSYPYASGEGISPPCTTSGHTVGATITGHVELPQDEAQIAAWLAVNGPVAVAVDASSWMTYTGGVMTSCVSEQLDHGVLLVGYNDSAAVPYWIIKNSWTTQWGEEGYIRIAKGSNQCLVKEEASSAVVG
+>d3ijwa_ c.140.1.0 (A:) automated matches {Bacillus anthracis [TaxId: 198094]}
+AMNDIVASTQLPNTIKTITNDLRKLGLKKGMTVIVHSSLSSIGWISGGAVAVVEALMEVITEEGTIIMPTQSSDLSDPKHWSRPPVPEEWWQIIRDNVPAFEPHITPTRAMGKVVECFRTYPNVVRSNHPLGSFAAWGRHAEEITVNQSLSMSLGEESPLRKIYDLDGYILLIGVGYDSNTSVHLSEVRSGACELIKVGAPIIENGERVWKEFVDMDYDSDKFVEIGVEFEQKGTVTMGKIGNAKCRLMKQRDIVDFGTEWFRKK
+>d3ilwa_ e.11.1.0 (A:) automated matches {Mycobacterium tuberculosis [TaxId: 1773]}
+VGRALPEVRDGLKPVHRRVLYAMFDSGFRPDRSHAKSARSVAETMGNYHPHGDASIYDSLVRMAQPWSLRYPLVDGQGNFGSPGNDPPAAMRYTEARLTPLAMEMLREIDEETVDFIPNYDGRVQEPTVLPSRFPNLLANGSGGIAVGMATNIPPHNLRELADAVFWALENHDADEEETLAAVMGRVKGPDFPTAGLIVGSQGTADAYKTGRGSIRMRGVVEVEEDSRGRTSLVITELPYQVNHDNFITSIAEQVRDGKLAGISNIEDQSSDRVGLRIVIEIKRDAVAKVVINNLYKHTQLQTSFGANMLAIVDGVPRTLRLDQLIRYYVDHQLDVIVRRTTYRLRKANERAHILRGLVKALDALDEVIALIRASETVDIARAGLIELLDIDEIQAQAILDMQLRRLAALERQRIIDDLAKIEAEIADLEDILAKPERQRGIVRDELAEIVDRHGDDRRTRIIA
+>d3iofa_ d.157.1.1 (A:) Zn metallo-beta-lactamase {Aeromonas hydrophila, CphA [TaxId: 644]}
+AGMSLTQVSGPVYVVEDNYYVQENSMVYFGAKGVTVVGATWTPDTARELHKLIKRVSRKPVLEVINTNYHTDRAGGNAYWKSIGAKVVSTRQTRDLMKSDWAEIVAFTRKGLPEYPDLPLVLPNVVHDGDFTLQEGKVRAFYAGPAHTPDGIFVYFPDEQVLYGGCILKEKLGNLSFADVKAYPQTLERLKAMKLPIKTVIGGHDSPLHGPELIDHYEALIKAAPQS
+>d3ip0a_ d.58.30.1 (A:) 6-hydroxymethyl-7,8-dihydropterin pyrophosphokinase, HPPK {Escherichia coli [TaxId: 562]}
+TVAYIAIGSNLASPLEQVNAALKALGDIPESHILTVSSFYRTPPLGPQDQPDYLNAAVALETSLAPEELLNHTQRIELQQGRVRKAERWGPRTLDLDIMLFGNEVINTERLTVPHYDMKNRGFMLWPLFEIAPELVFPDGEMLRQILHTRAFDKLNKW
+>d3ip4c_ a.137.12.1 (C:) Glu-tRNAGln amidotransferase C subunit, GatC {Staphylococcus aureus [TaxId: 158878]}
+KVTREEVEHIANLARLQISPEETEEMANTLESILDFAKQNDSADTEGVEPTYHVLDLQNVLREDKAIKGIPQELALKNAKETEDGQFKVPTI
+>d3iqua_ a.118.7.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GAMGSMERASLIQKAKLAEQAERYEDMAAFMKGAVEKGEELSCEERNLLSVAYKNVVGGQRAAWRVLSSIEQKSNEEGSEEKGPEVREYREKVETELQGVCDTVLGLLDSHLIKEAGDAESRVFYLKMKGDYYRYLAEVATGDDKKRIIDSARSAYQEAMDISKKEMPPTNPIRLGLALNFSVFHYEIANSPEEAISLAKTTFDEAMADLHTLSEDSYKDSTLIMQLLRDNLTLWT
+>d3ivva_ b.8.1.1 (A:) Speckle-type poz protein SPOP {Human (Homo sapiens) [TaxId: 9606]}
+SGKVVKFSYMWTINNFSFCREEMGEVIKSSTFSSGANDKLKWCLRVNPKGLDEESKDYLSLYLLLVSCPKSEVRAKFKFSILNAKGEETKAMESQRAYRFVQGKDWGFKKFIRRDFLLDEANGLLPDDKLTLFCEVSVVQ
+>d3ivza_ d.160.1.2 (A:) automated matches {Pyrococcus abyssi [TaxId: 272844]}
+VKVAYVQMNPQILEPDKNYSKAEKLIKEASKQGAQLVVLPELFDTGYNFETREEVFEIAQKIPEGETTTFLMDVARDTGVYIVAGTAEKDGDVLYNSAVVVGPRGFIGKYRKIHLFYREKFFFEPGDLGFRVFDLGFMKVGVMICFDWFFPESARTLALKGADVIAHPANLVMPYAPRAMPIRALENKVYTVTADRVGEERGLKFIGKSLIASPKAEVLSMASETEEEVGVAEIDLSLVRNKRINDLNDIFKDRREEYYFR
+>d3jqka_ d.58.21.0 (A:) automated matches {Thermus thermophilus [TaxId: 300852]}
+RPRMVDVTEKPETFRTATAEAFVELTEEALSALEKGGVGKGDPLVVAQLAGILAAKKTADLIPLCHPLPLTGVEVRVELLKAEKRVRIEATVKTKAETGVEMEAMTACAVAALTVYDMLKAASKGLVISQVRLLHKAGGKSGEWRR
+>d3k34a_ b.74.1.1 (A:) Carbonic anhydrase {Human (Homo sapiens), erythrocytes, isozyme II [TaxId: 9606]}
+HHWGYGKHNGPEHWHKDFPIAKGERQSPVDIDTHTAKYDPSLKPLSVSYDQATSLRILNNGHAFNVEFDDSQDKAVLKGGPLDGTYRLIQFHFHWGSLDGQGSEHTVDKKKYAAELHLVHWNTKYGDFGKAVQQPDGLAVLGIFLKVGSAKPGLQKVVDVLDSIKTKGKSADFTNFDPRGLLPESLDYWTYPGSLTTPPLLECVTWIVLKEPISVSSEQVLKFRKLNFNGEGEPEELMVDNWRPAQPLKNRQIKASFK
+>d3k67a_ d.38.1.4 (A:) Hypothetical protein AF1124 {Archaeoglobus fulgidus [TaxId: 2234]}
+GEVKMMSLLEEMKGIYSKKGGKVKPFEKFEGELKEGYRFEYEKKLCEIDVAMFGLISGDLNPVHFDEDFASKTRFGGRVVHGMLTTSLVSAAVARLPGTVVLLEQSFRYTSPVRIGDVVRVEGVVSGVEKNRYTIDVKCYTGDKVVAEGVVKVLIW
+>d3k7pa_ c.121.1.0 (A:) automated matches {Trypanosoma cruzi [TaxId: 353153]}
+MTRRVAIGTDHPAFAIHENLILYVKEAGDEFVPVYCGPKTAESVDYPDFASRVAEMVARKEVEFGVLAAGSGIGMSIAANKVPGVRAALCHDHYTAAMSRIHNDANIVCVGERTTGVEVIREIIITFLQTPFSGEERHVRRIEKIRAIEASHA
+>d3kana_ d.80.1.3 (A:) D-dopachrome tautomerase {Human (Homo sapiens) [TaxId: 9606]}
+PFLELDTNLPANRVPAGLEKRLCAAAASILGKPADRVNVTVRPGLAMALSGSTEPCAQLSISSIGVVGTAEDNRSHSAHFFEFLTKELALGQDRILIRFFPLESWQIGKIGTVMTFL
+>d3ki3a_ d.166.1.0 (A:) automated matches {Vibrio cholerae [TaxId: 666]}
+MAVITPQGVTNWTYQELEATHQALTREGYVFVGYHGTNHVAAQTIVNRIAPVPRGNNTENEEKWGGLYVATHAEVAHGYARIKEGTGEYGLPTRAERDARGVMLRVYIPRASLERFYRTNTPLENAEEHITQVIGHSLPLRNEAFTGPESAGGEDETVIGWDMAIHAVAIPSTIPGNAYEELAIDEEAVAKEQSISTKPPYKERKDEL
+>d3klra_ b.84.1.0 (A:) automated matches {Cow (Bos taurus) [TaxId: 9913]}
+SVRKFTEKHEWVTTENGVGTVGISNFAQEALGDVVYCSLPEVGTKLNKQEEFGALESVKAASELYSPLSGEVTEINKALAENPGLVNKSCYEDGWLIKMTFSNPSELDELMSEEAYEKYIKSIEE
+>d3ksna_ b.125.1.1 (A:) Outer-membrane lipoproteins carrier protein LolA {Escherichia coli [TaxId: 562]}
+DAASDLKSRLDKVSSFHASFTQKVTDGSGAAVQEGQGDLWVKRPNLFNWHMTQPDESILVSDGKTLWFYNPFVEQATATWLKDATGNTPFMLIARNQSSDWQQYNIKQNGDDFVLTPKASNGNLKQFTINVGRDGTIHQFSAVEQDDQRSSYQLKSQQNGAVDAAKFTFTPPQGVTVDDQRK
+>d3ku3a_ b.19.1.2 (A:) Hemagglutinin {Influenza A virus, different strains [TaxId: 11320]}
+PGDQICIGYHANNSTEKVDTILERNVTVTHAKDILEKTHNGKLCKLNGIPPLELGDCSIAGWLLGNPECDRLLSVPEWSYIMEKENPRDGLCYPGSFNDYEELKHLLSSVKHFEKVKILPKDRWTQHTTTGGSRACAVSGNPSFFRNMVWLTEKGSNYPVAKGSYNNTSGEQMLIIWGVHHPNDETEQRTLYQNVGTYVSVGTSTLNKRSTPEIATRPKVNGQGGRMEFSWTLLDMWDTINFESTGNLIAPEYGFKISKRGSSGIMKTEGTLENCETKCQTPLGAINTTLPFHNVHPLTIGECPKYVKSEKLVLATGLRNVPQI
+>d3kxsa_ a.62.1.1 (A:) automated matches {Hepatitis b virus [TaxId: 10419]}
+MDIDPYKEFGATVELLSFLPSDFFPSVRDLLDTAAALYRDALESPEHCSPHHTALRQAILCWGDLMTLATWVGTNLEDPASRDLVVSYVNTNVGLKFRQLLWFHISCLTFGRETVLEYLVSFGVWIRTPPAARPPNAPIL
+>d3l51b_ d.215.1.0 (B:) automated matches {Mouse (Mus musculus) [TaxId: 10090]}
+GKVLDAIIQEKKSGRIPGIYGRLGDLGAIDEKYDIAISSCCHALDYIVVDSIDTAQECVNFLKKHNIGIATFIGLDKMTVWAKKMSKIQTPENTPRLFDLVKVKNEEIRQAFYFALRDTLVANNLDQATRVAYQRDRRWRVVTLQGQIIEQSGTMSGGLEHHHHHH
+>d3l5oa_ c.67.3.1 (A:) Hypothetical protein Dhaf_3308 {Desulfitobacterium hafniense [TaxId: 49338]}
+FQGMWEIYDAMINGIPEDFLVDELVCGTTHSVIRSGNGVGLGPNRPFETRMPMLTQNLLGLPLRVAAGCVKSWNYVEASIGLAAINAYYNNPQVAREHGVIFSDAKRVEDRMNDPFIMSQNEVKGKKVGVVGHFPHLESLLEPICDLSILEWSPEEGDYPLPASEFILPECDYVYITCASVVDKTLPRLLELSRNARRITLVGPGTPLAPVLFEHGLQELSGFMVKDNARAFRIVAGAEKVKIYSAGQKVTIKK
+>d3lasa_ c.53.2.0 (A:) automated matches {Streptococcus mutans [TaxId: 1309]}
+MVMSYFDNFIKANQAYVDLHGTAHLPLKPKTRVAIVTCMDSRLHVAPALGLALGDAHILRNAGGRVTDDVIRSLVISEQQLGTSEIVVLHHTDCGAQTFTNAEFTEQLKRDLAVDAGDQDFLPFTDIEESVREDIALLKNSPLIPEDIIISGAIYDVDTGRVREVN
+>d3ldqb_ a.7.7.1 (B:) BAG-family molecular chaperon regulator-1, BAG1 {Human (Homo sapiens) [TaxId: 9606]}
+GNSPQEEVELKKLKHLEKSVEKIADQLEELNKELTGIQQGFLPKDLQAEALCKLDRRVKATIEQFMKILEEIDTLILPENFKDSRLKRKGLVKKVQAFLAECDTVEQNICQ
+>d3lkfa_ f.6.1.1 (A:) Leukocidin F (HlgB) {Staphylococcus aureus [TaxId: 1280]}
+EGKITPVSVKKVDDKVTLYKTTATADSDKFKISQILTFNFIKDKSYDKDTLVLKATGNINSGFVKPNPNDYDFSKLYWGAKYNVSISSQSNDSVNVVDYAPKNQNEEFQVQNTLGYTFGGDISISNGLSGGLNGNTAFSETINYKQESYRTTLSRNTNYKNVGWGVEAHKIMNNGWGPYGRDSFHPTYGNELFLAGRQSSAYAGQNFIAQHQMPLLSRSNFNPEFLSVLSHRQDGAKKSKITVTYQREMDLYQIRWNGFYWAGANYKNFKTRTFKSTYEIDWENHKVKLLDTKETENNK
+>d3lmna_ d.324.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+AEGGAADLDTQRSDIATLLKTSLRKGDTWYLVDSRWFKQWKKYVGFDSWDKYQMGDQNVYPGPIDNSGLLKDGDAQSLKEHLIDELDYILLPTEGWNKLVSWYTLMEGQEPIARKVVEQGMFVKHCKVEVYL
+>d3lnla_ c.135.1.0 (A:) automated matches {Staphylococcus aureus [TaxId: 158879]}
+DPMKIADLMTLLDHHVPFSTAESWDNVGLLIGDEDVEVTGVLTALDCTLEVVNEAIEKGYNTIISHHPLIFKGVTSLKANGYGLIIRKLIQHDINLIAMHTNLDVNPHGVNMMLAKVMGLKNISIINNQQDVYYKVQTYIPKDNVGPFKDKLSENGLAQEGNYEYCFFESEGRGQFKPVGEANPTIGQIDKIEDVDEVKIEFMIDAYQKSRAEQLIKQYHPYETPVFDFIEIKQTSLYGLGVMAEVDNQMTLEDFAADIKSKLNIPSVRFVGESNQKIKRIAIIGGSGIGYEYQAVQQGADVFVTGDIKHHDALDAKIHGVNLIDINHYSEYVMKEGLKTLLMNWFNIEKINIDVEASTINTDPFQYI
+>d3loga_ d.161.1.1 (A:) Salicylate synthase MbtI {Mycobacterium tuberculosis [TaxId: 1773]}
+SSSIPMPAGVNPADLAAELAAVVTESVDEDYLLYECDGQWVLAAGVQAMVELDSDELRVIRDGVTRRQQWSGRPGAALGEAVDRLLLETDQAFGWVAFEFGVHRYGLQQRLAPHTPLARVFSPRTRIMVSEKEIRLFDAGIRHREAIDRLLATGVREVPQSRSVDVSDDPSGFRRRVAVAVDEIAAGRYHKVILSRCVEVPFAIDFPLTYRLGRRHNTPVRSFLLQLGGIRALGYSPELVTAVRADGVVITEPLAGTRALGRGPAIDRLARDDLESNSKEIVEHAISVRSSLEEITDIAEPGSAAVIDFMTVRERGSVQHLGSTIRARLDPSSDRMAALEALFPAVTASGIPKAAGVEAIFRLDECPRGLYSGAVVMLSADGGLDAALTLRAAYQVGGRTWLRAGAGIIEESEPEREFEETCEKLSTLTPYLVAR
+>d3lvjc_ d.68.3.3 (C:) automated matches {Escherichia coli [TaxId: 155864]}
+LFSSPDHTLDALGLRCPEPVMMVRKTVRNMQPGETLLIIADDPATTRDIPGFCTFMEHELVAKETDGLPYRYLIRKG
+>d3lx3a_ d.96.1.2 (A:) automated matches {Plasmodium vivax [TaxId: 5855]}
+DQIAELLVESPLFSFNCAHFIAFKGFRETLHGHNYNVSLRLRGNIQGDGYVIDFSILKEKVRKVCKQLDHHFILPMYSDVLNIQEVNDNFKITCEDNSEYSFPKRDCVQIPIKHSSTEEIGLYILNQLIEEIDLPFLKTRSVNYMEVTVSESPSQKATVHRNI
+>d3m31a_ a.227.1.1 (A:) automated matches {Baker's yeast (Saccharomyces cerevisiae) [TaxId: 4932]}
+GSFNELNAINENIRDDLSALLKSDFFKYFRLDLYKQCSFWDANDGLCLNRACSVDVVEDWDTLPEYWQPEILGSFNNDTMKEADDSDDECKFLDQLAQTSKKPVDIEDTINYCDVNDFNGKNAVLIDLTANPERFTGYGGKQAGQIWSTIYQDNCFTIGETGESLAKDAFYRLVSGFHASIGTHLSKEYLNTKTGKWEPNLDLFMARIGNFPDRVTNMYFNYAVVAKALWKIQPYLPEFSFADLVNKEIKNKMDNVISQLDTKIFNEDLVFANDLSLTLKDEFRSRFKNVTKIMDCVQCDRCRLWGKIQTTGYATALKILFEINDADEFTKQHIVGKLTKYELIALLQTFGRLSESIESVNMFEKMYGKRLLER
+>d3m5qa_ a.93.1.1 (A:) automated matches {Basidomycetes fungus (Phanerochaete chrysosporium) [TaxId: 5306]}
+AVCPDGTRVSHAACCAFIPLAQDLQETIFQNECGEDAHEVIRLTFHDAIAISRSQGPKAGGGADGSMLLFPTVEPNFSANNGIDDSVNNLIPFMQKHNTISAADLVQFAGAVALSNCPGAPRLEFLAGRPNKTIAAVDGLIPEPQDSVTKILQRFEDAGGFTPFEVVSLLASHSVARADKVDQTIDAAPFDSTPFTFDTQVFLEVLLKGVGFPGSANNTGEVASPLPLGSGSDTGEMRLQSDFALAHDPRTACIWQGFVNEQAFMAASFRAAMSKLAVLGHNRNSLIDCSDVVPVPKPATGQPAMFPASTGPQDLELSCPSERFPTLTTQPGASQSLIAHCPDGSMSCPGVQFNGPA
+>d3m5ra_ d.299.1.1 (A:) automated matches {Influenza A virus [TaxId: 641809]}
+HMTIASVPTSRYLSDMTLEEMSRDWFMLMPRQKIIGPLCVRLDQAIMEKNIVLKANFSVIFNRLETLILLRAFTEEGAIVGEISPLPSLPGHTYEDVKNAVGVLIGGLEWNGNTVRVSENIQRFAW
+>d3m7va2 d.327.1.1 (A:108-226) Phosphopentomutase DeoB {Streptococcus mutans [TaxId: 1309]}
+FDTFWNGFPEEIISKIEKFSGRKVIREANKPYSGTAVIDDFGPRQMETGELIIYTSADPVLQIAAHEDVIPLDELYRICEYARSITLERPALLGRIIARPYVGKPRNFTRTANRHDYAL
+>d3m9qa_ b.34.13.0 (A:) automated matches {Fruit fly (Drosophila melanogaster) [TaxId: 7227]}
+LRDETPLFHKGEIVLCYEPDKSKARVLYTSKVLNVFERRNEHGLRFYEYKIHFQGWRPSYDRAVRATVLLKDTEENRQLQRELAEAAKL
+>d3mala_ b.42.6.0 (A:) automated matches {Thale cress (Arabidopsis thaliana) [TaxId: 3702]}
+VEITYGSAIKLMHEKTKFRLHSHDVPYGSGSGQQSVTGFPGVVDSNSYWIVKPVPGTTEKQGDAVKSGATIRLQHMKTRKWLHSHLHASPISGNLEVSCFGDDTNSDTGDHWKLIIEGSGKTWKQDQRVRLQHIDTSGYLHSHDKKYQRIAGGQQEVCGIREKKADNIWLAAEGVYLPLNE
+>d3mmha_ d.110.2.0 (A:) automated matches {Neisseria meningitidis [TaxId: 604162]}
+MHALHFSASDKAALYREVLPQIESVVADETDWVANLANTAAVLKEAFGWFWVGFYLVDTRSDELVLAPFQGPLACTRIPFGRGVCGQAWAKGGTVVVGDVDAHPDHIACSSLSRSEIVVPLFSDGRCIGVLDADSEHLAQFDETDALYLGELAKILEKRFEASRQAV
+>d3mv4a_ b.3.6.1 (A:) Protocatechuate-3,4-dioxygenase, alpha chain {Pseudomonas putida [TaxId: 303]}
+PIELLPETPSQTAGPYVHIGLALEAAGNPTRDQEIWNRLAKPDAPGEHILLLGQVYDGNGHLVRDSFLEVWQADANGEYQDAYNLENAFNSFGRTATTFDAGEWTLHTVKPGVVNNAAGVPMAPHINISLFARGINIHLHTRLYFDDEAQANAKCPVLNLIEQPQRRETLIAKRCEVDGKTAYRFDIRIQGEGETVFFDF
+>d3n08a_ b.17.1.0 (A:) automated matches {Chlamydia trachomatis [TaxId: 272561]}
+NAMQLTSQAFSYGRPIPKKYSCQGVGISPPLSFSDVPREAKSLVLIVEDPDVPPSVREDGLWIHWIVYNLSPVVSNLAEGAQIFAVQGLNTAGEIGYCPPCPPDAKHRYYFYAYALDVVLSDEEGVTKEQLLEAMDGHIIATAELMGTYEK
+>d3n2wa_ d.154.1.0 (A:) automated matches {Sphingosinicella xenopeptidilytica [TaxId: 364098]}
+GPRARDLGVPFEGTPGALNAITDVAGVEVGHTTVISGDGAMVIGKGPYRTGVTIIHPLGKTSLDGVAAGRAVINGTGEWTGMHLVDEVGQFLGPIALTGTGNVGLVHQSMMDWSVGKVPEEALFSRLLPVVAETLDNRLNDVFGHGLTRDHVFAALDGAKGGPVAEGNVGGGTGMIAYTFKGGIGTSSRVVSAGDTRYTVGVLVQANHGDRNDLRIAGVQIGKEIKGAWPEVNGIVAAGPDAGKPQDKNSLLIVIATDAPLMPHQLERMARRAALGVGRNGSTAGALSGEFALAFSTSHVIPLGGKPRLPAIINDTDSETMNALFRGVVQATEEALVNQLVASETMTGANNAKVYGIPHDQLARIMKARFP
+>d3n4ja_ c.116.1.1 (A:) automated matches {Yersinia pestis [TaxId: 214092]}
+AMLNIVLFEPEIPPNTGNIIRLCANTGCQLHLIKPLGFTWDDKRLRRAGLDYHEFADIKHHHDYQAFLDSEKLDSTQPARLFALTTKGTPAHSAVSYQANDYLLFGPETRGLPAYILDALPAQQKIRIPMQADSRSMNLSNAVSVVVYEAWRQLGYPGALL
+>d3n5wa_ d.174.1.1 (A:) Nitric oxide (NO) synthase oxygenase domain {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+RFLKVKNWETDVVLTDTLHLKSTLETGCTEHICMGSIMLPSQHTRKPEDVRTKDQLFPLAKEFLDQYYSSIKRFGSKAHMDRLEEVNKEIESTSTYQLKDTELIYGAKHAWRNASRCVGRIQWSKLQVFDARDCTTAHGMFNYICNHVKYATNKGNLRSAITIFPQRTDGKHDFRVWNSQLIRYAGYKQPDGSTLGDPANVQFTEICIQQGWKAPRGRFDVLPLLLQANGNDPELFQIPPELVLEVPIRHPKFDWFKDLGLKWYGLPAVSNMLLEIGGLEFSACPFSGWYMGTEIGVRDYCDNSRYNILEEVAKKMDLDMRKTSSLWKDQALVEINIAVLYSFQSDKVTIVDHHSATESFIKHMENEYRCRGGCPADWVWIVPPMSGSITPVFHQEMLNYRLTPSFEYQPDPWNTHVW
+>d3nira_ g.13.1.1 (A:) automated matches {Crambe hispanica [TaxId: 3721]}
+TTCCPSIVARSNFNVCRLPGTPSEALICATYTGCIIIPGATCPGDYAN
+>d3o1ca_ d.13.1.1 (A:) Histidine triad nucleotide-binding protein (HINT) {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+RPGGDTIFGKIIRKEIPAKIIFEDDQALAFHDISPQAPTHFLVIPKKHISQISAAEDADESLLGHLMIVGKKCAADLGLKKGYRMVVNEGSDGGQSVYHVHLHVLGGRQMNWPPG
+>d3o5ta_ a.209.1.0 (A:) automated matches {Azospirillum brasilense [TaxId: 192]}
+DHSIRSRALGAYLGLACGDALGATVEFLTKGEIAHQYGVHKHIKGGGWLKLPAGQVTDDTEMSIHLGRAILAAPEWDARRAAEEFAVWLKGVPVDVGDTTRRGIRRFIMHGTLSEPESEYHAGNGAAMRNLPVALATLGDDAAFERWTVEQAHITHCNAMSDAATLTLGHMVRRLVLGGDVRDVRDESNKLIAKHRQFKFQPYRGLATAYIVDTMQTVMHYYFQTDSVESCVVETVNQGGDADTTGAIAGMLAGATYGVETIPPRWLRKLDRDVYNEICAQVDGLLARAPALKQG
+>d3o6ca_ c.1.24.0 (A:) automated matches {Campylobacter jejuni [TaxId: 192222]}
+NAMLLGVNIDHIAVLRQARMVNDPDLLEAAFIVARHGDQITLHVREDRRHAQDFDLENIIKFCKSPVNLECALNDEILNLALKLKPHRVTLVPEKREELTTEGGLCLNHAKLKQSIEKLQNANIEVSLFINPSLEDIEKSKILKAQFIELHTGHYANLHNALFSNISHTAFALKELDQDKKTLQAQFEKELQNLELCAKKGLELGLKVAAGHGLNYKNVKPVVKIKEICELNIGQSIVARSVFTGLQNAILEMKELIKR
+>d3o79a_ d.6.1.1 (A:) Prion protein domain {Rabbit (Oryctolagus cuniculus) [TaxId: 9986]}
+GGYMLGSAMSRPLIHFGNDYEDRYYRENMYRYPNQVYYRPVDQYSNQNSFVHDCVNITVKQHTVTTTTKGENFTETDIKIMERVVEQMCITQYQQES
+>d3omya_ a.55.1.0 (A:) automated matches {Escherichia coli [TaxId: 562]}
+PKIQTYVNNNVYEQITDLVTIRKQEGIEEASLSNVSSMLLELGLRVYMIQQ
+>d3osea_ d.129.6.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+KPRSLRFTWSMKTTSSMDPNDMMREIRKVLDANNCDYEQKERFLLFCVHGDARQDSLVQWEMEVCKLPRLSLNGVRFKRISGTSIAFKNIASKIANELKL
+>d3osxa_ c.8.5.1 (A:) automated matches {Xenorhabdus nematophila [TaxId: 628]}
+SEGMQFDRGYLSPYFINKPESGSVELENPYILLVDKKISNIRELLPVLEGVAKASKPLVIIAEDVEGEALATLVVNNMRGIVKVASVKAPGFGDRRKAMLQDIATLTNGTVISEEIGLELEKATLEDLGQAKRVVINKDTTTIIDGVGEEGAIAARVTQIRQQIEESTSDYDREKLQERVAKLAGGVKLN
+>d3pc7a_ c.15.1.2 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SQTKVLLDIFTGVRLYLPPSTPDFSRLRRYFVAFDGDLVQEFDMTSATHVLGSRDKNPAAQQVSPEWIWACIRKRRLVAPS
+>d3proc1 d.52.1.1 (C:6-85) Alpha-lytic protease prodomain {Lysobacter enzymogenes [TaxId: 69]}
+PQLKFAMQRDLGIFPTQLPQYLQTEKLARTQAAAIEREFGAQFAGSWIERNEDGSFKLVAATSGARKSSTLGGVEVRNVR
+>d3psma_ g.3.7.5 (A:) automated matches {Pachyrhizus erosus [TaxId: 109171]}
+KTCENLADTFRGPCFTDGSCDDHCKNKEHLIKGRCRDDFRCWCTRNC
+>d3pwta_ e.10.1.1 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+GKALVIVESPAKAKTINKYLGSDYVVKSSVGHIRDLPTSGSAAKKSADSTSTKTAKKPKKDERGALVNRMGVDPWHNWEAHYEVLPGKEKVVSELKQLAEKADHIYLATNLDREGEAIAWHLREVIGGDDARYSRVVFNEITKNAIRQAFNKPGELNIDRVNAQQARRFMDRVVGYMVSPLLWKKIARGLSAGRVQSVAVRLVVEREREIKAFVPEEFWEVDASTTTPSGEALALQVTHQNDKPFRPVNKEQTQAAVSLLEKARYSVLEREDKPTTSKPGAPFITSTLQQAASTRLGFGVKKTMMMAQRLYEAGYITYMRTDSTNLSQDAVNMVRGYISDNFGKKYLPESPNQYASKENSQEAHEAIRPSDVNVMAESLKDMEADAQKLYQLIWRQFVACQMTPAKYDSTTLTVGAGDFRLKARGRILRFDGWTKVMPALRKGDEDRILPAVNKGDALTLVELTPAQHFTKPPARFSEASLVKELEKRGIGRPSTYASIISTIQDRGYVRVENRRFYAEKMGEIVTDRLEENFRELMNYDFTAQMENSLDQVANHEAEWKAVLDHFFSDFTQQLDKAEKDPEEGGMRPNQMVLT
+>d3q20a_ a.280.1.0 (A:) automated matches {Thermosynechococcus elongatus [TaxId: 197221]}
+MDVKHIAKQTTKTLISYLTYQAVRTVIGQLAETDPPRSLWLHQFTSQESIQDGERYLEALFREQPDLGFRILTVREHLAEMVADYLPEMLRAGIQQANLQQRAQQLERMTQVSE
+>d3q46a_ b.40.5.1 (A:) automated matches {Thermococcus thioreducens [TaxId: 277988]}
+MNPFHELEPGPEVPEVVYALIEIPKGSRNKYELDKATGLLKLDRVLYSPFFYPVDYGIIPQTWYDDGDPFDIMVIMREPVYPLTIIEARPIGIMKMEDSGDKDWKVLAVPVEDPYFNDWKDISDVPKAFLDEIAHFFQRYKELQGKTTKIEGWGNAEEAKREILRAIEMYKEKFGKEE
+>d3qzba_ b.1.13.0 (A:) automated matches {Thermotoga maritima [TaxId: 2336]}
+HMKLSDFIKTEDFKKEKHVPVIEAPEKVKKDEKVQIVVTVGKEIPHPNTTEHHIRWIKVFFQPDGDPYVYEVGRYEFNAHGESVQGPNIGAVYTEPTVTTVVKLNRSGTIIALSYCNIHGLWESSQKITVEE
+>d3qzma_ b.1.28.1 (A:) automated matches {Staphylococcus aureus [TaxId: 158879]}
+MSQATSQPINFQVQKDGSSEKSAMDDYMQHPGKVIKQNNKYYFQTVLNNASFWKEYKFYNANNQELATTVVNDNKKADTRTINVAVEPGYKSLTTKVHIVVPQINYNHRYTTHLEFEKAIPTLA
+>d3r3ra_ b.81.1.0 (A:) automated matches {Salmonella typhimurium [TaxId: 90371]}
+SNAMSDTLRPYKNLFPGIGQRVMIDTSSVVIGDVRLADDVGIWPLVVIRGDVNYVAIGARTNIQDGSVLHVTHKSSSNPHGNPLIIGEDVTVGHKVMLHGCTIGNRVLVGMGSIVLDGAIIEDDVMIGAGSLVPQHKRLESGYLYLGSPVKQIRPLSDAERSGLQYSANNYVKWKDDYLSQDNH
+>d3r9va_ a.250.1.1 (A:) automated matches {Shigella flexneri [TaxId: 623]}
+ELDGDQMISHRELWAKIANSINDINEQYLKVYEHAVSSYTQMYQDFSAVLSSLAGWISPGGNDGNSVKLQVNSLKKALEELKEKYKDKPLYPANNTVSQEQANKWLTELGGTIGKVSQKNGGYVVSINMTPIDNMLKSLDNLGGNGEVVLDNAKYQAWNAGFSAEDETMKNNLQTLVQKYSNANSIFDNLVKVLSSTI
+>d3reaa_ d.102.1.1 (A:) automated matches {Hiv-1 m:b_arv2/sf2 [TaxId: 11685]}
+NADSAWLEAQEEEEVGFPVRPQVPLRPMTYKAALDISHFLKEKGGLEGLIWSQRRQEILDLWIYHTQGYFPDWQNYTPGPGIRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPMSLHGMEDAEKEVLVWRFDSKLAFHHMARELHPE
+>d3rlfg_ f.58.1.1 (G:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+ARLFITHLLLLLFIAAIMFPLLMVVAISLRQGNFATGSLIPEQISWDHWKLALGFSVEQADGRITPPPFPVLLWLWNSVKVAGISAIGIVALSTTCAYAFARMRFPGKATLLKGMLIFQMFPAVLSLVALYALFDRLGEYIPFIGLNTHGGVIFAYLGGIALHVWTIKGYFETIDSSLEEAAALDGATPWQAFRLVLLPLSVPILAVVFILSFIAAITEVPVASLLLRDVNSYTLAVGMQQYLNPQNYLWGDFAAAAVMSALPITIVFLLAQRWLVNGLTAGGVKG
+>d3rqva_ b.121.7.1 (A:) STNV coat protein {Satellite tobacco necrosis virus [TaxId: 12881]}
+TMRAVKRMINTHLEHKRFALINSGNTNATAGTVQNLSNGIIQGDDINQRSGDQVRIVSHKLHVRGTAITVSQTFRFIWFRDNMNRGTTPTVLEVLNTANFMSQYNPITLQQKRFTILKDVTLNCSLTGESIKDRIINLPGQLVNYNGATAVAASNGPGAIFMLQIGDSLVGLWDSSYEAVYTDA
+>d3rrca_ a.264.1.1 (A:) automated matches {Plasmodium vivax [TaxId: 126793]}
+GNTVMKNCNYKRKRRERDWDCNTKKDVCIPDRRYQLCMKELTNLVNNTDTNFHRDITFRKLYLKRKLIYDAAVEGDLLLKLNNYRYNKDFCKDIRWSLGDFGDIIMGTDMEGIGYSKVVENNLRSIFGTDEKAQQRRKQWWNESKAQIWTAMMYSVKKRLKGNFIWICKLNVAVNIEPQIYRWIREWGRDYVSELPTEVQKLKEKCDGKINYTDKKVCKVPPCQNACKSYDQWITRKKNQWDVLSNKFISVKNAEKVQTAGIVTPYDILKQELDEFNEVAFENEINKRDGAYIELCVCS
+>d3ryce_ a.137.10.1 (E:) Stathmin 4 {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+ADMEVIELNKATSGQSWEVILKPPSFDGVPEFNASLPRRRDPSLEEIQKKLEAAEERRKYQEAELLKHLAEKREHEREVIQKAIEENNNFIKMAKEKLAQKMESNKENREAHLAAMLERLQEKDKHAEEVRKNKELKEEASR
+>d3s8gc_ f.23.9.1 (C:) Bacterial ba3 type cytochrome c oxidase subunit IIa {Thermus thermophilus [TaxId: 274]}
+KPKGALAVILVLTLTILVFWLGVYAVFFARG
+>d3seba2 d.15.6.1 (A:122-238) Staphylococcal enterotoxin B, SEB {Staphylococcus aureus [TaxId: 1280]}
+NGNQLDKYRSITVRVFEDGKNLLSFDVQTNKKKVTAQELDYLTRHYLVKNKKLYEFNNSPYETGYIKFIENENSFWYDMMPAPGDKFDQSKYLMMYNDNKMVDSKDVKIEVYLTTKK
+>d3sila_ b.68.1.1 (A:) Salmonella sialidase {Salmonella typhimurium, strain lt2 [TaxId: 90371]}
+EKSVVFKAEGEHFTDQKGNTIVGSGSGGTTKYFRIPAMCTTSKGTIVVFADARHNTASDQSFIDTAAARSTDGGKTWNKKIAIYNDRVNSKLSRVMDPTCIVANIQGRETILVMVGKWNNNDKTWGAYRDKAPDTDWDLVLYKSTDDGVTFSKVETNIHDIVTKNGTISAMLGGVGSGLQLNDGKLVFPVQMVRTKNITTVLNTSFIYSTDGITWSLPSGYCEGFGSENNIIEFNASLVNNIRNSGLRRSFETKDFGKTWTEFPPMDKKVDNRNHGVQGSTITIPSGNKLVAAHSSAQNKNNDYTRSDISLYAHNLYSGEVKLIDDFYPKVGNASGAGYSCLSYRKNVDKETLYVVYEANGSIEFQDLSRHLPVIKSYN
+>d3sxua_ c.128.1.1 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+KNATFYLLDNDTTVDGLSAVEQLVCEIAAERWRSGKRVLIACEDEKQAYRLDEALWARPAESFVPHNLAGEGPRGGAPVEIAWPQKRSSSRRDILISLRTSFADFATAFTEVVDFVPYEDSLKQLARERYKAYRVAGFNLNTATWK
+>d3t0ha_ d.122.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+EVETFAFQAEIAQLMSLIINTFYSNKEIFLRELISNSSDALDKIRYESLTDPSKLDSGKELHINLIPNKQDRTLTIVDTGIGMTKADLINNLGTIAKSGTKAFMEALQAGADISMIGQFGVGFYSAYLVAEKVTVITKHNDDEQYAWESSAGGSFTVRTDTGEPMGRGTKVILHLKEDQTEYLEERRIKEIVKKHSQFIGYPITLFVEK
+>d3t3la_ d.82.2.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+LDETTYERLAEETLDSLAEFFEDLADKPYTFEDYDVSFGSGVLTVKLGGDLGTYVINKQTPNKAIWLSSPSSGPKRYDWTGKNWVYSHDGVSLHELLAAELTKALKTKLDLSSLAYSGKDA
+>d3tewa_ f.11.1.1 (A:) automated matches {Anthrax bacillus (Bacillus anthracis) [TaxId: 1392]}
+SSQGLLGYYFSDLNFQAPMVVTSSTTGDLSIPSSELENIPSENQYFQSAIWSGFIKVKKSDEYTFATSADNHVTMWVDDQEVINKASNSNKIRLEKGRLYQIKIQYQRENPTEKGLDFKLYWTDSQNKKEVISSDNLQLPELKQKSSNSRKKRSTSAGPTVPDRDNDGIPDSLEVEGYTVDVKNKRTFLSPWISNIHEKKGLTKYKSSPEKWSTASDPYSDFEKVTGRIDKNVSPEARHPLVAAYPIVHVDMENIILSKNEDQSTQNTDSQTRTISKNTSTSRTHTSEPGSNSNSSTVAIDHSLSLAGERTWAETMGLNTADTARLNANIRYVNTGTAPIYNVLPTTSLVLGKNQTLATIKAKENQLSQILAPNNYYPSKNLAPIALNAQDDFSSTPITMNYNQFLELEKTKQLRLDTDQVYGNIATYNFENGRVRVDTGSNWSEVLPQIQETTARIIFNGKDLNLVERRIAAVNPSDPLETTKPDMTLKEALKIAFGFNEPNGNLQYQGKDITEFDFNFDQQTSQNIKNQLAELNATNIYTVLDKIKLNAKMNILIRDKRFHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTEGLKEVINDRYDMLNISSLRQDGKTFIDFKKYNDKLPLYISNPNYKVNVYAVTKENTIINPSENGDTSTNGIKKILIFSKKGYEIG
+>d3tg0a_ c.76.1.1 (A:) automated matches {Escherichia coli K-12 [TaxId: 83333]}
+NRAAQGDITAPGGARRLTGDQTAALRDSLSDKPAKNIILLIGDGMGDSEITAARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKTYNGALGVDIHEKDHPTILEMAKAAGLATGNVSTAELQDATPAALVAHVTSRKCYGPSATSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETATAGEWQGKTLREQAQARGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTPNPQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDEAVQRALEFAKKEGNTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNSEEDSQEHTGSQLRIAAYGPHAANVVGLTDQTDLFYTMKAALGL
+>d3u5la_ a.29.2.0 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+SMNPPPPETSNPNKPKRQTNQLQYLLRVVLKTLWKHQFAWPFQQPVDAVKLNLPDYYKIIKTPMDMGTIKKRLENNYYWNAQECIQDFNTMFTNCYIYNKPGDDIVLMAEALEKLFLQKINELPTEE
+>d3u7qa_ c.92.2.3 (A:) automated matches {Azotobacter vinelandii [TaxId: 354]}
+MSREEVESLIQEVLEVYPEKARKDRNKHLAVNDPAVTQSKKCIISNKKSQPGLMTIRGCAYAGSKGVVWGPIKDMIHISHGPVGCGQYSRAGRRNYYIGTTGVNAFVTMNFTSDFQEKDIVFGGDKKLAKLIDEVETLFPLNKGISVQSECPIGLIGDDIESVSKVKGAELSKTIVPVRCEGFRGVSQSLGHHIANDAVRDWVLGKRDEDTTFASTPYDVAIIGDYNIGGDAWSSRILLEEMGLRCVAQWSGDGSISEIELTPKVKLNLVHCYRSMNYISRHMEEKYGIPWMEYNFFGPTKTIESLRAIAAKFDESIQKKCEEVIAKYKPEWEAVVAKYRPRLEGKRVMLYIGGLRPRHVIGAYEDLGMEVVGTGYEFAHNDDYDRTMKEMGDSTLLYDDVTGYEFEEFVKRIKPDLIGSGIKEKFIFQKMGIPFREMHSWDYSGPYHGFDGFAIFARDMDMTLNNPCWKKLQAPWE
+>d3u81a_ c.66.1.1 (A:) automated matches {Norway rat (Rattus norvegicus) [TaxId: 10116]}
+GDTKEQRILRYVQQNAKPGDPQSVLEAIDTYCTQKEWAMNVGDAKGQIMDAVIREYSPSLVLELGAYCGYSAVRMARLLQPGARLLTMEINPDCAAITQQMLNFAGLQDKVTILNGASQDLIPQLKKKYDVDTLDMVFLDHWKDRYLPDTLLLEKCGLLRKGTVLLADNVIVPGTPDFLAYVRGSSSFECTHYSSYLEYMKVVDGLEKAIYQGPSSPD
+>d3ui4a_ d.26.1.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+GPMGSNAVKVRHILCEKHGKIMEAMEKLKSGMRFNEVAAQYSEDKARQGGDLGWMTRGSMVGPFQEAAFALPVSGMDKPVFTDPPVKTKFGYHIIMVEGRK
+>d3umha_ a.47.4.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+HAHFQKAKERLEAKHRERMSQVMREWEEAERQAKNLPKADKKAVIQHFQEKVESLEQEAANERQQLVETHMARVEAMLNDRRRLALENYITALQAVPPRPRHVFNMLKKYVRAEQKDRQHTLKHFEHVRMVDPKKAAQIRSQVMTHLRVIYERMNQSLSLLYNVPAVAEEIQDEVDELLQ
+>d3urra_ d.112.1.0 (A:) automated matches {Burkholderia thailandensis [TaxId: 271848]}
+SMNRLAKILPLENVVIGLSVTSKKRVFEQAGLIFENQNGIARSTVTDNLFARERLGSTGLGEGVAIPHGRIKGLKHPLAAFVRLAEPIPFEAPDGQPVSLLIFLLVPEQATQAHLEILSEIAQLLSDRDTRERLHTEPDRDELHRLLTQWQP
+>d3zqua_ c.34.1.0 (A:) automated matches {Pseudomonas aeruginosa [TaxId: 208964]}
+MSGPERITLAMTGASGAQYGLRLLDCLVQEEREVHFLISKAAQLVMATETDVALPAKPQAMQAFLTEYCGAAAGQIRVFGQNDWMAPPASGSSAPNAMVICPCSTGTLSAVATGACNNLIERAADVALKERRPLVLVPREAPFSSIHLENMLKLSNLGAVILPAAPGFYHQPQSVEDLVDFVVARILNTLGIPQDMLPRWGEQHLVS
+>d3zsja_ b.29.1.3 (A:) Galectin-3 CRD {Human (Homo sapiens) [TaxId: 9606]}
+PLIVPYNLPLPGGVVPRMLITILGTVKPNANRIALDFQRGNDVAFHFNPRFNENNRRVIVCNTKLDNNWGREERQSVFPFESGKPFKIQVLVEPDHFKVAVNDAHLLQYNHRVKKLNEISKLGISGDIDLTSASYTMI
+>d3zuca_ b.2.2.0 (A:) automated matches {Acetivibrio cellulolyticus [TaxId: 35830]}
+GSHMNLKVEFFNAGTQAQSNSIYPKFRLTNTGSNAINLADVKLHYYFTVDGDKAQTFWCDWSPVGSSNVTGTFVKMNPTTTGADQYLEIAFSSAAGTLAANTSIEVQGRFAKSDWTNYNQADDYSFNSSATTYTSWDKVTAYSAEGLIWGIEP
+>d3zzsa_ b.82.5.1 (A:) automated matches {Geobacillus stearothermophilus [TaxId: 1422]}
+SDFVVIKALEDGVNVIGLTRGADTRFHHSEKLDKGEVLIAQFTEHTSAIKVRGKAYIQTRHGVIE
+>d4a02a_ b.1.18.0 (A:) automated matches {Enterococcus faecalis [TaxId: 1351]}
+HGYVASPGSRAFFGSSAGGNLNTNVGRAQWEPQSIEAPKNTFITGKLASAGVSGFEPLDEQTATRWHKTNITTGPLDITWNLTAQHRTASWDYYITKNGWNPNQPLDIKNFDKIASIDGKQEVPNKVVKQTINIPTDRKGYHVIYAVWGIGDTVNAFYQAIDVNIQ
+>d4a1ua_ f.1.4.1 (A:) automated matches {Human (Homo sapiens) [TaxId: 9606]}
+MSQSNRELVVDFLSYKLSQKGYSWSQMAAVKQALREAGDEFELRYRRAFSDLTSQLHITPGTAYQSFEQVVNELFRDGVNWGRIVAFFSFGGALCVESVDKEMQVLVSRIAAWMATYLNDHLEPWIQENGGWDTFVELYGNNAAAESRKG
+>d4affa_ d.58.5.1 (A:) automated matches {Synechococcus elongatus [TaxId: 32046]}
+MKKIEAIIRPFKLDEVKIALVNAGIVGMTVSEVRGFGRQKGQTERYRGSEYTVEFLQKLKLEIVVEDAQVDTVIDKIVAAARTGENGDGKIFVSPVDQTIRIRTGEKNADAISAWS
+>d4dfaa_ b.40.1.1 (A:) Staphylococcal nuclease {Staphylococcus aureus [TaxId: 1280]}
+LHKEPATLIKAIDGDTVKLMYKGQPMTFRALLVDTPEFNEKYGPEASAFTKKMVENAKKIEVEFDKGQRTDKYGRGLAYAYADGKMVNEALVRQGLAKVAYVYKGNNTHEQLLRKAEAQAKKEKLNIWS
+>d4f1va_ c.94.1.1 (A:) Phosphate-binding protein {Pseudomonas fluorescens [TaxId: 216595]}
+MDINGGGATLPQALYQTSGVLTAGFAQYIGVGSGNGKAAFLNNDYTKFQAGVTNKNVHWAGSDSKLSATELSTYASAKQPTWGKLIQVPSVGTSVAIPFNKSGSAAVDLSVQELCGVFSGRINTWDGISGSGRTGPIVVVYRSESSGTTELFTRFLNAKCNAETGNFAVTTTFGTSFSGGLPAGAVAATGSQGVMTALAAGDGRITYMSPDFAAPTLAGLDDATKVARVGKNVATNTQGVSPAAANVSAAIGAVPVPAAADRSNPDAWVPVFGPDNTAGVQPYPTSGYPILGFTNLIFSQCYADATQTTQVRDFFTKHYGASNNNDAAITANAFVPLPTAWKATVRASFLTASNALSIGNTNVCNGIGRPLL
+>d4geva_ d.117.1.1 (A:) Thymidylate synthase {Escherichia coli [TaxId: 562]}
+MKQYLELMQKVLDEGTQKNDRTGTGTLSIFGHQMRFNLQDGFPLVTTKRCHLRSIIHELLWFLQGDTNIAYLHENNVTIWDEWADENGDLGPVYGKQWRAWPTPDGRHIDQITTVLNQLKNDPDSRRIIVSAWNVGELDKMALAPCHAFFQFYVADGKLSCQLYQRSCDVFLGLPFNIASYALLVHMMAQQCDLEVGDFVWTGGDTHLWSNHMDQTHLQLSREPRPLPKLIIKRKPESIFDYRFEDFEIEGYDPHPGIKAPVAI
+>d4sgbi_ g.69.1.1 (I:) Plant chymotrypsin inhibitor {Potato (Solanum tuberosum) [TaxId: 4113]}
+PICTNCCAGYKGCNYYSANGAFICEGQSDPKKPKACPLNCDPHIAYSKCPR
+>d4ubpa_ d.8.1.1 (A:) Urease, gamma-subunit {Bacillus pasteurii [TaxId: 1474]}
+MHLNPAEKEKLQIFLASELLLRRKARGLKLNYPEAVAIITSFIMEGARDGKTVAMLMEEGKHVLTRDDVMEGVPEMIDDIQAEATFPDGTKLVTVHNPIS
+>d4ubpb_ b.85.3.1 (B:) Urease, beta-subunit {Bacillus pasteurii [TaxId: 1474]}
+NYIVPGEYRVAEGEIEINAGREKTTIRVSNTGDRPIQVGSHIHFVEVNKELLFDRAEGIGRRLNIPSGTAARFEPGEEMEVELTELGGNREVFGISDLTNGSVDNKELILQRAKELGYKGVE
diff --git a/jpred/tests/T-state1.fas b/jpred/tests/T-state1.fas

new file mode 100644 (file)

index 0000000..4f74fc7
--- /dev/null
+++ b/jpred/tests/T-state1.fas
@@ -0,0 +1,11 @@
+>jp_6tPxpj5
+MLLAQINRDSQGMTEFPGGGMEAQHVTLCLTEAVTVADGDNLENMEGVSLQAVTLADGSTAYIQHNSKDAKL
+IDGQVIQLEDGSAAYVQHVPIPKSTGDSLRLEDGQAVQLEDGTTAFIHHTSKDSYDQSALQAVQLEDGTTAY
+IHHAVQVPQSDTILAIQADGTVAGLHTGDATIDPDTISALEQYAAKVSIDGSESVAGTGMIGENEQEKKMQI
+VLQGHATRVTAKSQQSGEKAFRCEYDGCGKLYTTAHHLKVHERSHTGDRPYQCEHAGCGKAFATGYGLKSHV
+RTHTGEKPYRCSEDNCTKSFKTSGDLQKHIRTHTGERPFKCPFEGCGRSFTTSNIRKVHVRTHTGERPYYCT
+EPGCGRAFASATNYKNHVRIHTGEKPYVCTVPGCDKRFTEYSSLYKHHVVHTHSKPYNCNHCGKTYKQISTL
+AMHKRTAHNDTEPIEEEQEAFFEPPPGQGEDVLKGSQITYVTGVEGDDVVSTQVATVTQSGLSQQVTLISQD
+GTQHVNISQADMQAIGNTITMVTQDGTPITVPAHDAVISSAGTHSVAMVTAEGTEGEQVAIVAQDLAAFHTA
+SSEMGHQQHSHHLVTTETRPLTLVATSNGTQIAVQLGEQPSLEEAIRIASRIQQGETPGLDD
+
diff --git a/jpred/tests/T-state2.fas b/jpred/tests/T-state2.fas

new file mode 100644 (file)

index 0000000..90a88ec
--- /dev/null
+++ b/jpred/tests/T-state2.fas
@@ -0,0 +1,11 @@
+>jp_8ZfmaJx
+MATEISTRGRQRAIGHEEYSLYSSLSEEELLQMAIEQSLADKTRGPTPAEASASSQTNHQPGHFHPWTRSPS
+SPENPPARAPLGLFQGVMQKYSSNLFKTSQMAAMDPVLKAIKEGDEEALKIMIQDGKNLAEPNKEGWLPLHE
+AAYYGQLGCLKVLQQAYPGTIDQRTLQEETALYLATCREHLDCLLSLLQAGAEPDISNKSRETPLYKACERK
+NAEAVRILVRYNADANHRCNRGWTALHESVSRNDLEVMEILVSGGAKVEAKNVYSITPLFVAAQSGQLEALR
+FLAKHGADINTQASDSASALYEASKNEHEDVVEFLLSQGADANKANKDGLLPLHVASKKGNYRIVQMLLPVT
+SRTRVRRSGISPLHLAAERNHDAVLEALLAARFDVNAPLAPERARLYEDRRSSALYFAVVNNNVYATELLLL
+AGADPNRDVISPLLVAIRHGCLRTMQLLLDHGANIDAYIATHPTAFPATIMFAMKCLSLLKFLMDLGCDGEP
+CFSCLYGNGPHPPAPRPGRFHDAPVDDKAPSVVQFCEFLSAPEVSRWAGPIIDVLLDYVGNVQLCSRLKEHI
+DSFEDWAVIKEKAEPPRPLAHLCRLRVRKAIGKYRIKLLDTLPLPGRLIRYLKYENTQ
+
diff --git a/jpred/tests/alignment.clustal b/jpred/tests/alignment.clustal

new file mode 100644 (file)

index 0000000..509e0d8
--- /dev/null
+++ b/jpred/tests/alignment.clustal
@@ -0,0 +1,186 @@
+CLUSTAL W(1.60) multiple sequence alignment
+
+QUERY                MKKIEAIIRPFKLDEVKIALVNAGIVGMTVSEVRGFGRQKGQTERYRGSEYTVEFLQKLK
+UniRef90_C0EK60      MKKIEAIIKPFKLDDVREILTEIGITGMTVSEVKGFGRQKGHTEIYRGAEYAVDFLPKVK
+UniRef90_Q21P81      MKLITAVIKPFKLDDVRNALSEIGVQGMTVTEVKGFGRQKGHTELYRGAEYVIDFLPKVK
+UniRef90_Q47GI8      MKKIEAIIKPFKLDEVREALSEIGISGLTVTEVKGFGRQKGHTELYRGAEYVVDFLPKIK
+UniRef90_B9ZJ79      MKKIEAIIKPFKLEDVREALTEMGIAGMTATEVQGFGRQKGHTELYRGAEYVVDFLPKVK
+UniRef90_B5FAN6      MKIINAIIKPFKLDDVREALADAGVDGMTVSEVKGFGRQKGHTELYRGAEYQVDFLPKVK
+UniRef90_B5ZIL8      MKKIEAIIKPFKLDEVKDALHEIGLMGISVTEAKGFGRQKGHTELYRGAEYIVDFLPKVK
+UniRef90_B4RVM6      MKKIEAIIKPFKMDDVREALAEVGIAGMTVSEVKGFGRQKGHTELYRGAEYQVDFLPKIK
+UniRef90_B2FHB8      MKLISAIIRPFKLDEVREALSDAGVSGITVTEVKGFGRQKGHTELYRGAEYVVDFLPKIK
+UniRef90_P21193      MKKIEAIIKPFKLDEVKEALHEVGIKGITVTEAKGFGRQKGHTELYRGAEYVVDFLPKVK
+UniRef90_B5JS45      MKKIEAVIKPFKLDDVRDALADIGVSGMTVTEVKGFGRQKGHTETYRGAEYVVDFLPKLK
+UniRef90_Q07UM0      MKLVVAIIKPFKLDEVRQALTDVGVHGMTVTEVKGYGRQRGHTEIYRGAEYLVNFLPKLR
+UniRef90_Q2RVB4      MKFVIAITKPFKLDEVREALGALGIQGMTVTEVKGFGRQKGQTEVYRGAEYVVNFLPKVK
+UniRef90_A9IPV3      MKLIIAIIKPFKLDEVRVALSGIGVQGLTVTEVKGFGRQKGHTELYRGAEYAVDFLPKLR
+UniRef90_A4TZT2      MKLIIAIIKPFKLDEVREALTQLGIQGLTATEVKGFGRQKGQTEIYRAAEYVVSFVPKIK
+UniRef90_B3DVA4      --KIEAIIKPFKLEEVKEALTEIGIAGLTVTEVKGFGRQKGHTEIYRGSEYTVDFLPKVK
+UniRef90_C1STD4      MRKIEIITRPFKLDEVKQRLTKLGIQGMTVTEVKGFGRQRGHKEIYRGAEYQVDFVAKVK
+UniRef90_A7HGG9      MKRIEAIIRPSKLEDVRRLLSHPWISAMTVSEVRGAGRQKGHAELYRGAEYVIDLIPKLK
+UniRef90_A9BCF1      MKKIEAIIRPFKLEDVKVALVNSGIVGMTVSEVRGFGRQKGQVERYRGSEFTVEFLQKLK
+UniRef90_B4U911      MKKVEAIIKPFKLDEVKDALVEIGIGGMTITEVKGFGQQKGKTEIYRATEYVIDFLPKIK
+UniRef90_B1ZSX2      MKLVTAIIKPFKLEEIKAALAEIQVEGMTVTEVKGFGRQKGHTEIYRGTEYTVDFLPKVR
+UniRef90_Q7X1L4      MKKVEAIIKPFKLDAVKEAVTALGVYGMTVTEVKGYGQQKGHTEQYRGAEYVVEFITKIK
+UniRef90_Q1NW36      MKKVEAIIKPFKLDAVKEAVTALGIHGMTVSEVKGFGRQKGHTEVYRGAEYVVDFVAKIK
+UniRef90_C0GRX0      MKKLEIITRPFKVEAVKEALAGMGIKGMTLTDVKGFGRQMGHKEIYRGAEYDVDFLPKVK
+UniRef90_B8DJ84      MKKIEAIIKPFKLDAVKDALIGIGVFGLTVTEVRGYGRQRGHVETYRGLEYEVQFNSKLK
+UniRef90_Q6ARG9      MKKIEAIIKPFKLEEIKEALTELAITGMTISEVKGYGRQKGHKEMYRGAEYSIDFNPKLK
+UniRef90_C1W154      MKLVTAIIQPHRLDAVKSALEAAGIRGMTVSEASGYGRQKGHTEVYRGAEYTIDLVPKIR
+UniRef90_C1UII8      MKLVTAIVKPFKLDDVKNALELIGIAGLTVSEVQGFGRQRGHTEVYRGAEYQVDFVPKVR
+UniRef90_UPI000      --KVTVITNQAKFYQLKTSLEAIGITGMTVIQVLGFGIQKGQPEYYRGNPIEATLLPKVK
+UniRef90_C1T022      MKLVIAYIRPECLNAVKQELYAKKIYNMSVTNVLGSGRQKGFTETYRGVVMEVNLLKKLR
+UniRef90_Q46G48      MKYIIAMIRPERLDAVKRELQKLEVNRLTVSSVAGYGAQKGHLEIYRATEHEANLLEKVK
+UniRef90_A2RJQ2      MKKIEAIIRTDKLEDLKKALSDNGVHGMTVSQVLGYGEQKGFAEYVRGQRIETTLLSKIK
+UniRef90_Q8KF33      MKKIEAIIRTSQYEAVKKALHEIDIDFFTWWDVTGQGNDKKHTEIYRGTVRDTSYISRRY
+UniRef90_B1HTS9      MKKIEVIIRPEVFGAVRDGLAQQGIAGLSVSEIAGCGRQLGRTGLFRGNTYEIEFLPKLK
+UniRef90_A2SPS9      MKMITAIIRPEKVDEVLNALEQNNIPGVTITEVLGRGEQGGVCLQYRAGKMQVKTLPKTK
+UniRef90_C0EAH3      --KLVIVTRQSKFEELKAAMNAIEVTGMTVTQVIGCGTQKGATEFYRGVPVEMNLLPKIK
+UniRef90_A7I8Z1      --MISAIIKPERFEFVKKALEDKGYVSMTITEVKGRGEQKGISLEYRGGKMTVDLLPKVK
+UniRef90_Q3AFZ0      MKKIEALIRPQKLGEVKEALNKLGISGMTVTEVVGCGRQKGQKEIYRGIEYEINLLPKVK
+UniRef90_A7I508      MKLVIALIRPERFGAVKKALEDKGYIGMTTAEAKGRGAQKGIALVYRGGRLTIDILVKVR
+UniRef90_P51604      MKEIIAIIRPNKINRTKEVLDALGFSSMTANAVFGRGRQKAIVGELREEEGSMRYIPKRM
+UniRef90_B0NXT3      --KINAIVREEKFEDVKEALNKIGVNGITVSQVMGCGAQKGFTEVIRGTKVDMMMRPKIK
+UniRef90_A8YG01      ----------------KIALVNAGIVGMTVSEVRGFGRQKGQSERYRGSEYTVEFLQKLK
+UniRef90_C0BMJ9      MKKVEAIIRKSKFDDVKKALHAIEVNFFSYWDVTGVGNEKQ-GHVYRGISYSTSDIQRRI
+UniRef90_Q466Y2      MCKIEAIIKPMKLHEVKDALEEAGYPSLTVTDVKGRGQQKGIVQQWRGKKYCVDLLPKTK
+UniRef90_O26760      MKEIVAIIRPEKLEEVKNALEAAGCHGMTVTEVRGRGRQLGITESYRGRDYRIDLLPKTK
+UniRef90_A0LYN2      MKKIEAIIRKSEFDETKEALHSIGVTFFSYWDVTGVGNEKV-GHVYRGVSYSTADIQRRY
+UniRef90_C1YA75      MKVVTAVIKPFKLDEVRAALLAFGVQGMTVSESSGYGRQRGHTEVYRGAEYTVELLPKVR
+UniRef90_A8KX44      MKLVTAIVRPHRVDDVRAALTTYGVHGITVSQVTGFGLEMWRTQTYRGNAFHDESTSNIR
+UniRef90_C0EZB6      --KLTIMCKEDRFAILKDAMSQIGVTGMTVSHVMGCGTQKGKTGQYRGVKIDMNLLPQLQ
+UniRef90_Q11P32      MKKIEAIVKPSKLKAIQAGLIKIGIPCMTVVPVKGVGLQQGFPEIYRGTEKSIVLLSKVM
+UniRef90_A7B6Y7      --KIEAIVREEKFEQVKSALQDIQVNGVTISQVMGYGTQRGYTEIVRGSEVDILLHPKIK
+UniRef90_A7VSI5      --KVVILFNQDKFIELKDAMNAIGVTGMTVIHVMGCGVQKGNTRYYRGVKLDIVLLPKIK
+UniRef90_A6G036      --KVEAMIRPFKLDDVKERLTELEVGGMTVTEVKGFGRTGGKTEFYRGSAYVIDFVPKIK
+UniRef90_C0ES36      MIKVEAYVREDKFEDVKAALNAIGVNGLTVSQVMGCGIQRGYKEIVRGMQVDMQMQPKIK
+UniRef90_B5IHX8      MKQIQAIVRPEKLDAVKDALVEIGINGITVTAVQGFGKQMGHTEVYRGVKVEAKLLTKMQ
+UniRef90_B0MIE7      ---------PEKLTDVKHILEAHKVSGLMISNIMGYGNQKGFTQKYRGNELNSNLLPKIK
+UniRef90_B4S395      MKLITAIIQEDKLDQVREALIQANISRISVSRISGHGRQE-DIDIYRGRKIAPNLRPKIK
+UniRef90_P51254      MKKIEAIIRPFKLNEVKLALVKGGIGGMTVVKVSGFGRQKGQTERYKGSEYSIDIIDKIK
+UniRef90_P71524      MKMIRAVVRPSKAEEVVDALAESGCVALTKMDVIGRGKQKG----IKIDQIYYDELPKTM
+UniRef90_A8JI83      ---IEAIFRPWRLPFVIDTLSKYGIRGLTNTPVKGVGVQGGSRERYAGTEFGPNLVDKEK
+UniRef90_B0CD03      MRTITAFIRPQQCDQVKLVLVQLGIIDITLSDVKGFGRQQGSLQQYRGSDAEIRLHRKLK
+UniRef90_B1QY06      MKRIEAIIRPSKLEEIKEALKNNNINGVTISQVMGCGKQLGWKEYHRGTELITNVLPKIE
+UniRef90_Q30VL0      MKLLIAYIRPEKLSTVKKALYARGIYAMSVTNALGSGQQKGFTETYRGIVTEVNLLKKVR
+UniRef90_A0T2Q5      MKEVLAIIRPNMVSKTGKALEAVGFPAMTVIRCFGRGKEKGYIDAGEKLGMRMKYIPKRM
+UniRef90_B3QXW9      MKEITAIIRINKMNETKKALIKAGISSFTASRVLGRGKGQVHYDLLKGAAEGYELVSKRY
+UniRef90_B6YRQ4      MKKIEAIIRKTRFDEVKEALLEADIEWFSYSDVRGVGKARQ-ERIYRGVVYDTSSIERIQ
+UniRef90_B0MJN0      MTKVDIIANQEKFEVLKHALSSIGITGMTVSHVMGCGMQKGSTEFYRGVPVDARLLPKMK
+UniRef90_C2C1T3      --KIEIITRPNRFDVFQKALKEIGVSGLTVTKAVGTGLEKGMIELYRGTIKENNVHERMK
+UniRef90_C1VTA2      --LVMAIVRPEKLSDVKAALAEAGAPSLTVTQVSGRGSQPAKTGQWRGEEYVIDLHQKIK
+UniRef90_A3XNG5      MKKIEAIIRKSKFTAVKKALHDKGVNFFSYWDVTGLGNEKE-GHVYRGVSYSTSDIQRRY
+UniRef90_P71525      MKEIIAIIRPSKMAQTKTVLEGLGFPAMTANRVLGRGKQKAIVGELGFEV-DMRYIPKTM
+UniRef90_Q46C91      MKEIIAIIRPKKVVPTKEALEKLGVPSLTAIPVFGRGKQKGIATELDIAGRRMEYIPKRL
+UniRef90_B7BWA8      MKEVMIILRPKMYFPTKDALDQAGFHSMTIREIIGRGKCPVHYDYDEGAPVKHRLVAKRM
+UniRef90_Q7UGU6      MKLIIAIVQPSKLDAIKEALTRVEVHRLTVVDCQGFGRQRGQTGSMRGRDYGVSLLRKVQ
+UniRef90_A3HVG6      MKKIEAIIRTSRFEQIHSCVAGLGVKFLTFYEVKGMGLEHAKQQTYRGVAYEPTYIPRTK
+UniRef90_A0YMH7      MKRIEALIRPVQFDSVVTALVEAGIVGMSVTNVRGYGRQKGQTESYRGVKHVIEFHPKMK
+UniRef90_Q46A23      MKYIIAMIRPEKLDSVKKEIQKIGAHGLTVSSISGYGAQGGHLNVDRTKKYEANLLDKVK
+UniRef90_B4VJP7      ----------------MKALLDAGYPAVTKVDVFGRGKQRG----LKIGNVLYDELPKAL
+UniRef90_B1QUW3      MYLVRAIIRTEKVNGVLSELVDAGFPQVTKMDVFGRGKQKG----IQVGEVHYDELPKEM
+UniRef90_A5N1U1      MKEIMAVIRMNMVGKTKKALAENGFPSITCKDVLGRGKKMVEEELHRIEDESYRLISKRL
+UniRef90_A9D1T1      -----------------------------------------------GAEYMVDFLPKVK
+UniRef90_A6LUZ0      MYMIRAIIRPERVSTVLSELLDAGFPEVTKMAVYGRGKQKG----IKVGEVYYDELPKEM
+UniRef90_A6LUZ1      MKEVMCIIRLNKVNKTKEALAEAGFPSITCRKVLGRGKKSALVEAYMETGEVPRLIPKRF
+UniRef90_B8GEW5      MKEIMAIVRMKKTGVTKRALVETGVAGFTALKVLGRGKLVEDTAVIEPAEQEVRFFPRRL
+UniRef90_C1FI34      --QVRAMVRPWRLSGVIDALNKYGIRGLTTYTVHGAGVQIGTVERYAGSTFDANLVEKVV
+UniRef90_C1TA34      MKEIIAIIRMNKVNITKKALADVGVCGLHAIKVMGRGKQLGVREEIDGLSGGTRLIPKRL
+UniRef90_C1T440      MKEVIAVIRMNMMNKTKKALQDAGVVAFFAHEAFGRGKGLVDVKPLEGARKGIELYPKRM
+UniRef90_A9A2H4      MKKVEAIVNESAQNAVIDAMRKVGISGVTVSKVQGQGAQD--------PPLVGDFFSRVL
+UniRef90_Q97ME3      MKEIMAIIRMNMVEKTKEALLKGGNPAITCLKVLGRGRQKVDIEDYKMAEELSELISKRL
+
+QUERY                LEIVVEDAQVDTVIDKIVAAARTGENGDGKIFVSPVDQTIRIRTGEKNADAISAWS
+UniRef90_C0EK60      IELVLADDKVDQAVDAILETAHSGKIGDGKIFIYPVEEAIRIRTGERSEAAL----
+UniRef90_Q21P81      LELVLGDELIDQAVEAISKAAQTGKIGDGKIFITPCEEVIRIRTGETGPEAV----
+UniRef90_Q47GI8      IEIVVNSNNVEPAIDAIIKAARTGKIGDGKIFVMPVEQVVRIRTGETDEAAV----
+UniRef90_B9ZJ79      LELVVDDDRVDACIDAIVKASRTGKIGDGKIFVSDMARVVRIRTGEEGSEAL----
+UniRef90_B5FAN6      LEIAVQAEGVDRIVEAISKAAHTGKIGDGKIFVYDLQQAVRIRTGETDTEAL----
+UniRef90_B5ZIL8      LEIVCADNLVDRAVETIMAAARTGRIGDGKIFILPVEDVIRIRTGEHGEEAI----
+UniRef90_B4RVM6      IELVLDDDRVEQAVEAIQSSAKTGKIGDGKIFVYSVESAVRIRTGEQNEDAI----
+UniRef90_B2FHB8      IETVVTDERADAVIEAIQSSAGTGKIGDGKIFVTAVEQVIRIRTGEIGADAL----
+UniRef90_P21193      IEVVMEDSLVERAIEAIQQAAHTGRIGDGKIFVTPVEEVVRIRTGEKGGDAI----
+UniRef90_B5JS45      LEIVVAEKDADACVESITNAAKTGQIGDGKIFVSDVERTIRIRTGEEDESAI----
+UniRef90_Q07UM0      IEVGVADTLVDKAVEAITRSARTGQIGDGKIFVTPLDHALRIRTGETNADAL----
+UniRef90_Q2RVB4      IELAVPDNLLDQVVETIQSTAQTGKIGDGKIFVFDLGEAVRIRTGERGEEAL----
+UniRef90_A9IPV3      VEAAVPDHLVDQVIDVIEQAARTGKIGDGKIFTAPLEQVIRIRTGESGEAAL----
+UniRef90_A4TZT2      IELVVNDDVVDRAVEAIQAAARTDKIGDGKIFVMDVAHALRIRTGEADTEAL----
+UniRef90_B3DVA4      VEIVLTEDILPKAVEAIIKSAKTGKIGDGKIFVLPVSEAIRIRTEEKGENAI----
+UniRef90_C1STD4      IEIVVDDGLVEEIVSTVQEGARTGKVGDGKIFISPVDNAVRIRTGESGAEAL----
+UniRef90_A7HGG9      LEIVLPDPLVDRVVADLESWLRTGRIGDGKIFVEPLDDAVRVRTGERGEDAL----
+UniRef90_A9BCF1      IEIVVADESVPTVLTAIAEAAKTGEIGDGKIFISPVESVVRIRTGELDGSAL----
+UniRef90_B4U911      IETVVKDSEVEKVVQTILKSAQTGKVGDGKIFIYNVEETVRIRTGERGESAI----
+UniRef90_B1ZSX2      IEILAADESVPKILETIISTAKTGKIGDGKIFISAAEDVVRIRTDERGEAAL----
+UniRef90_Q7X1L4      VEIVVADAKVSPVLEAIRRTAMSNSIGDGKVFVSPVETALRIRTGETGDAAL----
+UniRef90_Q1NW36      VEIVVESEKASLLVETITQAARNGNIGDGKIFVTPVESVCRIRTGELDQDAI----
+UniRef90_C0GRX0      IEVILDDANVDQAVEAAIKAARTDKVGDGKIFVYSVENAIRIRTGESGDEAI----
+UniRef90_B8DJ84      IETVVPDGMSDQVVKAITTAARTGSIGDGKIFISSLEEVIRIRTGEEGTDAI----
+UniRef90_Q6ARG9      IELVVRAEIADKVVEKIRLAARTGKIGDGKIFVLPIEEVVRVRTGEQGREAI----
+UniRef90_C1W154      LEILVDDPDAHRVGEVITQAAHTGRIGDGKVWTIPVDSVTRVRTGEEGPSAL----
+UniRef90_C1UII8      IEVVVGEIEAARVVDAIVEAASTGQIGDGKVWVTTIDEIVRVRTGERGADAL----
+UniRef90_UPI000      MKKIEAIIRPEAFQTLKDGLSAVGISGLTVTEAAGCGKQQGKKGVFRGTSFEIQLVPRVK
+UniRef90_C1T022      LEIGVNDDFAEQAVEAINAGARTGKEGDGVIFVLECAAAVRIRTQETGPAAMG---
+UniRef90_Q46G48      IEIAVEDHFLKSVIEAIKTGAKDGYIGSGKIFVLPLENVIRIRTNETGPEAL----
+UniRef90_A2RJQ2      IEIVSIDEKVDQIVNVITKAVRTGEVGDGKIFIQPVERVIRIRTSEEDAQAL----
+UniRef90_Q8KF33      LSIVVRDVNLQKTVDCLIKNARTGEVGDGKIFVSDIEQSYRIRTGESGDESL----
+UniRef90_B1HTS9      LEMIVDDSKVDGIVEILLREAATGKVGDGKIFIYPVEQAIRIRTKEVGSIAV----
+UniRef90_A2SPS9      LEIVVPDKDVDTLIKVIREHARTGKKGDGRIFVLPVEAAAWVRTDE----------
+UniRef90_C0EAH3      VEIVVCRVPVRTVIETAKKVLYTGHYGDGKIFVYDIENVVKVRTGEEGCAALQ---
+UniRef90_A7I8Z1      IEIVIRDKDLEDVIATLTGAARTGKIGDGKIFVIPVEKSIRIRTGD----------
+UniRef90_Q3AFZ0      IEIVTVDEKVEEIIKIISESARTGAIGDGKIFISEVLDAVRIRTGERGTAAITS--
+UniRef90_A7I508      IEIVSHDRDVEDLVSTIRESAWTGANGDGRIFVLPVEQAIRIRTGE----------
+UniRef90_P51604      ISLVVPDEDASLVVESIMKVNKTGQIGDGKIFVCPIEDAVRVRTKESGEDAI----
+UniRef90_B0NXT3      FEIVVSSEEWERTIEAIQKSAFTGEVGDGKIFSYEVRNVVKIRTGERDVDALQD--
+UniRef90_A8YG01      IEIVVEDKQVDMVVDKLISAARTGEIGDGKIFISPVEQIVRIRTGEKDLQAI----
+UniRef90_C0BMJ9      LSIVISDEFLEPTINAILEAACTGNVGDGKIFVSDVQDAYRIRTRENGKAGIN---
+UniRef90_Q466Y2      IEIAAPEDKIEEIIKIIQSSAYTGEIGDGKIFVTPIETVVRIRTGERNGDAL----
+UniRef90_O26760      IEIVVNDEDVDTVVETIVKSAQTGDIGDGKIFISGVDEVVRIRTGESGKKAV----
+UniRef90_A0LYN2      LSIVVTDSFVEKTVETLLKAAHTGKVGDGKIFILPVEEAYRIRTKEKGGESL----
+UniRef90_C1YA75      VEILVDDEDAEDVVDVIVRAARTGKIGDGKVWTQPVETVIRVRTGERGPEAL----
+UniRef90_A8KX44      LELVVADSDAPDVVNVIRRTAASTSSGAGKIWVLPVEGLARIRTGERGADAL----
+UniRef90_C0EZB6      VDIVVSTVPPELVVEAAKKALYTGEYGDGKIFLYDVENVVRIRTNETGIAAL----
+UniRef90_Q11P32      IICVVSDENLEKCIDVIIETGSEGKVGDGKIFVYDVLDAIRMRTRTRGDDAI----
+UniRef90_A7B6Y7      FEVVVSSEEWEQTISAIQKAAFTGEVGDGKIFSYEIRSAVKIRTKETGYNAVQS--
+UniRef90_A7VSI5      LEIVVSKVPVQTV-DTARKVLYTGNIGDGKIFIYDVENVIKVRTGAEGYYALQD--
+UniRef90_A6G036      IEVVVPAARSEEVIAAIREVAASDRIGDGKIFVTPVLEAVRIRTDERGESAL----
+UniRef90_C0ES36      FEIVVSSEEWEKTIEAIEKAAYTGEPGDGKIFTYEIRHAQKIRTKETGYDAIQAT-
+UniRef90_B5IHX8      ITSVVTDQAVDQVVQAILTAARTGEIGDGKIVITPVENAIRIRTGESGDSTLA---
+UniRef90_B0MIE7      VESVMPEEVVEKVTKDIVNTVRTGEFGDGKIFISPVEEAIRIRTGETGKDAL----
+UniRef90_B4S395      LEIAVNEEFVDVAIDTIVDSARSGEIGDGKIFVTPLEQCVRIRTNERGGSAI----
+UniRef90_P51254      IEIIVSDDKVNSITEIIIKTAKTGEIGDGKIFISDVEQVIRIRTNDLNSAAL----
+UniRef90_P71524      LMLVVEDDAAENVIELITKTAYTGSFGDGKIFVSPVDEAYTVRTRSCG--------
+UniRef90_A8JI83      LDIVVSRAQVDAVVRLVAASAYTGEIGDGKIFVHPVAEVVRIRTAETG--------
+UniRef90_B0CD03      VEVKVDEEMVAPVVEKITFAARTGQVGDGKIFVSPLQKVVQVRTGEE---------
+UniRef90_B1QY06      VKMVIEDSKVEEVIEIISSIAKTGEVGDGKIFVIDICDCVRIRTGERGNEAL----
+UniRef90_Q30VL0      IEVGVPADKAEDALAALQTGAHTGREGDGIIFVQDVARTVRVRTGE----------
+UniRef90_A0T2Q5      ISIVVDDADVPFVVGIIMKVNRTGKPGDGKIFVLPVEEAIRIRTGEFGVEAIG---
+UniRef90_B3QXW9      LVVVVNDNMLQPTIDAIISANQTGKPGDGKIFVSTIEDAVRVRTGETGSAIL----
+UniRef90_B6YRQ4      INLVVRDINVEKAIKAIEKSAHTGEVGDGRIFVSTIDNAYSIRTGEQGDETL----
+UniRef90_B0MJN0      VEIVVCKVPVEKVVEVAKNALYTGKIGDGKIFVYDVENVIKVRTGEEAYEALQD--
+UniRef90_C2C1T3      VEIVVSTVPVEAVLEVVKNTLRTGEPGDGKVFVYPLSDVIKISTGEHGVAALQD--
+UniRef90_C1VTA2      VECVVEPEDADDVVEAIREGANTGEKGDGKIFVLPVFDAVQVRTGDRGTDAI----
+UniRef90_A3XNG5      LSIVVNDDFEQAAVAAILDAAATGEVGDGKIFVSDVQDAYRIRTGKKGPDTLN---
+UniRef90_P71525      LTLIVPDEDASLVVEAIMKVNKSGQYGDGKIFVCPIEDIITVRTSERGEAAI----
+UniRef90_Q46C91      FSIVTRNEDVDTIIETIMKVNQTGDIGDGRIFICPVDDAIRVRTDEHGDNAL----
+UniRef90_B7BWA8      IDMFVRDEDLQKLIDTVVEVNKTNHAGDGKIFVLPVNDAIRVRTGEKGIEAI----
+UniRef90_Q7UGU6      LQIGVNEEFVQPTIDAIGRSGESGEIGDGKIFVLPMDDCVRIRTGERGGEAI----
+UniRef90_A3HVG6      LEIVTVDELVEPVINCILTEGKTGEVGDGKIFVYDVLEAHRIRNNDQGEQAL----
+UniRef90_A0YMH7      LEIVVEDEVCEFVVEKLVEAAQTGQIGDGKIFIQSMEHIIRTRTGESDLEAL----
+UniRef90_Q46A23      IEIAVKDEFLQTTVEAIERGSKDGYIGSGKIFVLPLENVMRIRTKETGNDAL----
+UniRef90_B4VJP7      LMVVVPDTEKEFVIRAILSSARTGAEGDGKIFVSPVEEVYTISSGKTDSS------
+UniRef90_B1QUW3      LLIVVKDEDKDDVVRVIMKNSRTGEYGDGKIFISKVDTAYTISTGKE---------
+UniRef90_A5N1U1      IWILAKDEDVKKIADIIIDINQTGHPGDGKIFVTKVTDVVRIRTGETQDEAV----
+UniRef90_A9D1T1      IELVIQDELLDRAIEVIVDTARTGKIGDGKIFVTEIERVIRIRTGEENEEAV----
+UniRef90_A6LUZ0      LLIAVKDEDKDDVIKVIIRNSRTGEFGDGKIFVAPIEEVYTVSSGKSG--------
+UniRef90_A6LUZ1      ITLVVKDDEVKTVVDTVISVNSTGTPGDGKIFVLPVEEVYRVRDGQIGEEAI----
+UniRef90_B8GEW5      FTILAHDEDVPRIVEAITKVNITEKVGDGIILVLPVDDAVRVRTGESGDAAI----
+UniRef90_C1FI34      VEIVVVREQCQEVVDVIVDAAQTGEIGDGKIFLSPVHDIVRIRTGEVGAAA-----
+UniRef90_C1TA34      LTILARDEDVKKIVDTVIKVNQEGNKGDGRIFIAPVIDAYRVRTAEKGEAAV----
+UniRef90_C1T440      LTVVVTDDLVPEVVKVITDTNKTGQPGDGKIFVLPMIDAVRVRTGEKGAKSI----
+UniRef90_A9A2H4      IVCVVDDPKLDEILDAIAGAACTGTKGDGKVYVSDICDALDICTKKRG--------
+UniRef90_Q97ME3      IIILAKDEDVKEIVDEIIEVNRTGNPGDGKIFVINIADAMRIRTEETGDMAI----
+
+QUERY                UniRef90_C0EK60      UniRef90_Q21P81      UniRef90_Q47GI8      UniRef90_B9ZJ79      UniRef90_B5FAN6      UniRef90_B5ZIL8      UniRef90_B4RVM6      UniRef90_B2FHB8      UniRef90_P21193      UniRef90_B5JS45      UniRef90_Q07UM0      UniRef90_Q2RVB4      UniRef90_A9IPV3      UniRef90_A4TZT2      UniRef90_B3DVA4      UniRef90_C1STD4      UniRef90_A7HGG9      UniRef90_A9BCF1      UniRef90_B4U911      UniRef90_B1ZSX2      UniRef90_Q7X1L4      UniRef90_Q1NW36      UniRef90_C0GRX0      UniRef90_B8DJ84      UniRef90_Q6ARG9      UniRef90_C1W154      UniRef90_C1UII8      UniRef90_UPI000      IEIVVCKIPTETVVATIKTALYTGHIGDGKIFVHAVENVHRISTGEEGYDALQD--VEMV
+UniRef90_C1T022      UniRef90_Q46G48      UniRef90_A2RJQ2      UniRef90_Q8KF33      UniRef90_B1HTS9      UniRef90_A2SPS9      UniRef90_C0EAH3      UniRef90_A7I8Z1      UniRef90_Q3AFZ0      UniRef90_A7I508      UniRef90_P51604      UniRef90_B0NXT3      UniRef90_A8YG01      UniRef90_C0BMJ9      UniRef90_Q466Y2      UniRef90_O26760      UniRef90_A0LYN2      UniRef90_C1YA75      UniRef90_A8KX44      UniRef90_C0EZB6      UniRef90_Q11P32      UniRef90_A7B6Y7      UniRef90_A7VSI5      UniRef90_A6G036      UniRef90_C0ES36      UniRef90_B5IHX8      UniRef90_B0MIE7      UniRef90_B4S395      UniRef90_P51254      UniRef90_P71524      UniRef90_A8JI83      UniRef90_B0CD03      UniRef90_B1QY06      UniRef90_Q30VL0      UniRef90_A0T2Q5      UniRef90_B3QXW9      UniRef90_B6YRQ4      UniRef90_B0MJN0      UniRef90_C2C1T3      UniRef90_C1VTA2      UniRef90_A3XNG5      UniRef90_P71525      UniRef90_Q46C91      UniRef90_B7BWA8      UniRef90_Q7UGU6      UniRef90_A3HVG6      UniRef90_A0YMH7      UniRef90_Q46A23      UniRef90_B4VJP7      UniRef90_B1QUW3      UniRef90_A5N1U1      UniRef90_A9D1T1      UniRef90_A6LUZ0      UniRef90_A6LUZ1      UniRef90_B8GEW5      UniRef90_C1FI34      UniRef90_C1TA34      UniRef90_C1T440      UniRef90_A9A2H4      UniRef90_Q97ME3      
+QUERY                UniRef90_C0EK60      UniRef90_Q21P81      UniRef90_Q47GI8      UniRef90_B9ZJ79      UniRef90_B5FAN6      UniRef90_B5ZIL8      UniRef90_B4RVM6      UniRef90_B2FHB8      UniRef90_P21193      UniRef90_B5JS45      UniRef90_Q07UM0      UniRef90_Q2RVB4      UniRef90_A9IPV3      UniRef90_A4TZT2      UniRef90_B3DVA4      UniRef90_C1STD4      UniRef90_A7HGG9      UniRef90_A9BCF1      UniRef90_B4U911      UniRef90_B1ZSX2      UniRef90_Q7X1L4      UniRef90_Q1NW36      UniRef90_C0GRX0      UniRef90_B8DJ84      UniRef90_Q6ARG9      UniRef90_C1W154      UniRef90_C1UII8      UniRef90_UPI000      IEESRLDEIVDVIIDSCSTDTIGDGK--------------------------
+UniRef90_C1T022      UniRef90_Q46G48      UniRef90_A2RJQ2      UniRef90_Q8KF33      UniRef90_B1HTS9      UniRef90_A2SPS9      UniRef90_C0EAH3      UniRef90_A7I8Z1      UniRef90_Q3AFZ0      UniRef90_A7I508      UniRef90_P51604      UniRef90_B0NXT3      UniRef90_A8YG01      UniRef90_C0BMJ9      UniRef90_Q466Y2      UniRef90_O26760      UniRef90_A0LYN2      UniRef90_C1YA75      UniRef90_A8KX44      UniRef90_C0EZB6      UniRef90_Q11P32      UniRef90_A7B6Y7      UniRef90_A7VSI5      UniRef90_A6G036      UniRef90_C0ES36      UniRef90_B5IHX8      UniRef90_B0MIE7      UniRef90_B4S395      UniRef90_P51254      UniRef90_P71524      UniRef90_A8JI83      UniRef90_B0CD03      UniRef90_B1QY06      UniRef90_Q30VL0      UniRef90_A0T2Q5      UniRef90_B3QXW9      UniRef90_B6YRQ4      UniRef90_B0MJN0      UniRef90_C2C1T3      UniRef90_C1VTA2      UniRef90_A3XNG5      UniRef90_P71525      UniRef90_Q46C91      UniRef90_B7BWA8      UniRef90_Q7UGU6      UniRef90_A3HVG6      UniRef90_A0YMH7      UniRef90_Q46A23      UniRef90_B4VJP7      UniRef90_B1QUW3      UniRef90_A5N1U1      UniRef90_A9D1T1      UniRef90_A6LUZ0      UniRef90_A6LUZ1      UniRef90_B8GEW5      UniRef90_C1FI34      UniRef90_C1TA34      UniRef90_C1T440      UniRef90_A9A2H4      UniRef90_Q97ME3      
diff --git a/jpred/tests/alignment.fasta b/jpred/tests/alignment.fasta

new file mode 100644 (file)

index 0000000..aa2b047
--- /dev/null
+++ b/jpred/tests/alignment.fasta
@@ -0,0 +1,267 @@
+>QUERY/1-116
+MKKIEAIIRPFKLDEVKIALVNAGIVGMTVSEVRGFGRQKGQTERYRGSEYTVEFLQKLK
+LEIVVEDAQVDTVIDKIVAAARTGENGDGKIFVSPVDQTIRIRTGEKNADAISAWS
+>UniRef90_C0EK60/1-112
+MKKIEAIIKPFKLDDVREILTEIGITGMTVSEVKGFGRQKGHTEIYRGAEYAVDFLPKVK
+IELVLADDKVDQAVDAILETAHSGKIGDGKIFIYPVEEAIRIRTGERSEAAL----
+>UniRef90_Q21P81/1-112
+MKLITAVIKPFKLDDVRNALSEIGVQGMTVTEVKGFGRQKGHTELYRGAEYVIDFLPKVK
+LELVLGDELIDQAVEAISKAAQTGKIGDGKIFITPCEEVIRIRTGETGPEAV----
+>UniRef90_Q47GI8/1-112
+MKKIEAIIKPFKLDEVREALSEIGISGLTVTEVKGFGRQKGHTELYRGAEYVVDFLPKIK
+IEIVVNSNNVEPAIDAIIKAARTGKIGDGKIFVMPVEQVVRIRTGETDEAAV----
+>UniRef90_B9ZJ79/1-112
+MKKIEAIIKPFKLEDVREALTEMGIAGMTATEVQGFGRQKGHTELYRGAEYVVDFLPKVK
+LELVVDDDRVDACIDAIVKASRTGKIGDGKIFVSDMARVVRIRTGEEGSEAL----
+>UniRef90_B5FAN6/1-112
+MKIINAIIKPFKLDDVREALADAGVDGMTVSEVKGFGRQKGHTELYRGAEYQVDFLPKVK
+LEIAVQAEGVDRIVEAISKAAHTGKIGDGKIFVYDLQQAVRIRTGETDTEAL----
+>UniRef90_B5ZIL8/1-112
+MKKIEAIIKPFKLDEVKDALHEIGLMGISVTEAKGFGRQKGHTELYRGAEYIVDFLPKVK
+LEIVCADNLVDRAVETIMAAARTGRIGDGKIFILPVEDVIRIRTGEHGEEAI----
+>UniRef90_B4RVM6/1-112
+MKKIEAIIKPFKMDDVREALAEVGIAGMTVSEVKGFGRQKGHTELYRGAEYQVDFLPKIK
+IELVLDDDRVEQAVEAIQSSAKTGKIGDGKIFVYSVESAVRIRTGEQNEDAI----
+>UniRef90_B2FHB8/1-112
+MKLISAIIRPFKLDEVREALSDAGVSGITVTEVKGFGRQKGHTELYRGAEYVVDFLPKIK
+IETVVTDERADAVIEAIQSSAGTGKIGDGKIFVTAVEQVIRIRTGEIGADAL----
+>UniRef90_P21193/1-112
+MKKIEAIIKPFKLDEVKEALHEVGIKGITVTEAKGFGRQKGHTELYRGAEYVVDFLPKVK
+IEVVMEDSLVERAIEAIQQAAHTGRIGDGKIFVTPVEEVVRIRTGEKGGDAI----
+>UniRef90_B5JS45/1-112
+MKKIEAVIKPFKLDDVRDALADIGVSGMTVTEVKGFGRQKGHTETYRGAEYVVDFLPKLK
+LEIVVAEKDADACVESITNAAKTGQIGDGKIFVSDVERTIRIRTGEEDESAI----
+>UniRef90_Q07UM0/1-112
+MKLVVAIIKPFKLDEVRQALTDVGVHGMTVTEVKGYGRQRGHTEIYRGAEYLVNFLPKLR
+IEVGVADTLVDKAVEAITRSARTGQIGDGKIFVTPLDHALRIRTGETNADAL----
+>UniRef90_Q2RVB4/1-112
+MKFVIAITKPFKLDEVREALGALGIQGMTVTEVKGFGRQKGQTEVYRGAEYVVNFLPKVK
+IELAVPDNLLDQVVETIQSTAQTGKIGDGKIFVFDLGEAVRIRTGERGEEAL----
+>UniRef90_A9IPV3/1-112
+MKLIIAIIKPFKLDEVRVALSGIGVQGLTVTEVKGFGRQKGHTELYRGAEYAVDFLPKLR
+VEAAVPDHLVDQVIDVIEQAARTGKIGDGKIFTAPLEQVIRIRTGESGEAAL----
+>UniRef90_A4TZT2/1-112
+MKLIIAIIKPFKLDEVREALTQLGIQGLTATEVKGFGRQKGQTEIYRAAEYVVSFVPKIK
+IELVVNDDVVDRAVEAIQAAARTDKIGDGKIFVMDVAHALRIRTGEADTEAL----
+>UniRef90_B3DVA4/1-110
+--KIEAIIKPFKLEEVKEALTEIGIAGLTVTEVKGFGRQKGHTEIYRGSEYTVDFLPKVK
+VEIVLTEDILPKAVEAIIKSAKTGKIGDGKIFVLPVSEAIRIRTEEKGENAI----
+>UniRef90_C1STD4/1-112
+MRKIEIITRPFKLDEVKQRLTKLGIQGMTVTEVKGFGRQRGHKEIYRGAEYQVDFVAKVK
+IEIVVDDGLVEEIVSTVQEGARTGKVGDGKIFISPVDNAVRIRTGESGAEAL----
+>UniRef90_A7HGG9/1-112
+MKRIEAIIRPSKLEDVRRLLSHPWISAMTVSEVRGAGRQKGHAELYRGAEYVIDLIPKLK
+LEIVLPDPLVDRVVADLESWLRTGRIGDGKIFVEPLDDAVRVRTGERGEDAL----
+>UniRef90_A9BCF1/1-112
+MKKIEAIIRPFKLEDVKVALVNSGIVGMTVSEVRGFGRQKGQVERYRGSEFTVEFLQKLK
+IEIVVADESVPTVLTAIAEAAKTGEIGDGKIFISPVESVVRIRTGELDGSAL----
+>UniRef90_B4U911/1-112
+MKKVEAIIKPFKLDEVKDALVEIGIGGMTITEVKGFGQQKGKTEIYRATEYVIDFLPKIK
+IETVVKDSEVEKVVQTILKSAQTGKVGDGKIFIYNVEETVRIRTGERGESAI----
+>UniRef90_B1ZSX2/1-112
+MKLVTAIIKPFKLEEIKAALAEIQVEGMTVTEVKGFGRQKGHTEIYRGTEYTVDFLPKVR
+IEILAADESVPKILETIISTAKTGKIGDGKIFISAAEDVVRIRTDERGEAAL----
+>UniRef90_Q7X1L4/1-112
+MKKVEAIIKPFKLDAVKEAVTALGVYGMTVTEVKGYGQQKGHTEQYRGAEYVVEFITKIK
+VEIVVADAKVSPVLEAIRRTAMSNSIGDGKVFVSPVETALRIRTGETGDAAL----
+>UniRef90_Q1NW36/1-112
+MKKVEAIIKPFKLDAVKEAVTALGIHGMTVSEVKGFGRQKGHTEVYRGAEYVVDFVAKIK
+VEIVVESEKASLLVETITQAARNGNIGDGKIFVTPVESVCRIRTGELDQDAI----
+>UniRef90_C0GRX0/1-112
+MKKLEIITRPFKVEAVKEALAGMGIKGMTLTDVKGFGRQMGHKEIYRGAEYDVDFLPKVK
+IEVILDDANVDQAVEAAIKAARTDKVGDGKIFVYSVENAIRIRTGESGDEAI----
+>UniRef90_B8DJ84/1-112
+MKKIEAIIKPFKLDAVKDALIGIGVFGLTVTEVRGYGRQRGHVETYRGLEYEVQFNSKLK
+IETVVPDGMSDQVVKAITTAARTGSIGDGKIFISSLEEVIRIRTGEEGTDAI----
+>UniRef90_Q6ARG9/1-112
+MKKIEAIIKPFKLEEIKEALTELAITGMTISEVKGYGRQKGHKEMYRGAEYSIDFNPKLK
+IELVVRAEIADKVVEKIRLAARTGKIGDGKIFVLPIEEVVRVRTGEQGREAI----
+>UniRef90_C1W154/1-112
+MKLVTAIIQPHRLDAVKSALEAAGIRGMTVSEASGYGRQKGHTEVYRGAEYTIDLVPKIR
+LEILVDDPDAHRVGEVITQAAHTGRIGDGKVWTIPVDSVTRVRTGEEGPSAL----
+>UniRef90_C1UII8/1-112
+MKLVTAIVKPFKLDDVKNALELIGIAGLTVSEVQGFGRQRGHTEVYRGAEYQVDFVPKVR
+IEVVVGEIEAARVVDAIVEAASTGQIGDGKVWVTTIDEIVRVRTGERGADAL----
+>UniRef90_UPI000/1-118
+--KVTVITNQAKFYQLKTSLEAIGITGMTVIQVLGFGIQKGQPEYYRGNPIEATLLPKVK
+MKKIEAIIRPEAFQTLKDGLSAVGISGLTVTEAAGCGKQQGKKGVFRGTSFEIQLV
+>UniRef90_C1T022/1-113
+MKLVIAYIRPECLNAVKQELYAKKIYNMSVTNVLGSGRQKGFTETYRGVVMEVNLLKKLR
+LEIGVNDDFAEQAVEAINAGARTGKEGDGVIFVLECAAAVRIRTQETGPAAMG---
+>UniRef90_Q46G48/1-112
+MKYIIAMIRPERLDAVKRELQKLEVNRLTVSSVAGYGAQKGHLEIYRATEHEANLLEKVK
+IEIAVEDHFLKSVIEAIKTGAKDGYIGSGKIFVLPLENVIRIRTNETGPEAL----
+>UniRef90_A2RJQ2/1-112
+MKKIEAIIRTDKLEDLKKALSDNGVHGMTVSQVLGYGEQKGFAEYVRGQRIETTLLSKIK
+IEIVSIDEKVDQIVNVITKAVRTGEVGDGKIFIQPVERVIRIRTSEEDAQAL----
+>UniRef90_Q8KF33/1-112
+MKKIEAIIRTSQYEAVKKALHEIDIDFFTWWDVTGQGNDKKHTEIYRGTVRDTSYISRRY
+LSIVVRDVNLQKTVDCLIKNARTGEVGDGKIFVSDIEQSYRIRTGESGDESL----
+>UniRef90_B1HTS9/1-112
+MKKIEVIIRPEVFGAVRDGLAQQGIAGLSVSEIAGCGRQLGRTGLFRGNTYEIEFLPKLK
+LEMIVDDSKVDGIVEILLREAATGKVGDGKIFIYPVEQAIRIRTKEVGSIAV----
+>UniRef90_A2SPS9/1-106
+MKMITAIIRPEKVDEVLNALEQNNIPGVTITEVLGRGEQGGVCLQYRAGKMQVKTLPKTK
+LEIVVPDKDVDTLIKVIREHARTGKKGDGRIFVLPVEAAAWVRTDE----------
+>UniRef90_C0EAH3/1-111
+--KLVIVTRQSKFEELKAAMNAIEVTGMTVTQVIGCGTQKGATEFYRGVPVEMNLLPKIK
+VEIVVCRVPVRTVIETAKKVLYTGHYGDGKIFVYDIENVVKVRTGEEGCAALQ---
+>UniRef90_A7I8Z1/1-104
+--MISAIIKPERFEFVKKALEDKGYVSMTITEVKGRGEQKGISLEYRGGKMTVDLLPKVK
+IEIVIRDKDLEDVIATLTGAARTGKIGDGKIFVIPVEKSIRIRTGD----------
+>UniRef90_Q3AFZ0/1-114
+MKKIEALIRPQKLGEVKEALNKLGISGMTVTEVVGCGRQKGQKEIYRGIEYEINLLPKVK
+IEIVTVDEKVEEIIKIISESARTGAIGDGKIFISEVLDAVRIRTGERGTAAITS--
+>UniRef90_A7I508/1-106
+MKLVIALIRPERFGAVKKALEDKGYIGMTTAEAKGRGAQKGIALVYRGGRLTIDILVKVR
+IEIVSHDRDVEDLVSTIRESAWTGANGDGRIFVLPVEQAIRIRTGE----------
+>UniRef90_P51604/1-112
+MKEIIAIIRPNKINRTKEVLDALGFSSMTANAVFGRGRQKAIVGELREEEGSMRYIPKRM
+ISLVVPDEDASLVVESIMKVNKTGQIGDGKIFVCPIEDAVRVRTKESGEDAI----
+>UniRef90_B0NXT3/1-112
+--KINAIVREEKFEDVKEALNKIGVNGITVSQVMGCGAQKGFTEVIRGTKVDMMMRPKIK
+FEIVVSSEEWERTIEAIQKSAFTGEVGDGKIFSYEVRNVVKIRTGERDVDALQD--
+>UniRef90_A8YG01/1-96
+----------------KIALVNAGIVGMTVSEVRGFGRQKGQSERYRGSEYTVEFLQKLK
+IEIVVEDKQVDMVVDKLISAARTGEIGDGKIFISPVEQIVRIRTGEKDLQAI----
+>UniRef90_C0BMJ9/1-112
+MKKVEAIIRKSKFDDVKKALHAIEVNFFSYWDVTGVGNEKQ-GHVYRGISYSTSDIQRRI
+LSIVISDEFLEPTINAILEAACTGNVGDGKIFVSDVQDAYRIRTRENGKAGIN---
+>UniRef90_Q466Y2/1-112
+MCKIEAIIKPMKLHEVKDALEEAGYPSLTVTDVKGRGQQKGIVQQWRGKKYCVDLLPKTK
+IEIAAPEDKIEEIIKIIQSSAYTGEIGDGKIFVTPIETVVRIRTGERNGDAL----
+>UniRef90_O26760/1-112
+MKEIVAIIRPEKLEEVKNALEAAGCHGMTVTEVRGRGRQLGITESYRGRDYRIDLLPKTK
+IEIVVNDEDVDTVVETIVKSAQTGDIGDGKIFISGVDEVVRIRTGESGKKAV----
+>UniRef90_A0LYN2/1-111
+MKKIEAIIRKSEFDETKEALHSIGVTFFSYWDVTGVGNEKV-GHVYRGVSYSTADIQRRY
+LSIVVTDSFVEKTVETLLKAAHTGKVGDGKIFILPVEEAYRIRTKEKGGESL----
+>UniRef90_C1YA75/1-112
+MKVVTAVIKPFKLDEVRAALLAFGVQGMTVSESSGYGRQRGHTEVYRGAEYTVELLPKVR
+VEILVDDEDAEDVVDVIVRAARTGKIGDGKVWTQPVETVIRVRTGERGPEAL----
+>UniRef90_A8KX44/1-112
+MKLVTAIVRPHRVDDVRAALTTYGVHGITVSQVTGFGLEMWRTQTYRGNAFHDESTSNIR
+LELVVADSDAPDVVNVIRRTAASTSSGAGKIWVLPVEGLARIRTGERGADAL----
+>UniRef90_C0EZB6/1-110
+--KLTIMCKEDRFAILKDAMSQIGVTGMTVSHVMGCGTQKGKTGQYRGVKIDMNLLPQLQ
+VDIVVSTVPPELVVEAAKKALYTGEYGDGKIFLYDVENVVRIRTNETGIAAL----
+>UniRef90_Q11P32/1-112
+MKKIEAIVKPSKLKAIQAGLIKIGIPCMTVVPVKGVGLQQGFPEIYRGTEKSIVLLSKVM
+IICVVSDENLEKCIDVIIETGSEGKVGDGKIFVYDVLDAIRMRTRTRGDDAI----
+>UniRef90_A7B6Y7/1-112
+--KIEAIVREEKFEQVKSALQDIQVNGVTISQVMGYGTQRGYTEIVRGSEVDILLHPKIK
+FEVVVSSEEWEQTISAIQKAAFTGEVGDGKIFSYEIRSAVKIRTKETGYNAVQS--
+>UniRef90_A7VSI5/1-111
+--KVVILFNQDKFIELKDAMNAIGVTGMTVIHVMGCGVQKGNTRYYRGVKLDIVLLPKIK
+LEIVVSKVPVQTV-DTARKVLYTGNIGDGKIFIYDVENVIKVRTGAEGYYALQD--
+>UniRef90_A6G036/1-110
+--KVEAMIRPFKLDDVKERLTELEVGGMTVTEVKGFGRTGGKTEFYRGSAYVIDFVPKIK
+IEVVVPAARSEEVIAAIREVAASDRIGDGKIFVTPVLEAVRIRTDERGESAL----
+>UniRef90_C0ES36/1-115
+MIKVEAYVREDKFEDVKAALNAIGVNGLTVSQVMGCGIQRGYKEIVRGMQVDMQMQPKIK
+FEIVVSSEEWEKTIEAIEKAAYTGEPGDGKIFTYEIRHAQKIRTKETGYDAIQAT-
+>UniRef90_B5IHX8/1-113
+MKQIQAIVRPEKLDAVKDALVEIGINGITVTAVQGFGKQMGHTEVYRGVKVEAKLLTKMQ
+ITSVVTDQAVDQVVQAILTAARTGEIGDGKIVITPVENAIRIRTGESGDSTLA---
+>UniRef90_B0MIE7/1-103
+---------PEKLTDVKHILEAHKVSGLMISNIMGYGNQKGFTQKYRGNELNSNLLPKIK
+VESVMPEEVVEKVTKDIVNTVRTGEFGDGKIFISPVEEAIRIRTGETGKDAL----
+>UniRef90_B4S395/1-111
+MKLITAIIQEDKLDQVREALIQANISRISVSRISGHGRQE-DIDIYRGRKIAPNLRPKIK
+LEIAVNEEFVDVAIDTIVDSARSGEIGDGKIFVTPLEQCVRIRTNERGGSAI----
+>UniRef90_P51254/1-112
+MKKIEAIIRPFKLNEVKLALVKGGIGGMTVVKVSGFGRQKGQTERYKGSEYSIDIIDKIK
+IEIIVSDDKVNSITEIIIKTAKTGEIGDGKIFISDVEQVIRIRTNDLNSAAL----
+>UniRef90_P71524/1-104
+MKMIRAVVRPSKAEEVVDALAESGCVALTKMDVIGRGKQKG----IKIDQIYYDELPKTM
+LMLVVEDDAAENVIELITKTAYTGSFGDGKIFVSPVDEAYTVRTRSCG--------
+>UniRef90_A8JI83/1-105
+---IEAIFRPWRLPFVIDTLSKYGIRGLTNTPVKGVGVQGGSRERYAGTEFGPNLVDKEK
+LDIVVSRAQVDAVVRLVAASAYTGEIGDGKIFVHPVAEVVRIRTAETG--------
+>UniRef90_B0CD03/1-107
+MRTITAFIRPQQCDQVKLVLVQLGIIDITLSDVKGFGRQQGSLQQYRGSDAEIRLHRKLK
+VEVKVDEEMVAPVVEKITFAARTGQVGDGKIFVSPLQKVVQVRTGEE---------
+>UniRef90_B1QY06/1-112
+MKRIEAIIRPSKLEEIKEALKNNNINGVTISQVMGCGKQLGWKEYHRGTELITNVLPKIE
+VKMVIEDSKVEEVIEIISSIAKTGEVGDGKIFVIDICDCVRIRTGERGNEAL----
+>UniRef90_Q30VL0/1-106
+MKLLIAYIRPEKLSTVKKALYARGIYAMSVTNALGSGQQKGFTETYRGIVTEVNLLKKVR
+IEVGVPADKAEDALAALQTGAHTGREGDGIIFVQDVARTVRVRTGE----------
+>UniRef90_A0T2Q5/1-113
+MKEVLAIIRPNMVSKTGKALEAVGFPAMTVIRCFGRGKEKGYIDAGEKLGMRMKYIPKRM
+ISIVVDDADVPFVVGIIMKVNRTGKPGDGKIFVLPVEEAIRIRTGEFGVEAIG---
+>UniRef90_B3QXW9/1-112
+MKEITAIIRINKMNETKKALIKAGISSFTASRVLGRGKGQVHYDLLKGAAEGYELVSKRY
+LVVVVNDNMLQPTIDAIISANQTGKPGDGKIFVSTIEDAVRVRTGETGSAIL----
+>UniRef90_B6YRQ4/1-111
+MKKIEAIIRKTRFDEVKEALLEADIEWFSYSDVRGVGKARQ-ERIYRGVVYDTSSIERIQ
+INLVVRDINVEKAIKAIEKSAHTGEVGDGRIFVSTIDNAYSIRTGEQGDETL----
+>UniRef90_B0MJN0/1-114
+MTKVDIIANQEKFEVLKHALSSIGITGMTVSHVMGCGMQKGSTEFYRGVPVDARLLPKMK
+VEIVVCKVPVEKVVEVAKNALYTGKIGDGKIFVYDVENVIKVRTGEEAYEALQD--
+>UniRef90_C2C1T3/1-112
+--KIEIITRPNRFDVFQKALKEIGVSGLTVTKAVGTGLEKGMIELYRGTIKENNVHERMK
+VEIVVSTVPVEAVLEVVKNTLRTGEPGDGKVFVYPLSDVIKISTGEHGVAALQD--
+>UniRef90_C1VTA2/1-110
+--LVMAIVRPEKLSDVKAALAEAGAPSLTVTQVSGRGSQPAKTGQWRGEEYVIDLHQKIK
+VECVVEPEDADDVVEAIREGANTGEKGDGKIFVLPVFDAVQVRTGDRGTDAI----
+>UniRef90_A3XNG5/1-112
+MKKIEAIIRKSKFTAVKKALHDKGVNFFSYWDVTGLGNEKE-GHVYRGVSYSTSDIQRRY
+LSIVVNDDFEQAAVAAILDAAATGEVGDGKIFVSDVQDAYRIRTGKKGPDTLN---
+>UniRef90_P71525/1-111
+MKEIIAIIRPSKMAQTKTVLEGLGFPAMTANRVLGRGKQKAIVGELGFEV-DMRYIPKTM
+LTLIVPDEDASLVVEAIMKVNKSGQYGDGKIFVCPIEDIITVRTSERGEAAI----
+>UniRef90_Q46C91/1-112
+MKEIIAIIRPKKVVPTKEALEKLGVPSLTAIPVFGRGKQKGIATELDIAGRRMEYIPKRL
+FSIVTRNEDVDTIIETIMKVNQTGDIGDGRIFICPVDDAIRVRTDEHGDNAL----
+>UniRef90_B7BWA8/1-112
+MKEVMIILRPKMYFPTKDALDQAGFHSMTIREIIGRGKCPVHYDYDEGAPVKHRLVAKRM
+IDMFVRDEDLQKLIDTVVEVNKTNHAGDGKIFVLPVNDAIRVRTGEKGIEAI----
+>UniRef90_Q7UGU6/1-112
+MKLIIAIVQPSKLDAIKEALTRVEVHRLTVVDCQGFGRQRGQTGSMRGRDYGVSLLRKVQ
+LQIGVNEEFVQPTIDAIGRSGESGEIGDGKIFVLPMDDCVRIRTGERGGEAI----
+>UniRef90_A3HVG6/1-112
+MKKIEAIIRTSRFEQIHSCVAGLGVKFLTFYEVKGMGLEHAKQQTYRGVAYEPTYIPRTK
+LEIVTVDELVEPVINCILTEGKTGEVGDGKIFVYDVLEAHRIRNNDQGEQAL----
+>UniRef90_A0YMH7/1-112
+MKRIEALIRPVQFDSVVTALVEAGIVGMSVTNVRGYGRQKGQTESYRGVKHVIEFHPKMK
+LEIVVEDEVCEFVVEKLVEAAQTGQIGDGKIFIQSMEHIIRTRTGESDLEAL----
+>UniRef90_Q46A23/1-112
+MKYIIAMIRPEKLDSVKKEIQKIGAHGLTVSSISGYGAQGGHLNVDRTKKYEANLLDKVK
+IEIAVKDEFLQTTVEAIERGSKDGYIGSGKIFVLPLENVMRIRTKETGNDAL----
+>UniRef90_B4VJP7/1-90
+----------------MKALLDAGYPAVTKVDVFGRGKQRG----LKIGNVLYDELPKAL
+LMVVVPDTEKEFVIRAILSSARTGAEGDGKIFVSPVEEVYTISSGKTDSS------
+>UniRef90_B1QUW3/1-103
+MYLVRAIIRTEKVNGVLSELVDAGFPQVTKMDVFGRGKQKG----IQVGEVHYDELPKEM
+LLIVVKDEDKDDVVRVIMKNSRTGEYGDGKIFISKVDTAYTISTGKE---------
+>UniRef90_A5N1U1/1-112
+MKEIMAVIRMNMVGKTKKALAENGFPSITCKDVLGRGKKMVEEELHRIEDESYRLISKRL
+IWILAKDEDVKKIADIIIDINQTGHPGDGKIFVTKVTDVVRIRTGETQDEAV----
+>UniRef90_A9D1T1/1-65
+-----------------------------------------------GAEYMVDFLPKVK
+IELVIQDELLDRAIEVIVDTARTGKIGDGKIFVTEIERVIRIRTGEENEEAV----
+>UniRef90_A6LUZ0/1-104
+MYMIRAIIRPERVSTVLSELLDAGFPEVTKMAVYGRGKQKG----IKVGEVYYDELPKEM
+LLIAVKDEDKDDVIKVIIRNSRTGEFGDGKIFVAPIEEVYTVSSGKSG--------
+>UniRef90_A6LUZ1/1-112
+MKEVMCIIRLNKVNKTKEALAEAGFPSITCRKVLGRGKKSALVEAYMETGEVPRLIPKRF
+ITLVVKDDEVKTVVDTVISVNSTGTPGDGKIFVLPVEEVYRVRDGQIGEEAI----
+>UniRef90_B8GEW5/1-112
+MKEIMAIVRMKKTGVTKRALVETGVAGFTALKVLGRGKLVEDTAVIEPAEQEVRFFPRRL
+FTILAHDEDVPRIVEAITKVNITEKVGDGIILVLPVDDAVRVRTGESGDAAI----
+>UniRef90_C1FI34/1-109
+--QVRAMVRPWRLSGVIDALNKYGIRGLTTYTVHGAGVQIGTVERYAGSTFDANLVEKVV
+VEIVVVREQCQEVVDVIVDAAQTGEIGDGKIFLSPVHDIVRIRTGEVGAAA-----
+>UniRef90_C1TA34/1-112
+MKEIIAIIRMNKVNITKKALADVGVCGLHAIKVMGRGKQLGVREEIDGLSGGTRLIPKRL
+LTILARDEDVKKIVDTVIKVNQEGNKGDGRIFIAPVIDAYRVRTAEKGEAAV----
+>UniRef90_C1T440/1-112
+MKEVIAVIRMNMMNKTKKALQDAGVVAFFAHEAFGRGKGLVDVKPLEGARKGIELYPKRM
+LTVVVTDDLVPEVVKVITDTNKTGQPGDGKIFVLPMIDAVRVRTGEKGAKSI----
+>UniRef90_A9A2H4/1-100
+MKKVEAIVNESAQNAVIDAMRKVGISGVTVSKVQGQGAQD--------PPLVGDFFSRVL
+IVCVVDDPKLDEILDAIAGAACTGTKGDGKVYVSDICDALDICTKKRG--------
+>UniRef90_Q97ME3/1-112
+MKEIMAIIRMNMVEKTKEALLKGGNPAITCLKVLGRGRQKVDIEDYKMAEELSELISKRL
+IIILAKDEDVKEIVDEIIEVNRTGNPGDGKIFVINIADAMRIRTEETGDMAI----
diff --git a/jpred/tests/alignment.msf b/jpred/tests/alignment.msf

new file mode 100644 (file)

index 0000000..8fc3fec
--- /dev/null
+++ b/jpred/tests/alignment.msf
@@ -0,0 +1,372 @@
+
+NoName   MSF: 89  Type: P  Thu Sep 12 11:18:51 2013  Check: 00 ..
+
+ Name: QUERY/1-116            Len:    116  Check:  2040  Weight:  1.00
+ Name: UniRef90_C0EK60/1-112  Len:    116  Check:  9351  Weight:  1.00
+ Name: UniRef90_Q21P81/1-112  Len:    116  Check:  1134  Weight:  1.00
+ Name: UniRef90_Q47GI8/1-112  Len:    116  Check:  2374  Weight:  1.00
+ Name: UniRef90_B9ZJ79/1-112  Len:    116  Check:  961  Weight:  1.00
+ Name: UniRef90_B5FAN6/1-112  Len:    116  Check:  1022  Weight:  1.00
+ Name: UniRef90_B5ZIL8/1-112  Len:    116  Check:  8167  Weight:  1.00
+ Name: UniRef90_B4RVM6/1-112  Len:    116  Check:  1597  Weight:  1.00
+ Name: UniRef90_B2FHB8/1-112  Len:    116  Check:  923  Weight:  1.00
+ Name: UniRef90_P21193/1-112  Len:    116  Check:  482  Weight:  1.00
+ Name: UniRef90_B5JS45/1-112  Len:    116  Check:  1397  Weight:  1.00
+ Name: UniRef90_Q07UM0/1-112  Len:    116  Check:  2895  Weight:  1.00
+ Name: UniRef90_Q2RVB4/1-112  Len:    116  Check:  2212  Weight:  1.00
+ Name: UniRef90_A9IPV3/1-112  Len:    116  Check:  462  Weight:  1.00
+ Name: UniRef90_A4TZT2/1-112  Len:    116  Check:  565  Weight:  1.00
+ Name: UniRef90_B3DVA4/1-110  Len:    116  Check:  6589  Weight:  1.00
+ Name: UniRef90_C1STD4/1-112  Len:    116  Check:  1985  Weight:  1.00
+ Name: UniRef90_A7HGG9/1-112  Len:    116  Check:  1807  Weight:  1.00
+ Name: UniRef90_A9BCF1/1-112  Len:    116  Check:  3971  Weight:  1.00
+ Name: UniRef90_B4U911/1-112  Len:    116  Check:  2943  Weight:  1.00
+ Name: UniRef90_B1ZSX2/1-112  Len:    116  Check:  431  Weight:  1.00
+ Name: UniRef90_Q7X1L4/1-112  Len:    116  Check:  4218  Weight:  1.00
+ Name: UniRef90_Q1NW36/1-112  Len:    116  Check:  2273  Weight:  1.00
+ Name: UniRef90_C0GRX0/1-112  Len:    116  Check:  8886  Weight:  1.00
+ Name: UniRef90_B8DJ84/1-112  Len:    116  Check:  3489  Weight:  1.00
+ Name: UniRef90_Q6ARG9/1-112  Len:    116  Check:  1309  Weight:  1.00
+ Name: UniRef90_C1W154/1-112  Len:    116  Check:  5141  Weight:  1.00
+ Name: UniRef90_C1UII8/1-112  Len:    116  Check:  3484  Weight:  1.00
+ Name: UniRef90_UPI000/1-118  Len:    120  Check:  2455  Weight:  1.00
+ Name: UniRef90_C1T022/1-113  Len:    116  Check:  6949  Weight:  1.00
+ Name: UniRef90_Q46G48/1-112  Len:    116  Check:  1089  Weight:  1.00
+ Name: UniRef90_A2RJQ2/1-112  Len:    116  Check:  4156  Weight:  1.00
+ Name: UniRef90_Q8KF33/1-112  Len:    116  Check:  5483  Weight:  1.00
+ Name: UniRef90_B1HTS9/1-112  Len:    116  Check:  1444  Weight:  1.00
+ Name: UniRef90_A2SPS9/1-106  Len:    116  Check:  9791  Weight:  1.00
+ Name: UniRef90_C0EAH3/1-111  Len:    116  Check:  3946  Weight:  1.00
+ Name: UniRef90_A7I8Z1/1-104  Len:    116  Check:  5077  Weight:  1.00
+ Name: UniRef90_Q3AFZ0/1-114  Len:    116  Check:  441  Weight:  1.00
+ Name: UniRef90_A7I508/1-106  Len:    116  Check:  7683  Weight:  1.00
+ Name: UniRef90_P51604/1-112  Len:    116  Check:  1016  Weight:  1.00
+ Name: UniRef90_B0NXT3/1-112  Len:    116  Check:  7617  Weight:  1.00
+ Name: UniRef90_A8YG01/1-96   Len:    116  Check:  8909  Weight:  1.00
+ Name: UniRef90_C0BMJ9/1-112  Len:    116  Check:  4293  Weight:  1.00
+ Name: UniRef90_Q466Y2/1-112  Len:    116  Check:  4079  Weight:  1.00
+ Name: UniRef90_O26760/1-112  Len:    116  Check:  3785  Weight:  1.00
+ Name: UniRef90_A0LYN2/1-111  Len:    116  Check:  804  Weight:  1.00
+ Name: UniRef90_C1YA75/1-112  Len:    116  Check:  6435  Weight:  1.00
+ Name: UniRef90_A8KX44/1-112  Len:    116  Check:  4614  Weight:  1.00
+ Name: UniRef90_C0EZB6/1-110  Len:    116  Check:  179  Weight:  1.00
+ Name: UniRef90_Q11P32/1-112  Len:    116  Check:  3377  Weight:  1.00
+ Name: UniRef90_A7B6Y7/1-112  Len:    116  Check:  676  Weight:  1.00
+ Name: UniRef90_A7VSI5/1-111  Len:    116  Check:  5848  Weight:  1.00
+ Name: UniRef90_A6G036/1-110  Len:    116  Check:  8450  Weight:  1.00
+ Name: UniRef90_C0ES36/1-115  Len:    116  Check:  1154  Weight:  1.00
+ Name: UniRef90_B5IHX8/1-113  Len:    116  Check:  7450  Weight:  1.00
+ Name: UniRef90_B0MIE7/1-103  Len:    116  Check:  2131  Weight:  1.00
+ Name: UniRef90_B4S395/1-111  Len:    116  Check:  8256  Weight:  1.00
+ Name: UniRef90_P51254/1-112  Len:    116  Check:  2366  Weight:  1.00
+ Name: UniRef90_P71524/1-104  Len:    116  Check:  2281  Weight:  1.00
+ Name: UniRef90_A8JI83/1-105  Len:    116  Check:  84  Weight:  1.00
+ Name: UniRef90_B0CD03/1-107  Len:    116  Check:  5133  Weight:  1.00
+ Name: UniRef90_B1QY06/1-112  Len:    116  Check:  1778  Weight:  1.00
+ Name: UniRef90_Q30VL0/1-106  Len:    116  Check:  975  Weight:  1.00
+ Name: UniRef90_A0T2Q5/1-113  Len:    116  Check:  3875  Weight:  1.00
+ Name: UniRef90_B3QXW9/1-112  Len:    116  Check:  2335  Weight:  1.00
+ Name: UniRef90_B6YRQ4/1-111  Len:    116  Check:  320  Weight:  1.00
+ Name: UniRef90_B0MJN0/1-114  Len:    116  Check:  2340  Weight:  1.00
+ Name: UniRef90_C2C1T3/1-112  Len:    116  Check:  7783  Weight:  1.00
+ Name: UniRef90_C1VTA2/1-110  Len:    116  Check:  8079  Weight:  1.00
+ Name: UniRef90_A3XNG5/1-112  Len:    116  Check:  4563  Weight:  1.00
+ Name: UniRef90_P71525/1-111  Len:    116  Check:  6955  Weight:  1.00
+ Name: UniRef90_Q46C91/1-112  Len:    116  Check:  9645  Weight:  1.00
+ Name: UniRef90_B7BWA8/1-112  Len:    116  Check:  484  Weight:  1.00
+ Name: UniRef90_Q7UGU6/1-112  Len:    116  Check:  2772  Weight:  1.00
+ Name: UniRef90_A3HVG6/1-112  Len:    116  Check:  3382  Weight:  1.00
+ Name: UniRef90_A0YMH7/1-112  Len:    116  Check:  3597  Weight:  1.00
+ Name: UniRef90_Q46A23/1-112  Len:    116  Check:  2151  Weight:  1.00
+ Name: UniRef90_B4VJP7/1-90   Len:    116  Check:  2329  Weight:  1.00
+ Name: UniRef90_B1QUW3/1-103  Len:    116  Check:  8604  Weight:  1.00
+ Name: UniRef90_A5N1U1/1-112  Len:    116  Check:  2241  Weight:  1.00
+ Name: UniRef90_A9D1T1/1-65   Len:    116  Check:  8348  Weight:  1.00
+ Name: UniRef90_A6LUZ0/1-104  Len:    116  Check:  2978  Weight:  1.00
+ Name: UniRef90_A6LUZ1/1-112  Len:    116  Check:  3539  Weight:  1.00
+ Name: UniRef90_B8GEW5/1-112  Len:    116  Check:  751  Weight:  1.00
+ Name: UniRef90_C1FI34/1-109  Len:    116  Check:  3899  Weight:  1.00
+ Name: UniRef90_C1TA34/1-112  Len:    116  Check:  116  Weight:  1.00
+ Name: UniRef90_C1T440/1-112  Len:    116  Check:  857  Weight:  1.00
+ Name: UniRef90_A9A2H4/1-100  Len:    116  Check:  7883  Weight:  1.00
+ Name: UniRef90_Q97ME3/1-112  Len:    116  Check:  8399  Weight:  1.00
+
+//
+
+
+                       1                                                   50
+QUERY/1-116            MKKIEAIIRP FKLDEVKIAL VNAGIVGMTV SEVRGFGRQK GQTERYRGSE 
+UniRef90_C0EK60/1-112  MKKIEAIIKP FKLDDVREIL TEIGITGMTV SEVKGFGRQK GHTEIYRGAE 
+UniRef90_Q21P81/1-112  MKLITAVIKP FKLDDVRNAL SEIGVQGMTV TEVKGFGRQK GHTELYRGAE 
+UniRef90_Q47GI8/1-112  MKKIEAIIKP FKLDEVREAL SEIGISGLTV TEVKGFGRQK GHTELYRGAE 
+UniRef90_B9ZJ79/1-112  MKKIEAIIKP FKLEDVREAL TEMGIAGMTA TEVQGFGRQK GHTELYRGAE 
+UniRef90_B5FAN6/1-112  MKIINAIIKP FKLDDVREAL ADAGVDGMTV SEVKGFGRQK GHTELYRGAE 
+UniRef90_B5ZIL8/1-112  MKKIEAIIKP FKLDEVKDAL HEIGLMGISV TEAKGFGRQK GHTELYRGAE 
+UniRef90_B4RVM6/1-112  MKKIEAIIKP FKMDDVREAL AEVGIAGMTV SEVKGFGRQK GHTELYRGAE 
+UniRef90_B2FHB8/1-112  MKLISAIIRP FKLDEVREAL SDAGVSGITV TEVKGFGRQK GHTELYRGAE 
+UniRef90_P21193/1-112  MKKIEAIIKP FKLDEVKEAL HEVGIKGITV TEAKGFGRQK GHTELYRGAE 
+UniRef90_B5JS45/1-112  MKKIEAVIKP FKLDDVRDAL ADIGVSGMTV TEVKGFGRQK GHTETYRGAE 
+UniRef90_Q07UM0/1-112  MKLVVAIIKP FKLDEVRQAL TDVGVHGMTV TEVKGYGRQR GHTEIYRGAE 
+UniRef90_Q2RVB4/1-112  MKFVIAITKP FKLDEVREAL GALGIQGMTV TEVKGFGRQK GQTEVYRGAE 
+UniRef90_A9IPV3/1-112  MKLIIAIIKP FKLDEVRVAL SGIGVQGLTV TEVKGFGRQK GHTELYRGAE 
+UniRef90_A4TZT2/1-112  MKLIIAIIKP FKLDEVREAL TQLGIQGLTA TEVKGFGRQK GQTEIYRAAE 
+UniRef90_B3DVA4/1-110  --KIEAIIKP FKLEEVKEAL TEIGIAGLTV TEVKGFGRQK GHTEIYRGSE 
+UniRef90_C1STD4/1-112  MRKIEIITRP FKLDEVKQRL TKLGIQGMTV TEVKGFGRQR GHKEIYRGAE 
+UniRef90_A7HGG9/1-112  MKRIEAIIRP SKLEDVRRLL SHPWISAMTV SEVRGAGRQK GHAELYRGAE 
+UniRef90_A9BCF1/1-112  MKKIEAIIRP FKLEDVKVAL VNSGIVGMTV SEVRGFGRQK GQVERYRGSE 
+UniRef90_B4U911/1-112  MKKVEAIIKP FKLDEVKDAL VEIGIGGMTI TEVKGFGQQK GKTEIYRATE 
+UniRef90_B1ZSX2/1-112  MKLVTAIIKP FKLEEIKAAL AEIQVEGMTV TEVKGFGRQK GHTEIYRGTE 
+UniRef90_Q7X1L4/1-112  MKKVEAIIKP FKLDAVKEAV TALGVYGMTV TEVKGYGQQK GHTEQYRGAE 
+UniRef90_Q1NW36/1-112  MKKVEAIIKP FKLDAVKEAV TALGIHGMTV SEVKGFGRQK GHTEVYRGAE 
+UniRef90_C0GRX0/1-112  MKKLEIITRP FKVEAVKEAL AGMGIKGMTL TDVKGFGRQM GHKEIYRGAE 
+UniRef90_B8DJ84/1-112  MKKIEAIIKP FKLDAVKDAL IGIGVFGLTV TEVRGYGRQR GHVETYRGLE 
+UniRef90_Q6ARG9/1-112  MKKIEAIIKP FKLEEIKEAL TELAITGMTI SEVKGYGRQK GHKEMYRGAE 
+UniRef90_C1W154/1-112  MKLVTAIIQP HRLDAVKSAL EAAGIRGMTV SEASGYGRQK GHTEVYRGAE 
+UniRef90_C1UII8/1-112  MKLVTAIVKP FKLDDVKNAL ELIGIAGLTV SEVQGFGRQR GHTEVYRGAE 
+UniRef90_UPI000/1-118  --KVTVITNQ AKFYQLKTSL EAIGITGMTV IQVLGFGIQK GQPEYYRGNP 
+UniRef90_C1T022/1-113  MKLVIAYIRP ECLNAVKQEL YAKKIYNMSV TNVLGSGRQK GFTETYRGVV 
+UniRef90_Q46G48/1-112  MKYIIAMIRP ERLDAVKREL QKLEVNRLTV SSVAGYGAQK GHLEIYRATE 
+UniRef90_A2RJQ2/1-112  MKKIEAIIRT DKLEDLKKAL SDNGVHGMTV SQVLGYGEQK GFAEYVRGQR 
+UniRef90_Q8KF33/1-112  MKKIEAIIRT SQYEAVKKAL HEIDIDFFTW WDVTGQGNDK KHTEIYRGTV 
+UniRef90_B1HTS9/1-112  MKKIEVIIRP EVFGAVRDGL AQQGIAGLSV SEIAGCGRQL GRTGLFRGNT 
+UniRef90_A2SPS9/1-106  MKMITAIIRP EKVDEVLNAL EQNNIPGVTI TEVLGRGEQG GVCLQYRAGK 
+UniRef90_C0EAH3/1-111  --KLVIVTRQ SKFEELKAAM NAIEVTGMTV TQVIGCGTQK GATEFYRGVP 
+UniRef90_A7I8Z1/1-104  --MISAIIKP ERFEFVKKAL EDKGYVSMTI TEVKGRGEQK GISLEYRGGK 
+UniRef90_Q3AFZ0/1-114  MKKIEALIRP QKLGEVKEAL NKLGISGMTV TEVVGCGRQK GQKEIYRGIE 
+UniRef90_A7I508/1-106  MKLVIALIRP ERFGAVKKAL EDKGYIGMTT AEAKGRGAQK GIALVYRGGR 
+UniRef90_P51604/1-112  MKEIIAIIRP NKINRTKEVL DALGFSSMTA NAVFGRGRQK AIVGELREEE 
+UniRef90_B0NXT3/1-112  --KINAIVRE EKFEDVKEAL NKIGVNGITV SQVMGCGAQK GFTEVIRGTK 
+UniRef90_A8YG01/1-96   ---------- ------KIAL VNAGIVGMTV SEVRGFGRQK GQSERYRGSE 
+UniRef90_C0BMJ9/1-112  MKKVEAIIRK SKFDDVKKAL HAIEVNFFSY WDVTGVGNEK Q-GHVYRGIS 
+UniRef90_Q466Y2/1-112  MCKIEAIIKP MKLHEVKDAL EEAGYPSLTV TDVKGRGQQK GIVQQWRGKK 
+UniRef90_O26760/1-112  MKEIVAIIRP EKLEEVKNAL EAAGCHGMTV TEVRGRGRQL GITESYRGRD 
+UniRef90_A0LYN2/1-111  MKKIEAIIRK SEFDETKEAL HSIGVTFFSY WDVTGVGNEK V-GHVYRGVS 
+UniRef90_C1YA75/1-112  MKVVTAVIKP FKLDEVRAAL LAFGVQGMTV SESSGYGRQR GHTEVYRGAE 
+UniRef90_A8KX44/1-112  MKLVTAIVRP HRVDDVRAAL TTYGVHGITV SQVTGFGLEM WRTQTYRGNA 
+UniRef90_C0EZB6/1-110  --KLTIMCKE DRFAILKDAM SQIGVTGMTV SHVMGCGTQK GKTGQYRGVK 
+UniRef90_Q11P32/1-112  MKKIEAIVKP SKLKAIQAGL IKIGIPCMTV VPVKGVGLQQ GFPEIYRGTE 
+UniRef90_A7B6Y7/1-112  --KIEAIVRE EKFEQVKSAL QDIQVNGVTI SQVMGYGTQR GYTEIVRGSE 
+UniRef90_A7VSI5/1-111  --KVVILFNQ DKFIELKDAM NAIGVTGMTV IHVMGCGVQK GNTRYYRGVK 
+UniRef90_A6G036/1-110  --KVEAMIRP FKLDDVKERL TELEVGGMTV TEVKGFGRTG GKTEFYRGSA 
+UniRef90_C0ES36/1-115  MIKVEAYVRE DKFEDVKAAL NAIGVNGLTV SQVMGCGIQR GYKEIVRGMQ 
+UniRef90_B5IHX8/1-113  MKQIQAIVRP EKLDAVKDAL VEIGINGITV TAVQGFGKQM GHTEVYRGVK 
+UniRef90_B0MIE7/1-103  ---------P EKLTDVKHIL EAHKVSGLMI SNIMGYGNQK GFTQKYRGNE 
+UniRef90_B4S395/1-111  MKLITAIIQE DKLDQVREAL IQANISRISV SRISGHGRQE -DIDIYRGRK 
+UniRef90_P51254/1-112  MKKIEAIIRP FKLNEVKLAL VKGGIGGMTV VKVSGFGRQK GQTERYKGSE 
+UniRef90_P71524/1-104  MKMIRAVVRP SKAEEVVDAL AESGCVALTK MDVIGRGKQK G----IKIDQ 
+UniRef90_A8JI83/1-105  ---IEAIFRP WRLPFVIDTL SKYGIRGLTN TPVKGVGVQG GSRERYAGTE 
+UniRef90_B0CD03/1-107  MRTITAFIRP QQCDQVKLVL VQLGIIDITL SDVKGFGRQQ GSLQQYRGSD 
+UniRef90_B1QY06/1-112  MKRIEAIIRP SKLEEIKEAL KNNNINGVTI SQVMGCGKQL GWKEYHRGTE 
+UniRef90_Q30VL0/1-106  MKLLIAYIRP EKLSTVKKAL YARGIYAMSV TNALGSGQQK GFTETYRGIV 
+UniRef90_A0T2Q5/1-113  MKEVLAIIRP NMVSKTGKAL EAVGFPAMTV IRCFGRGKEK GYIDAGEKLG 
+UniRef90_B3QXW9/1-112  MKEITAIIRI NKMNETKKAL IKAGISSFTA SRVLGRGKGQ VHYDLLKGAA 
+UniRef90_B6YRQ4/1-111  MKKIEAIIRK TRFDEVKEAL LEADIEWFSY SDVRGVGKAR Q-ERIYRGVV 
+UniRef90_B0MJN0/1-114  MTKVDIIANQ EKFEVLKHAL SSIGITGMTV SHVMGCGMQK GSTEFYRGVP 
+UniRef90_C2C1T3/1-112  --KIEIITRP NRFDVFQKAL KEIGVSGLTV TKAVGTGLEK GMIELYRGTI 
+UniRef90_C1VTA2/1-110  --LVMAIVRP EKLSDVKAAL AEAGAPSLTV TQVSGRGSQP AKTGQWRGEE 
+UniRef90_A3XNG5/1-112  MKKIEAIIRK SKFTAVKKAL HDKGVNFFSY WDVTGLGNEK E-GHVYRGVS 
+UniRef90_P71525/1-111  MKEIIAIIRP SKMAQTKTVL EGLGFPAMTA NRVLGRGKQK AIVGELGFEV 
+UniRef90_Q46C91/1-112  MKEIIAIIRP KKVVPTKEAL EKLGVPSLTA IPVFGRGKQK GIATELDIAG 
+UniRef90_B7BWA8/1-112  MKEVMIILRP KMYFPTKDAL DQAGFHSMTI REIIGRGKCP VHYDYDEGAP 
+UniRef90_Q7UGU6/1-112  MKLIIAIVQP SKLDAIKEAL TRVEVHRLTV VDCQGFGRQR GQTGSMRGRD 
+UniRef90_A3HVG6/1-112  MKKIEAIIRT SRFEQIHSCV AGLGVKFLTF YEVKGMGLEH AKQQTYRGVA 
+UniRef90_A0YMH7/1-112  MKRIEALIRP VQFDSVVTAL VEAGIVGMSV TNVRGYGRQK GQTESYRGVK 
+UniRef90_Q46A23/1-112  MKYIIAMIRP EKLDSVKKEI QKIGAHGLTV SSISGYGAQG GHLNVDRTKK 
+UniRef90_B4VJP7/1-90   ---------- ------MKAL LDAGYPAVTK VDVFGRGKQR G----LKIGN 
+UniRef90_B1QUW3/1-103  MYLVRAIIRT EKVNGVLSEL VDAGFPQVTK MDVFGRGKQK G----IQVGE 
+UniRef90_A5N1U1/1-112  MKEIMAVIRM NMVGKTKKAL AENGFPSITC KDVLGRGKKM VEEELHRIED 
+UniRef90_A9D1T1/1-65   ---------- ---------- ---------- ---------- -------GAE 
+UniRef90_A6LUZ0/1-104  MYMIRAIIRP ERVSTVLSEL LDAGFPEVTK MAVYGRGKQK G----IKVGE 
+UniRef90_A6LUZ1/1-112  MKEVMCIIRL NKVNKTKEAL AEAGFPSITC RKVLGRGKKS ALVEAYMETG 
+UniRef90_B8GEW5/1-112  MKEIMAIVRM KKTGVTKRAL VETGVAGFTA LKVLGRGKLV EDTAVIEPAE 
+UniRef90_C1FI34/1-109  --QVRAMVRP WRLSGVIDAL NKYGIRGLTT YTVHGAGVQI GTVERYAGST 
+UniRef90_C1TA34/1-112  MKEIIAIIRM NKVNITKKAL ADVGVCGLHA IKVMGRGKQL GVREEIDGLS 
+UniRef90_C1T440/1-112  MKEVIAVIRM NMMNKTKKAL QDAGVVAFFA HEAFGRGKGL VDVKPLEGAR 
+UniRef90_A9A2H4/1-100  MKKVEAIVNE SAQNAVIDAM RKVGISGVTV SKVQGQGAQD --------PP 
+UniRef90_Q97ME3/1-112  MKEIMAIIRM NMVEKTKEAL LKGGNPAITC LKVLGRGRQK VDIEDYKMAE 
+
+
+                       51                                                 100
+QUERY/1-116            YTVEFLQKLK LEIVVEDAQV DTVIDKIVAA ARTGENGDGK IFVSPVDQTI 
+UniRef90_C0EK60/1-112  YAVDFLPKVK IELVLADDKV DQAVDAILET AHSGKIGDGK IFIYPVEEAI 
+UniRef90_Q21P81/1-112  YVIDFLPKVK LELVLGDELI DQAVEAISKA AQTGKIGDGK IFITPCEEVI 
+UniRef90_Q47GI8/1-112  YVVDFLPKIK IEIVVNSNNV EPAIDAIIKA ARTGKIGDGK IFVMPVEQVV 
+UniRef90_B9ZJ79/1-112  YVVDFLPKVK LELVVDDDRV DACIDAIVKA SRTGKIGDGK IFVSDMARVV 
+UniRef90_B5FAN6/1-112  YQVDFLPKVK LEIAVQAEGV DRIVEAISKA AHTGKIGDGK IFVYDLQQAV 
+UniRef90_B5ZIL8/1-112  YIVDFLPKVK LEIVCADNLV DRAVETIMAA ARTGRIGDGK IFILPVEDVI 
+UniRef90_B4RVM6/1-112  YQVDFLPKIK IELVLDDDRV EQAVEAIQSS AKTGKIGDGK IFVYSVESAV 
+UniRef90_B2FHB8/1-112  YVVDFLPKIK IETVVTDERA DAVIEAIQSS AGTGKIGDGK IFVTAVEQVI 
+UniRef90_P21193/1-112  YVVDFLPKVK IEVVMEDSLV ERAIEAIQQA AHTGRIGDGK IFVTPVEEVV 
+UniRef90_B5JS45/1-112  YVVDFLPKLK LEIVVAEKDA DACVESITNA AKTGQIGDGK IFVSDVERTI 
+UniRef90_Q07UM0/1-112  YLVNFLPKLR IEVGVADTLV DKAVEAITRS ARTGQIGDGK IFVTPLDHAL 
+UniRef90_Q2RVB4/1-112  YVVNFLPKVK IELAVPDNLL DQVVETIQST AQTGKIGDGK IFVFDLGEAV 
+UniRef90_A9IPV3/1-112  YAVDFLPKLR VEAAVPDHLV DQVIDVIEQA ARTGKIGDGK IFTAPLEQVI 
+UniRef90_A4TZT2/1-112  YVVSFVPKIK IELVVNDDVV DRAVEAIQAA ARTDKIGDGK IFVMDVAHAL 
+UniRef90_B3DVA4/1-110  YTVDFLPKVK VEIVLTEDIL PKAVEAIIKS AKTGKIGDGK IFVLPVSEAI 
+UniRef90_C1STD4/1-112  YQVDFVAKVK IEIVVDDGLV EEIVSTVQEG ARTGKVGDGK IFISPVDNAV 
+UniRef90_A7HGG9/1-112  YVIDLIPKLK LEIVLPDPLV DRVVADLESW LRTGRIGDGK IFVEPLDDAV 
+UniRef90_A9BCF1/1-112  FTVEFLQKLK IEIVVADESV PTVLTAIAEA AKTGEIGDGK IFISPVESVV 
+UniRef90_B4U911/1-112  YVIDFLPKIK IETVVKDSEV EKVVQTILKS AQTGKVGDGK IFIYNVEETV 
+UniRef90_B1ZSX2/1-112  YTVDFLPKVR IEILAADESV PKILETIIST AKTGKIGDGK IFISAAEDVV 
+UniRef90_Q7X1L4/1-112  YVVEFITKIK VEIVVADAKV SPVLEAIRRT AMSNSIGDGK VFVSPVETAL 
+UniRef90_Q1NW36/1-112  YVVDFVAKIK VEIVVESEKA SLLVETITQA ARNGNIGDGK IFVTPVESVC 
+UniRef90_C0GRX0/1-112  YDVDFLPKVK IEVILDDANV DQAVEAAIKA ARTDKVGDGK IFVYSVENAI 
+UniRef90_B8DJ84/1-112  YEVQFNSKLK IETVVPDGMS DQVVKAITTA ARTGSIGDGK IFISSLEEVI 
+UniRef90_Q6ARG9/1-112  YSIDFNPKLK IELVVRAEIA DKVVEKIRLA ARTGKIGDGK IFVLPIEEVV 
+UniRef90_C1W154/1-112  YTIDLVPKIR LEILVDDPDA HRVGEVITQA AHTGRIGDGK VWTIPVDSVT 
+UniRef90_C1UII8/1-112  YQVDFVPKVR IEVVVGEIEA ARVVDAIVEA ASTGQIGDGK VWVTTIDEIV 
+UniRef90_UPI000/1-118  IEATLLPKVK MKKIEAIIRP EAFQTLKDGL SAVGISGLTV TEAAGCGKQQ 
+UniRef90_C1T022/1-113  MEVNLLKKLR LEIGVNDDFA EQAVEAINAG ARTGKEGDGV IFVLECAAAV 
+UniRef90_Q46G48/1-112  HEANLLEKVK IEIAVEDHFL KSVIEAIKTG AKDGYIGSGK IFVLPLENVI 
+UniRef90_A2RJQ2/1-112  IETTLLSKIK IEIVSIDEKV DQIVNVITKA VRTGEVGDGK IFIQPVERVI 
+UniRef90_Q8KF33/1-112  RDTSYISRRY LSIVVRDVNL QKTVDCLIKN ARTGEVGDGK IFVSDIEQSY 
+UniRef90_B1HTS9/1-112  YEIEFLPKLK LEMIVDDSKV DGIVEILLRE AATGKVGDGK IFIYPVEQAI 
+UniRef90_A2SPS9/1-106  MQVKTLPKTK LEIVVPDKDV DTLIKVIREH ARTGKKGDGR IFVLPVEAAA 
+UniRef90_C0EAH3/1-111  VEMNLLPKIK VEIVVCRVPV RTVIETAKKV LYTGHYGDGK IFVYDIENVV 
+UniRef90_A7I8Z1/1-104  MTVDLLPKVK IEIVIRDKDL EDVIATLTGA ARTGKIGDGK IFVIPVEKSI 
+UniRef90_Q3AFZ0/1-114  YEINLLPKVK IEIVTVDEKV EEIIKIISES ARTGAIGDGK IFISEVLDAV 
+UniRef90_A7I508/1-106  LTIDILVKVR IEIVSHDRDV EDLVSTIRES AWTGANGDGR IFVLPVEQAI 
+UniRef90_P51604/1-112  GSMRYIPKRM ISLVVPDEDA SLVVESIMKV NKTGQIGDGK IFVCPIEDAV 
+UniRef90_B0NXT3/1-112  VDMMMRPKIK FEIVVSSEEW ERTIEAIQKS AFTGEVGDGK IFSYEVRNVV 
+UniRef90_A8YG01/1-96   YTVEFLQKLK IEIVVEDKQV DMVVDKLISA ARTGEIGDGK IFISPVEQIV 
+UniRef90_C0BMJ9/1-112  YSTSDIQRRI LSIVISDEFL EPTINAILEA ACTGNVGDGK IFVSDVQDAY 
+UniRef90_Q466Y2/1-112  YCVDLLPKTK IEIAAPEDKI EEIIKIIQSS AYTGEIGDGK IFVTPIETVV 
+UniRef90_O26760/1-112  YRIDLLPKTK IEIVVNDEDV DTVVETIVKS AQTGDIGDGK IFISGVDEVV 
+UniRef90_A0LYN2/1-111  YSTADIQRRY LSIVVTDSFV EKTVETLLKA AHTGKVGDGK IFILPVEEAY 
+UniRef90_C1YA75/1-112  YTVELLPKVR VEILVDDEDA EDVVDVIVRA ARTGKIGDGK VWTQPVETVI 
+UniRef90_A8KX44/1-112  FHDESTSNIR LELVVADSDA PDVVNVIRRT AASTSSGAGK IWVLPVEGLA 
+UniRef90_C0EZB6/1-110  IDMNLLPQLQ VDIVVSTVPP ELVVEAAKKA LYTGEYGDGK IFLYDVENVV 
+UniRef90_Q11P32/1-112  KSIVLLSKVM IICVVSDENL EKCIDVIIET GSEGKVGDGK IFVYDVLDAI 
+UniRef90_A7B6Y7/1-112  VDILLHPKIK FEVVVSSEEW EQTISAIQKA AFTGEVGDGK IFSYEIRSAV 
+UniRef90_A7VSI5/1-111  LDIVLLPKIK LEIVVSKVPV QTV-DTARKV LYTGNIGDGK IFIYDVENVI 
+UniRef90_A6G036/1-110  YVIDFVPKIK IEVVVPAARS EEVIAAIREV AASDRIGDGK IFVTPVLEAV 
+UniRef90_C0ES36/1-115  VDMQMQPKIK FEIVVSSEEW EKTIEAIEKA AYTGEPGDGK IFTYEIRHAQ 
+UniRef90_B5IHX8/1-113  VEAKLLTKMQ ITSVVTDQAV DQVVQAILTA ARTGEIGDGK IVITPVENAI 
+UniRef90_B0MIE7/1-103  LNSNLLPKIK VESVMPEEVV EKVTKDIVNT VRTGEFGDGK IFISPVEEAI 
+UniRef90_B4S395/1-111  IAPNLRPKIK LEIAVNEEFV DVAIDTIVDS ARSGEIGDGK IFVTPLEQCV 
+UniRef90_P51254/1-112  YSIDIIDKIK IEIIVSDDKV NSITEIIIKT AKTGEIGDGK IFISDVEQVI 
+UniRef90_P71524/1-104  IYYDELPKTM LMLVVEDDAA ENVIELITKT AYTGSFGDGK IFVSPVDEAY 
+UniRef90_A8JI83/1-105  FGPNLVDKEK LDIVVSRAQV DAVVRLVAAS AYTGEIGDGK IFVHPVAEVV 
+UniRef90_B0CD03/1-107  AEIRLHRKLK VEVKVDEEMV APVVEKITFA ARTGQVGDGK IFVSPLQKVV 
+UniRef90_B1QY06/1-112  LITNVLPKIE VKMVIEDSKV EEVIEIISSI AKTGEVGDGK IFVIDICDCV 
+UniRef90_Q30VL0/1-106  TEVNLLKKVR IEVGVPADKA EDALAALQTG AHTGREGDGI IFVQDVARTV 
+UniRef90_A0T2Q5/1-113  MRMKYIPKRM ISIVVDDADV PFVVGIIMKV NRTGKPGDGK IFVLPVEEAI 
+UniRef90_B3QXW9/1-112  EGYELVSKRY LVVVVNDNML QPTIDAIISA NQTGKPGDGK IFVSTIEDAV 
+UniRef90_B6YRQ4/1-111  YDTSSIERIQ INLVVRDINV EKAIKAIEKS AHTGEVGDGR IFVSTIDNAY 
+UniRef90_B0MJN0/1-114  VDARLLPKMK VEIVVCKVPV EKVVEVAKNA LYTGKIGDGK IFVYDVENVI 
+UniRef90_C2C1T3/1-112  KENNVHERMK VEIVVSTVPV EAVLEVVKNT LRTGEPGDGK VFVYPLSDVI 
+UniRef90_C1VTA2/1-110  YVIDLHQKIK VECVVEPEDA DDVVEAIREG ANTGEKGDGK IFVLPVFDAV 
+UniRef90_A3XNG5/1-112  YSTSDIQRRY LSIVVNDDFE QAAVAAILDA AATGEVGDGK IFVSDVQDAY 
+UniRef90_P71525/1-111  -DMRYIPKTM LTLIVPDEDA SLVVEAIMKV NKSGQYGDGK IFVCPIEDII 
+UniRef90_Q46C91/1-112  RRMEYIPKRL FSIVTRNEDV DTIIETIMKV NQTGDIGDGR IFICPVDDAI 
+UniRef90_B7BWA8/1-112  VKHRLVAKRM IDMFVRDEDL QKLIDTVVEV NKTNHAGDGK IFVLPVNDAI 
+UniRef90_Q7UGU6/1-112  YGVSLLRKVQ LQIGVNEEFV QPTIDAIGRS GESGEIGDGK IFVLPMDDCV 
+UniRef90_A3HVG6/1-112  YEPTYIPRTK LEIVTVDELV EPVINCILTE GKTGEVGDGK IFVYDVLEAH 
+UniRef90_A0YMH7/1-112  HVIEFHPKMK LEIVVEDEVC EFVVEKLVEA AQTGQIGDGK IFIQSMEHII 
+UniRef90_Q46A23/1-112  YEANLLDKVK IEIAVKDEFL QTTVEAIERG SKDGYIGSGK IFVLPLENVM 
+UniRef90_B4VJP7/1-90   VLYDELPKAL LMVVVPDTEK EFVIRAILSS ARTGAEGDGK IFVSPVEEVY 
+UniRef90_B1QUW3/1-103  VHYDELPKEM LLIVVKDEDK DDVVRVIMKN SRTGEYGDGK IFISKVDTAY 
+UniRef90_A5N1U1/1-112  ESYRLISKRL IWILAKDEDV KKIADIIIDI NQTGHPGDGK IFVTKVTDVV 
+UniRef90_A9D1T1/1-65   YMVDFLPKVK IELVIQDELL DRAIEVIVDT ARTGKIGDGK IFVTEIERVI 
+UniRef90_A6LUZ0/1-104  VYYDELPKEM LLIAVKDEDK DDVIKVIIRN SRTGEFGDGK IFVAPIEEVY 
+UniRef90_A6LUZ1/1-112  EVPRLIPKRF ITLVVKDDEV KTVVDTVISV NSTGTPGDGK IFVLPVEEVY 
+UniRef90_B8GEW5/1-112  QEVRFFPRRL FTILAHDEDV PRIVEAITKV NITEKVGDGI ILVLPVDDAV 
+UniRef90_C1FI34/1-109  FDANLVEKVV VEIVVVREQC QEVVDVIVDA AQTGEIGDGK IFLSPVHDIV 
+UniRef90_C1TA34/1-112  GGTRLIPKRL LTILARDEDV KKIVDTVIKV NQEGNKGDGR IFIAPVIDAY 
+UniRef90_C1T440/1-112  KGIELYPKRM LTVVVTDDLV PEVVKVITDT NKTGQPGDGK IFVLPMIDAV 
+UniRef90_A9A2H4/1-100  LVGDFFSRVL IVCVVDDPKL DEILDAIAGA ACTGTKGDGK VYVSDICDAL 
+UniRef90_Q97ME3/1-112  ELSELISKRL IIILAKDEDV KEIVDEIIEV NRTGNPGDGK IFVINIADAM 
+
+
+                       101                                                150
+QUERY/1-116            RIRTGEKNAD AISAWS 
+UniRef90_C0EK60/1-112  RIRTGERSEA AL---- 
+UniRef90_Q21P81/1-112  RIRTGETGPE AV---- 
+UniRef90_Q47GI8/1-112  RIRTGETDEA AV---- 
+UniRef90_B9ZJ79/1-112  RIRTGEEGSE AL---- 
+UniRef90_B5FAN6/1-112  RIRTGETDTE AL---- 
+UniRef90_B5ZIL8/1-112  RIRTGEHGEE AI---- 
+UniRef90_B4RVM6/1-112  RIRTGEQNED AI---- 
+UniRef90_B2FHB8/1-112  RIRTGEIGAD AL---- 
+UniRef90_P21193/1-112  RIRTGEKGGD AI---- 
+UniRef90_B5JS45/1-112  RIRTGEEDES AI---- 
+UniRef90_Q07UM0/1-112  RIRTGETNAD AL---- 
+UniRef90_Q2RVB4/1-112  RIRTGERGEE AL---- 
+UniRef90_A9IPV3/1-112  RIRTGESGEA AL---- 
+UniRef90_A4TZT2/1-112  RIRTGEADTE AL---- 
+UniRef90_B3DVA4/1-110  RIRTEEKGEN AI---- 
+UniRef90_C1STD4/1-112  RIRTGESGAE AL---- 
+UniRef90_A7HGG9/1-112  RVRTGERGED AL---- 
+UniRef90_A9BCF1/1-112  RIRTGELDGS AL---- 
+UniRef90_B4U911/1-112  RIRTGERGES AI---- 
+UniRef90_B1ZSX2/1-112  RIRTDERGEA AL---- 
+UniRef90_Q7X1L4/1-112  RIRTGETGDA AL---- 
+UniRef90_Q1NW36/1-112  RIRTGELDQD AI---- 
+UniRef90_C0GRX0/1-112  RIRTGESGDE AI---- 
+UniRef90_B8DJ84/1-112  RIRTGEEGTD AI---- 
+UniRef90_Q6ARG9/1-112  RVRTGEQGRE AI---- 
+UniRef90_C1W154/1-112  RVRTGEEGPS AL---- 
+UniRef90_C1UII8/1-112  RVRTGERGAD AL---- 
+UniRef90_UPI000/1-118  GKKGVFRGTS FEIQLV 
+UniRef90_C1T022/1-113  RIRTQETGPA AMG--- 
+UniRef90_Q46G48/1-112  RIRTNETGPE AL---- 
+UniRef90_A2RJQ2/1-112  RIRTSEEDAQ AL---- 
+UniRef90_Q8KF33/1-112  RIRTGESGDE SL---- 
+UniRef90_B1HTS9/1-112  RIRTKEVGSI AV---- 
+UniRef90_A2SPS9/1-106  WVRTDE---- ------ 
+UniRef90_C0EAH3/1-111  KVRTGEEGCA ALQ--- 
+UniRef90_A7I8Z1/1-104  RIRTGD---- ------ 
+UniRef90_Q3AFZ0/1-114  RIRTGERGTA AITS-- 
+UniRef90_A7I508/1-106  RIRTGE---- ------ 
+UniRef90_P51604/1-112  RVRTKESGED AI---- 
+UniRef90_B0NXT3/1-112  KIRTGERDVD ALQD-- 
+UniRef90_A8YG01/1-96   RIRTGEKDLQ AI---- 
+UniRef90_C0BMJ9/1-112  RIRTRENGKA GIN--- 
+UniRef90_Q466Y2/1-112  RIRTGERNGD AL---- 
+UniRef90_O26760/1-112  RIRTGESGKK AV---- 
+UniRef90_A0LYN2/1-111  RIRTKEKGGE SL---- 
+UniRef90_C1YA75/1-112  RVRTGERGPE AL---- 
+UniRef90_A8KX44/1-112  RIRTGERGAD AL---- 
+UniRef90_C0EZB6/1-110  RIRTNETGIA AL---- 
+UniRef90_Q11P32/1-112  RMRTRTRGDD AI---- 
+UniRef90_A7B6Y7/1-112  KIRTKETGYN AVQS-- 
+UniRef90_A7VSI5/1-111  KVRTGAEGYY ALQD-- 
+UniRef90_A6G036/1-110  RIRTDERGES AL---- 
+UniRef90_C0ES36/1-115  KIRTKETGYD AIQAT- 
+UniRef90_B5IHX8/1-113  RIRTGESGDS TLA--- 
+UniRef90_B0MIE7/1-103  RIRTGETGKD AL---- 
+UniRef90_B4S395/1-111  RIRTNERGGS AI---- 
+UniRef90_P51254/1-112  RIRTNDLNSA AL---- 
+UniRef90_P71524/1-104  TVRTRSCG-- ------ 
+UniRef90_A8JI83/1-105  RIRTAETG-- ------ 
+UniRef90_B0CD03/1-107  QVRTGEE--- ------ 
+UniRef90_B1QY06/1-112  RIRTGERGNE AL---- 
+UniRef90_Q30VL0/1-106  RVRTGE---- ------ 
+UniRef90_A0T2Q5/1-113  RIRTGEFGVE AIG--- 
+UniRef90_B3QXW9/1-112  RVRTGETGSA IL---- 
+UniRef90_B6YRQ4/1-111  SIRTGEQGDE TL---- 
+UniRef90_B0MJN0/1-114  KVRTGEEAYE ALQD-- 
+UniRef90_C2C1T3/1-112  KISTGEHGVA ALQD-- 
+UniRef90_C1VTA2/1-110  QVRTGDRGTD AI---- 
+UniRef90_A3XNG5/1-112  RIRTGKKGPD TLN--- 
+UniRef90_P71525/1-111  TVRTSERGEA AI---- 
+UniRef90_Q46C91/1-112  RVRTDEHGDN AL---- 
+UniRef90_B7BWA8/1-112  RVRTGEKGIE AI---- 
+UniRef90_Q7UGU6/1-112  RIRTGERGGE AI---- 
+UniRef90_A3HVG6/1-112  RIRNNDQGEQ AL---- 
+UniRef90_A0YMH7/1-112  RTRTGESDLE AL---- 
+UniRef90_Q46A23/1-112  RIRTKETGND AL---- 
+UniRef90_B4VJP7/1-90   TISSGKTDSS ------ 
+UniRef90_B1QUW3/1-103  TISTGKE--- ------ 
+UniRef90_A5N1U1/1-112  RIRTGETQDE AV---- 
+UniRef90_A9D1T1/1-65   RIRTGEENEE AV---- 
+UniRef90_A6LUZ0/1-104  TVSSGKSG-- ------ 
+UniRef90_A6LUZ1/1-112  RVRDGQIGEE AI---- 
+UniRef90_B8GEW5/1-112  RVRTGESGDA AI---- 
+UniRef90_C1FI34/1-109  RIRTGEVGAA A----- 
+UniRef90_C1TA34/1-112  RVRTAEKGEA AV---- 
+UniRef90_C1T440/1-112  RVRTGEKGAK SI---- 
+UniRef90_A9A2H4/1-100  DICTKKRG-- ------ 
+UniRef90_Q97ME3/1-112  RIRTEETGDM AI---- 
+
+
diff --git a/jpred/tests/d16vpa_.fas b/jpred/tests/d16vpa_.fas

new file mode 100644 (file)

index 0000000..6d1b0f6
--- /dev/null
+++ b/jpred/tests/d16vpa_.fas
@@ -0,0 +1,2 @@
+>d16vpa_ d.180.1.1 (A:) Conserved core of transcriptional regulatory protein vp16 {Herpes simplex virus type 1 [TaxId: 10298]}
+SRMPSPPMPVPPAALFNRLLDDLGFSAGPALCTMLDTWNEDLFSALPTNADLYRECKFLSTLPSDVVEWGDAYVPERTQIDIRAHGDVAFPTLPATRDGLGLYYEALSRFFHAELRAREESYRTVLANFCSALYRYLRASVRQLHRQAHMRGRDRDLGEMLRATIADRYYRETARLARVLFLHLYLFLTREILWAAYAEQMMRPDLFDCLCCDLESWRQLAGLFQPFMFVNGALTVRGVPIEARRLRELNHIREHLNLPLVRSAATEEPGAPLTTPPTLHGNQARASGYFMVLIRAKLDSYSSFTTSPSEAVMREHAYSRAPTKNNYGSTIEGLLDLPDDDAPEEAGLAAPRLSFL
diff --git a/jpred/tests/d1b3aa_.fas b/jpred/tests/d1b3aa_.fas

new file mode 100644 (file)

index 0000000..6e761aa
--- /dev/null
+++ b/jpred/tests/d1b3aa_.fas
@@ -0,0 +1,2 @@
+>d1b3aa_ d.9.1.1 (A:) RANTES (regulated upon activation, normal T-cell expressed and secreted) {Human (Homo sapiens) [TaxId: 9606]}
+PYSSDTTPCCFAYIARPLPRAHIKEYFYTSGKCSNPAVVFVTRKNRQVCANPEKKWVREYINSLEMS
diff --git a/jpred/tests/todo.bash b/jpred/tests/todo.bash

new file mode 100755 (executable)

index 0000000..cdb54ff
--- /dev/null
+++ b/jpred/tests/todo.bash
@@ -0,0 +1,29 @@
+#define path to BLOSUM files
+setenv BLASTMAT /home/asherstnev/Projects/Jpred.project/jpred/branches/portable/data/blast
+ln -s /data/UNIREFdb databases
+
+####################################################################################################
+#  test of main binaries
+#
+# 1 core PHIBLAST check ()
+# 1 core PHIBLAST check ()
+../bin/blastpgp -e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -d /home/asherstnev/Projects/Jpred.project/jpred/branches/portable/tests/databases/uniref90.filt -i d16vpa_.fasta -Q test.test.profile -o test.test.blas
+# multi-core (-a3) PHIBLAST check
+../bin/blastpgp -a4 -e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -d /home/asherstnev/Projects/Jpred.project/jpred/branches/portable/tests/databases/uniref90.filt -i d16vpa_.fasta -Q test.test.profile -o test.test.blas
+
+####################################################################################################
+#  test of x86_64 binaries
+#
+# 1 core PHIBLAST check ()
+../x86_64/blastpgp -e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -d /home/asherstnev/Projects/Jpred.project/jpred/branches/portable/tests/databases/uniref90.filt -i d16vpa_.fasta -Q test.test.profile -o test.test.blas
+# multi-core (-a3) PHIBLAST check
+../x86_64/blastpgp -a4 -e0.05 -h0.01 -m6 -b10000 -v10000 -j3 -d /home/asherstnev/Projects/Jpred.project/jpred/branches/portable/tests/databases/uniref90.filt -i d16vpa_.fasta -Q test.test.profile -o test.test.blas
+
+
+####################################################################################################
+../jpred.pl -seq d16vpa_.fas    -o d16vpa_ -dbname ported_db -ncpu 4 -debug
+../jpred.pl -seq jp_WFEaCtl.seq -o jp_WFEaCtl -dbname ported_db -ncpu 4 -debug
+../jpred.pl -seq T-state1.fas -o T-state1.res -dbname ported_db -ncpu 4 -debug
+../jpred.pl -seq T-state2.fas -o T-state2.res -dbname ported_db -ncpu 4 -debug
+
+./webscripts/fasta2concise < d16vpa_.res.align > d16vpa_.res.align.csv
diff --git a/jpred/bin/blastpgp b/jpred/x86_64/blastpgp

similarity index 100%

rename from jpred/bin/blastpgp

rename to jpred/x86_64/blastpgp
diff --git a/jpred/bin/fastacmd b/jpred/x86_64/fastacmd

similarity index 100%

rename from jpred/bin/fastacmd

rename to jpred/x86_64/fastacmd
diff --git a/jpred/bin/hmmbuild b/jpred/x86_64/hmmbuild

similarity index 100%

rename from jpred/bin/hmmbuild

rename to jpred/x86_64/hmmbuild
diff --git a/jpred/bin/hmmconvert b/jpred/x86_64/hmmconvert

similarity index 100%

rename from jpred/bin/hmmconvert

rename to jpred/x86_64/hmmconvert
diff --git a/jpred/bin/jnet b/jpred/x86_64/jnet

similarity index 100%

rename from jpred/bin/jnet

rename to jpred/x86_64/jnet
diff --git a/jpred/bin/oc b/jpred/x86_64/oc

similarity index 100%

rename from jpred/bin/oc

rename to jpred/x86_64/oc
diff --git a/jpred/bin/pairwise b/jpred/x86_64/pairwise

similarity index 100%

rename from jpred/bin/pairwise

rename to jpred/x86_64/pairwise
author	Sasha Sherstnev <a.sherstnev@dundee.ac.uk>
	Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)
committer	Sasha Sherstnev <a.sherstnev@dundee.ac.uk>
	Mon, 18 Nov 2013 14:48:07 +0000 (14:48 +0000)
jpred/data/blast/BLOSUM45	[new file with mode: 0755]	patch \| blob
jpred/data/blast/BLOSUM62	[new file with mode: 0755]	patch \| blob
jpred/data/blast/BLOSUM80	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSat.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSchoth.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSgc.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KShopp.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSkyte.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSpcc.mat	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSpur.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/KSpyr.flt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/PAM30	[new file with mode: 0755]	patch \| blob
jpred/data/blast/PAM70	[new file with mode: 0755]	patch \| blob
jpred/data/blast/asn2ff.prt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/bstdt.val	[new file with mode: 0755]	patch \| blob
jpred/data/blast/featdef.val	[new file with mode: 0755]	patch \| blob
jpred/data/blast/gc.val	[new file with mode: 0755]	patch \| blob
jpred/data/blast/humrep.fsa	[new file with mode: 0755]	patch \| blob
jpred/data/blast/lineages.txt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/makerpt.prt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/objprt.prt	[new file with mode: 0755]	patch \| blob
jpred/data/blast/pubkey.enc	[new file with mode: 0755]	patch \| blob
jpred/data/blast/seqcode.val	[new file with mode: 0755]	patch \| blob
jpred/data/blast/sequin.hlp	[new file with mode: 0755]	patch \| blob
jpred/data/blast/sgmlbb.ent	[new file with mode: 0755]	patch \| blob
jpred/data/blast/taxlist.txt	[new file with mode: 0755]	patch \| blob
jpred/data/coils/new.mat	[new file with mode: 0755]	patch \| blob
jpred/i686/blastpgp	[new file with mode: 0755]	patch \| blob
jpred/i686/fastacmd	[new file with mode: 0755]	patch \| blob
jpred/i686/hmmbuild	[new file with mode: 0755]	patch \| blob
jpred/i686/hmmconvert	[new file with mode: 0755]	patch \| blob
jpred/i686/jnet	[new file with mode: 0755]	patch \| blob
jpred/i686/oc	[new file with mode: 0755]	patch \| blob
jpred/i686/pairwise	[new file with mode: 0755]	patch \| blob
jpred/jpred	[deleted file]	patch \| blob \| history
jpred/jpred.pl	[new file with mode: 0755]	patch \| blob
jpred/jpred_jabaws.pl	[new file with mode: 0755]	patch \| blob
jpred/lib/BLC.pm		patch \| blob \| history
jpred/lib/DSSP/SCOP.pm		patch \| blob \| history
jpred/lib/Index/EMBOSS.pm		patch \| blob \| history
jpred/lib/Index/FastaCMD.pm		patch \| blob \| history
jpred/lib/Jpred.pm		patch \| blob \| history
jpred/lib/OC.pm		patch \| blob \| history
jpred/lib/PSIBLAST.pm		patch \| blob \| history
jpred/lib/PSIBLAST/Run.pm		patch \| blob \| history
jpred/lib/Pairwise.pm		patch \| blob \| history
jpred/lib/Paths.pm		patch \| blob \| history
jpred/lib/Profile/Jnet.pm		patch \| blob \| history
jpred/lib/Read.pm		patch \| blob \| history
jpred/lib/Sequence/File.pm		patch \| blob \| history
jpred/lib/Utils.pm		patch \| blob \| history
jpred/lib/Write.pm		patch \| blob \| history
jpred/tests/SCOP175B_nr.fas	[new file with mode: 0644]	patch \| blob
jpred/tests/T-state1.fas	[new file with mode: 0644]	patch \| blob
jpred/tests/T-state2.fas	[new file with mode: 0644]	patch \| blob
jpred/tests/alignment.clustal	[new file with mode: 0644]	patch \| blob
jpred/tests/alignment.fasta	[new file with mode: 0644]	patch \| blob
jpred/tests/alignment.msf	[new file with mode: 0644]	patch \| blob
jpred/tests/d16vpa_.fas	[new file with mode: 0644]	patch \| blob
jpred/tests/d1b3aa_.fas	[new file with mode: 0644]	patch \| blob
jpred/tests/todo.bash	[new file with mode: 0755]	patch \| blob
jpred/x86_64/blastpgp	[moved from jpred/bin/blastpgp with 100% similarity]	patch \| blob \| history
jpred/x86_64/fastacmd	[moved from jpred/bin/fastacmd with 100% similarity]	patch \| blob \| history
jpred/x86_64/hmmbuild	[moved from jpred/bin/hmmbuild with 100% similarity]	patch \| blob \| history
jpred/x86_64/hmmconvert	[moved from jpred/bin/hmmconvert with 100% similarity]	patch \| blob \| history
jpred/x86_64/jnet	[moved from jpred/bin/jnet with 100% similarity]	patch \| blob \| history
jpred/x86_64/oc	[moved from jpred/bin/oc with 100% similarity]	patch \| blob \| history
jpred/x86_64/pairwise	[moved from jpred/bin/pairwise with 100% similarity]	patch \| blob \| history