in progress
[jalview.git] / forester / resources / phyloxml_schema / 1.10 / phyloxml.xsd
index 525bc69..9388f03 100644 (file)
@@ -16,7 +16,7 @@
 <!--                                                             -->\r
 <!-- www.phyloxml.org                                            -->\r
 <!-- Version: 1.16                                               -->\r
-<!-- Last modified: 2013.09.29 by Christian M Zmasek             -->\r
+<!-- Last modified: 2013.09.30 by Christian  Zmasek              -->\r
 <!--                                                             -->\r
 <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:phy="http://www.phyloxml.org"\r
    targetNamespace="http://www.phyloxml.org" elementFormDefault="qualified" attributeFormDefault="unqualified">\r
@@ -85,7 +85,6 @@
          <xs:element name="confidence" type="phy:Confidence" minOccurs="0" maxOccurs="unbounded"/>\r
          <xs:element name="width" type="xs:double" minOccurs="0"/>\r
          <xs:element name="color" type="phy:BranchColor" minOccurs="0"/>\r
-         <xs:element name="node_id" type="phy:Id" minOccurs="0"/>\r
          <xs:element name="taxonomy" type="phy:Taxonomy" minOccurs="0" maxOccurs="unbounded"/>\r
          <xs:element name="sequence" type="phy:Sequence" minOccurs="0" maxOccurs="unbounded"/>\r
          <xs:element name="events" type="phy:Events" minOccurs="0"/>\r
    </xs:complexType>\r
    <xs:simpleType name="TaxonomyCode">\r
       <xs:restriction base="xs:token">\r
-         <xs:pattern value="[A-Z0-9]{3,5}"/>\r
+         <xs:pattern value="([A-Z9][A-Z]{2}[A-Z0-9]{2})|RAT|PIG|PEA"/>\r
       </xs:restriction>\r
    </xs:simpleType>\r
    <xs:simpleType name="Rank">\r
    <xs:complexType name="Sequence">\r
       <xs:annotation>\r
          <xs:documentation> Element Sequence is used to represent a molecular sequence (Protein, DNA, RNA) associated\r
-            with a node. 'symbol' is a short (maximal 30 characters) symbol of the sequence (e.g. 'ACTM') whereas\r
-            'name' is used for the full name (e.g. 'muscle Actin'). 'location' is used for the location of a sequence on\r
-            a genome/chromosome. The actual sequence can be stored with the 'mol_seq' element. Attribute 'type' is used\r
-            to indicate the type of sequence ('dna', 'rna', or 'protein'). One intended use for 'id_ref' is to link a\r
-            sequence to a taxonomy (via the taxonomy's 'id_source') in case of multiple sequences and taxonomies per\r
-            node. </xs:documentation>\r
+            with a node. 'symbol' is a short (maximal 20 characters) symbol of the sequence (e.g. 'ACTM') whereas\r
+            'name' is used for the full name (e.g. 'muscle Actin'). 'gene_name' can be used when protein and gene names differ.\r
+            'location' is used for the location of a sequence on a genome/chromosome. The actual sequence can be stored with the \r
+            'mol_seq' element. Attribute 'type' is used to indicate the type of sequence ('dna', 'rna', or 'protein'). \r
+            One intended use for 'id_ref' is to link a sequence to a taxonomy (via the taxonomy's 'id_source') in case \r
+            of multiple sequences and taxonomies per node. </xs:documentation>\r
       </xs:annotation>\r
       <xs:sequence>\r
          <xs:element name="symbol" type="phy:SequenceSymbol" minOccurs="0"/>\r
          <xs:element name="accession" type="phy:Accession" minOccurs="0"/>\r
          <xs:element name="name" type="xs:token" minOccurs="0"/>\r
+         <xs:element name="gene_name" type="xs:token" minOccurs="0"/>\r
          <xs:element name="location" type="xs:token" minOccurs="0"/>\r
          <xs:element name="mol_seq" type="phy:MolSeq" minOccurs="0"/>\r
          <xs:element name="uri" type="phy:Uri" minOccurs="0" maxOccurs="unbounded"/>\r
    </xs:complexType>\r
    <xs:simpleType name="SequenceSymbol">\r
       <xs:restriction base="xs:token">\r
-         <xs:pattern value="\S{1,30}"/>\r
+         <xs:pattern value="\S{1,20}"/>\r
       </xs:restriction>\r
    </xs:simpleType>\r
    <xs:complexType name="MolSeq">\r
       <xs:simpleContent>\r
          <xs:extension base="xs:token">\r
             <xs:attribute name="source" type="xs:token" use="required"/>\r
+            <xs:attribute name="comment" type="xs:token"/>\r
          </xs:extension>\r
       </xs:simpleContent>\r
    </xs:complexType>\r
    </xs:complexType>\r
    <xs:simpleType name="ref">\r
       <xs:restriction base="xs:token">\r
-         <xs:pattern value="[a-zA-Z0-9_]+:[a-zA-Z0-9_\.\-\s=]+"/>\r
+         <xs:pattern value="[a-zA-Z0-9_]+:\S+"/>\r
       </xs:restriction>\r
    </xs:simpleType>\r
    <xs:simpleType name="AppliesTo">\r