Edited wiki page RIO through web user interface.
[jalview.git] / wiki / RIO.wiki
1 #summary resampled inference of orthologs
2
3 = RIO: Resampled Inference of Orthologs =
4
5 == Purpose ==
6
7 RIO (Resampled Inference of Orthologs) is a method for automated phylogenomics based on explicit phylogenetic inference. RIO analyses are performed over resampled phylogenetic trees to estimate the reliability of orthology assignments.
8
9 == Usage == 
10 {{{
11 java -Xmx1024m -cp
12 path/to/forester.jar org.forester.application.rio [options] <gene trees file> <species tree file> [outfile]
13 }}}
14 === Options ===
15
16   * -co: cutoff for ortholog output (default: 50) 
17   
18   * -t : file-name for output table
19   
20   * -q : name for query (sequence/node)
21
22   * -s : sort (default: 2)
23
24   * -u : to output ultra-paralogs (species specific expansions/paralogs)
25
26   * -cu: cutoff for ultra-paralog output (default: 50)
27
28 ==== Sort ====
29
30   * 0: orthologies
31   * 1: orthologies > super orthologies
32   * 2: super orthologies > orthologies
33
34 ==== Gene trees ====
35 The gene trees ideally are in phyloXML,with taxonomy and sequence data in appropriate fields; but can also be in New Hamphshire (Newick) or Nexus format as long as species information can be extracted from the gene names (e.g. "HUMAN" from "BCL2_HUMAN").
36
37 ==== Species tree ====
38 Must be in phyloXML format  ([http://forester.googlecode.com/files/species.xml example]).
39
40
41 === Example ===
42 `rio gene_trees.nh species.xml outfile -q=BCL2_HUMAN -t=outtable -u -cu=60 -co=60`
43 `rio gene_trees.nh species.xml -t=outtable`
44
45
46 <wiki:comment>
47 === Example files ===
48   * [http://forester.googlecode.com/files/wnt_gene_tree.xml gene tree]
49   * [http://forester.googlecode.com/files/species.xml species tree]
50   * [http://forester.googlecode.com/files/wnt_gsdi_log.txt log file (output)]
51 </wiki:comment>
52
53 == References ==
54
55 Zmasek CM and Eddy SR "RIO: Analyzing proteomes by automated phylogenomics using resampled inference of orthologs" [http://www.biomedcentral.com/1471-2105/3/14/ BMC Bioinformatics 2002, 3:14]
56
57 Zmasek CM and Eddy SR "A simple algorithm to infer gene duplication and speciation events on a gene tree" [http://bioinformatics.oxfordjournals.org/content/17/9/821.abstract Bioinformatics, 17, 821-828]
58  
59
60 == Download ==
61
62 Download forester.jar here: http://code.google.com/p/forester/downloads/list