I am committing the edits to the main body of the text. I will work on the exercises...
[jalview-manual.git] / TheJalviewTutorial.tex
index 1019df3..585b1bd 100644 (file)
@@ -80,32 +80,36 @@ Jalview 2.10.1}
 
 Manual and  Introductory Tutorial }
 
-\vspace{2.4in}
+\vspace{2.2in}
 
 {\large
 
-David Martin, James Procter, Andrew Waterhouse, Saif Shehata, Nancy Giang,
+David Martin, James Procter 
 
+Andrew Waterhouse, Saif Shehata, Nancy Giang 
 
-Suzanne Duce and Geoff Barton
+Mungo Carstairs, Charles Ofoegbu, Kira Mour\~{a}o
+
+Suzanne Duce and Geoff Barton 
 
 }
 
-\vspace{1.2in}
+\vspace{0.9in}
 
 School of Life Sciences, University of Dundee
 
 Dundee, Scotland DD1 5EH, UK
 
-
 \vspace{2in}
+Manual Version 1.9
 
-Manual Version 1.8
+
+Manual Version 1.8.1
 % post CLS lifesci course on 15th January
 % draft. Remaining items are AACon, RNA visualization/editing and Protein disorder analysis exercises.
 
-15th February 2017
+10th November 2017
+
 
 
 \end{center}
@@ -132,11 +136,11 @@ Manual Version 1.8
 \section{Introduction}
 \subsection{Jalview}
 Jalview is a multiple sequence alignment viewer, editor and analysis tool.
-Jalview is designed to be platform independent (running on Mac, MS Windows, Linux
+It is designed to be platform independent (running on Mac, MS Windows, Linux
 and any other platforms that support Java). Jalview is capable of editing and
 analysing large alignments (thousands of sequences) with minimal degradation in
-performance, and able to show multiple integrated views of the alignment and
-other data. Jalview can read and write many common sequence formats including
+performance. It is able to show multiple integrated views of the alignment
+and other data. Jalview can read and write many common sequence formats including
 FASTA, Clustal, MSF(GCG) and PIR.
 
 
@@ -151,11 +155,10 @@ colouring.} and includes a javascript API to allow customisable display of
 alignments for web sites such as Pfam.\footnote{\url{http://pfam.xfam.org}}
 
 
-The Jalview Desktop in this version
-provides access to protein and nucleic acid sequence, alignment and structure
+The Jalview Desktop provides access to protein and nucleic acid sequence, alignment and structure
 databases, and includes the Jmol\footnote{ Provided under the LGPL licence at
-\url{http://www.jmol.org}} viewer for molecular structures, and the VARNA\footnote{Provided under GPL licence at \url{http://varna.lri.fr}} program for the visualization of 
-RNA secondary structure. It also
+\url{http://www.jmol.org}} and Chimera viewer for molecular structures, and the
+VARNA\footnote{Provided under GPL licence at \url{http://varna.lri.fr}} program for the visualization of RNA secondary structure. It also
 provides a graphical user interface for the multiple sequence alignment, conservation analysis 
 and protein disorder prediction methods provided as {\bf Ja}va {\bf B}ioinformatics
 {\bf A}nalysis {\bf W}eb {\bf S}ervices (JABAWS). JABAWS\footnote{released under GPL at \url{http://www.compbio.dundee.ac.uk/jabaws}} is a system for 
@@ -231,9 +234,9 @@ the Jalview Desktop's webservices is given in Section \ref{jvwebservices}, and
 the alignment and secondary structure prediction services are described
 in detail in Sections \ref{msaservices} and \ref{protsspredservices}
 respectively.
-Section \ref{featannot} details the creation and visualization of sequence and alignment annotation. Section \ref{workingwithnuc} discusses
-specific features of use when working with nucleic acid sequences, such as translation and linking to protein
-coding regions, and the display and analysis of RNA secondary structure.
+Section \ref{featannot} details the creation and visualization of sequence,
+features and alignment annotation. Section \ref{workingwithnuc} discusses
+specific features of use when working with nucleic acid sequences, such as translation and linking to protein coding regions, and the display and analysis of RNA secondary structure.
 
 %^Chapter \ref{jalviewadvanced} The third chapter covers the detail^ of Jalview and is aimed at the user who is
 %already familiar with Jalview operation but wants to get more out of their
@@ -264,9 +267,7 @@ Alignment' submenu of a window's `File' dropdown menu.
 
 This tutorial is based on the Jalview
 Desktop application. Much of the information will also be useful for users of
-the JalviewLite applet, which has the same core editing, analysis and visualization capabilities (see the
-\href{http://www.jalview.org/examples/applets.html}{JalviewLite Applet Examples}
-page for examples). The Jalview Desktop, however, is much more powerful, and
+the JalviewLite applet, which has the same core editing, analysis and visualization capabilities. The Jalview Desktop, however, is much more powerful, and
 includes additional support for interaction with external web services, and
 production of publication quality graphics.
 
@@ -287,7 +288,7 @@ When the application is launched with webstart, two dialogs may appear before
 the application starts. If your browser is not set up to handle webstart, then
 clicking the launch link may download a file that needs to be opened
 manually, or prompt you to select the program to handle the webstart
-file. If that is the case, then you will need to locate the {\bf javaws} program
+file. If that is the case, you will need to locate the {\bf javaws} program
 on your system\footnote{The file that is downloaded will have a type of {\bf
 application/x-java-jnlp-file} or {\bf .jnlp}. The {\bf javaws} program that can run
 this file is usually found in the {\bf bin} directory of your Java
@@ -392,8 +393,8 @@ Opening from the jnlp file will allow Jalview to be launched offline.
 \label{gettinghelp}
 \subsubsection{Built in Documentation}
 Jalview has comprehensive on-line help documentation. Select  {\sl Help
-$\Rightarrow$ Documentation} from the main window menu and a new window will
-open (Figure \ref{help}). The appropriate topic can then be selected from the
+$\Rightarrow$ Documentation} from the main desktop window menu and a new window
+will open (Figure \ref{help}). The appropriate topic can then be selected from the
 navigation panel on the left hand side. To search for a specific topic, click
 the `search' tab and enter keywords in the box which appears.
 
@@ -558,10 +559,10 @@ Search tab to select specific key words.
 %Jalview provides many ways to load your own sequences. %For this section of the
 % tutorial you will need to download the file http://www.jalview.org/tutorial/alignment.fa to a suitable location on your hard drive.
 \subsection{Drag and Drop}
-       In most operating systems you can just drag a file icon from a file browser
+       In most operating systems you can drag a file icon from a file browser
        window and drop it on an open Jalview application window. The file will then be opened as a new alignment window. %You can try this with the tutorial file you have downloaded. When you have opened the file, close it again by selecting the close control on the window. If you drop an alignment file onto an open alignment window it will be appended.
        Drag and drop also works when loading data from a URL -
-simply drag the link or url from the address panel of your browser on to an
+simply drag the link or url from the address panel of your browser onto an
 alignment or the Jalview desktop background and Jalview will load data from the
 URL directly.
 %  (Figure \ref{drag})
@@ -841,7 +842,7 @@ more complete sequences.
 A selected region can be copied and pasted as a new alignment 
 using the {\sl Edit $\Rightarrow$ Copy} and {\sl Edit $\Rightarrow$ Paste $\Rightarrow$ To New 
 Alignment}  in the alignment window menu options.
-{\bf To clear (unselect)  the selection press the [ESC] (escape) key.}
+{\bf To clear (unselect)  the selection press the [ESC] key.}
 
 \subsection{Selecting Arbitrary Regions}
 To select part of an alignment, place the mouse at the top left corner of the region you wish to select. Press and hold the mouse button and drag the mouse to the bottom right corner of the chosen region then release the mouse button. 
@@ -864,7 +865,7 @@ holding down the [SHIFT] key whilst clicking the other end of the selection.
 Discontinuous regions can be selected by holding down [CTRL] and clicking on
 positions to add to the column selection. Note that each [CTRL]-Click (PC) or
 [CMD]-Click (Mac) changes the current selected sequence region to that column,
-but adds to the column selection.
+it adds to the column selection.
 Selected columns are indicated by red highlighting in the ruler bar (Figure \ref{selectcols}).
 %[fig 13]
 
@@ -891,7 +892,8 @@ selection. }
 
 To select multiple complete sequences, click and drag the mouse down the
 sequence ID panel. The same techniques as used for columns (above) can be used
-with [SHIFT]-Click for continuous and [CTRL]-Click to select discontinuous
+with [SHIFT]-Click for continuous and [CTRL]-Click (or
+[CMD]-Click for Mac) to select discontinuous
 ranges of sequences (Figure \ref{selectrows}).
 %[fig 14]
 
@@ -1088,7 +1090,11 @@ to hide the unselected region.
 
 \subsection{Representing a Group with a Single Sequence}
 
-Instead of hiding a group completely, it is sometimes useful to work with just one representative sequence. The {\sl $<$Sequence ID$>$ $\Rightarrow$ Represent group with $<$Sequence ID$>$ } option from the sequence ID pop-up menu enables this variant of the hidden groups function. The remaining representative sequence can be visualized and manipulated like any other. However, any alignment edits that affect the sequence will also affect the whole sequence group. 
+Instead of hiding a group completely, it is sometimes useful to work with just one representative sequence. 
+The {\sl $<$Sequence ID$>$ $\Rightarrow$ Represent group with $<$Sequence ID$>$ } option from the sequence ID pop-up menu enables this variant 
+of the hidden groups function. The remaining representative sequence can be visualized and manipulated like any other. 
+Note, any alignment edits that affect the sequence will also affect the whole
+sequence group.
 
 \exercise{Hiding and Revealing Regions}{
 \exstep{Close windows.
@@ -1603,9 +1609,14 @@ It is therefore important to pick the right kind of display layout prior to gene
 
 \subsection{Multiple Alignment Views}
 
-Jalview is able to create multiple independent visualizations of the same underlying alignment - these are called {\sl Views}. Because each view displays the same underlying data, any edits performed in one view will update the alignment or annotation visible in all views.
+Jalview is able to create multiple independent visualizations of the same underlying alignment - these are called {\sl Views}. 
+Because each view displays the same underlying data, any edits performed in one view will update the alignment or annotation visible in all views.
 
-\parbox[c]{4in}{Alignment views are created using the {\sl View $\Rightarrow$ New View} option of the alignment window or by Pressing [CTRL]-T. This will create a new view with the same groups, alignment layout and display options as the current one. Pressing G will gather together Views as named tabs on the alignment window, and pressing X will expand gathered Views so they can be viewed simultaneously in their own separate windows. To delete a group, press [CTRL]-W.}\parbox[c]{2.75in}{
+\parbox[c]{4in}{Alignment views are created using the {\sl View $\Rightarrow$
+New View} option of the alignment window or by pressing [CTRL]-T.
+This will create a new view with the same groups, alignment layout and display options as the current one. 
+Pressing G will gather together Views as named tabs on the alignment window, and pressing X will expand gathered Views so they can be viewed 
+simultaneously in their own separate windows. To delete a group, press [CTRL]-W.}\parbox[c]{2.75in}{
 \begin{center}\centerline{
 \includegraphics[width=2.5in]{images/mulv_tabs.pdf}}
 \end{center}
@@ -2523,13 +2534,15 @@ position between each pair of sequences. The basic method is described in the
 Nature Structural Biology} (1995) {\bf 2}, 171-8.
 PMID: 7749921} and implemented at the SeqSpace server at the EBI.
 
-Jalview provides two different options for the PCA calculation. Protein PCAs are
-by default computed using BLOSUM 62 pairwise substitution scores, and nucleic
-acid alignment PCAs are computed using a score model based on the identity
-matrix that also treats Us and Ts as identical, to support analysis of both RNA
-and DNA alignments. The {\sl Change Parameters} menu also allows the calculation
-method to be toggled between SeqSpace and a variant calculation that is detailed
-in Jalview's built in documentation.\footnote{See
+Jalview provides two different options for the PCA calculation: SeqSpace and
+Jalview mode. In SeqSpace mode, PCAs are computed using the identity matrix, and
+gaps are treated as 'the unknown residue' (this actually differs from the
+original SeqSpace paper, and will be adjusted in a future version of Jalview).
+In Jalview mode, PCAs are computed using the chosen score matrix - which for
+protein sequences, defaults to BLOSUM 62, and for nucleotides, is the
+DNA identity matrix that also treats Us and Ts as identical, to support analysis
+of both RNA and DNA alignments. The {\sl Change Parameters} allows the
+calculation method and score models to be changed.\footnote{See
 \url{http://www.jalview.org/help/html/calculations/pca.html}.}
 
 \subsubsection{The PCA Viewer}
@@ -2647,14 +2660,14 @@ groups in Jalview.}
 % move to ch. 3 ?
 %Both PCA and Tree viewers are linked analysis windows. This means that their selection and display are linked to a particular alignment, and control and reflect the selection state for a particular view.
 
-\subsubsection{Recovering input Data for a Tree or PCA Plot Calculation}
+\subsubsection{Recovering input data for a Tree or PCA Plot Calculation}
 \parbox[c]{5in}{
 The {\sl File $\Rightarrow$ Input Data } option will open a new alignment window containing the original data used to calculate the tree or PCA plot (if available). This function is useful when a tree has been created and then the alignment subsequently changed. 
 }
 \parbox[c]{1.25in}{\centerline{\includegraphics[width=1.25in]{images/pca_fmenu.pdf}
 }}
 
-\subsubsection{Changing the associated View for a Tree or PCA Viewer}
+\subsubsection{Changing the associated view for a Tree or PCA Viewer}
 \parbox[c]{4in}{
 The {\sl View $\Rightarrow$ Associated Nodes With $\Rightarrow$ .. } submenu is shown when the viewer is associated with an alignment that is involved in multiple views. Selecting a different view does not affect the tree or PCA data, but will change the colouring and display of selected sequences in the display according to the colouring and selection state of the newly associated view. 
 } \parbox[c]{3in}{\centerline{
@@ -2733,31 +2746,31 @@ can be set in Preferences using
 \url{http://www.jalview.org/training/Training-Videos}.}
 }
 
-\exercise{Tree Based Conservation Analysis}{
-\label{consanalyexerc}
-\exstep{Load the PF03460 PFAM seed alignment using the sequence fetcher. 
-Select {\sl Colour $\Rightarrow$ Taylor $\Rightarrow$ By Conservation}, set {\sl Conservation} shading threshold at around 20. }
-\exstep{Build a Neighbour joining tree using Select {\sl Calculate $\Rightarrow$ Calculate Tree $\Rightarrow$
-Neighbour Joining Using BLOSUM62}.}
-\exstep{Use the mouse cursor to select a point on the tree to partition the
-alignment into several sections.}
-\exstep {Select {\sl View $\Rightarrow$ Sort Alignment By Tree} option in the
-tree window to re-order the sequences in the alignment using the calculated
-tree.
-Examine the variation in colouring between different groups of sequences in the alignment
-window. }
-\exstep {You may find it easier to browse the alignment if you first uncheck the
-{\sl Annotations $\Rightarrow$ Show Annotations} option. Open the
-Overview Window within the View menu to aid navigation.}
-
-\exstep{Try changing the colourscheme of the residues in the alignment to
-BLOSUM62 (whilst ensuring that {\sl Apply Colour to All Groups} is selected).}
-{\sl Note: You may want to save the alignment and tree as a project file, since
-it is used in the next set of exercises. }
-
-{\bf See the video at:
-\url{http://www.jalview.org/training/Training-Videos}.}
-}
+% \exercise{Tree Based Conservation Analysis}{
+%\label{consanalyexerc}
+%\exstep{Load the PF03460 PFAM seed alignment using the sequence fetcher. 
+%Select {\sl Colour $\Rightarrow$ Taylor $\Rightarrow$ By Conservation}, set
+% {\sl Conservation} shading threshold at around 20. } \exstep{Build a Neighbour joining tree using Select {\sl Calculate $\Rightarrow$ Calculate Tree $\Rightarrow$
+%Neighbour Joining Using BLOSUM62}.}
+%\exstep{Use the mouse cursor to select a point on the tree to partition the
+%alignment into several sections.}
+%\exstep {Select {\sl View $\Rightarrow$ Sort Alignment By Tree} option in the
+%tree window to re-order the sequences in the alignment using the calculated
+%tree.
+%Examine the variation in colouring between different groups of sequences in the
+% alignment window. }
+%\exstep {You may find it easier to browse the alignment if you first uncheck
+% the {\sl Annotations $\Rightarrow$ Show Annotations} option. Open the
+%Overview Window within the View menu to aid navigation.}
+
+%\exstep{Try changing the colourscheme of the residues in the alignment to
+%BLOSUM62 (whilst ensuring that {\sl Apply Colour to All Groups} is selected).}
+%{\sl Note: You may want to save the alignment and tree as a project file, since
+%it is used in the next set of exercises. }
+
+%{\bf See the video at:
+%\url{http://www.jalview.org/training/Training-Videos}.}
+%}
 
 
 \subsection{Redundancy Removal}
@@ -2932,12 +2945,11 @@ viewing program\footnote{See the Jmol homepage \url{http://www.jmol.org} for
 more information.} integrated with Jalview.\footnote{Earlier
 versions of Jalview included MCView - a simple main chain structure viewer.
 Structures are visualized as an alpha carbon trace and can be viewed, rotated
-and coloured in a structure viewer and the results interpreted on a sequence
-alignment.} It also supports the use of UCSF Chimera, a powerful molecular
-graphics system that needs separate installation. Jalview can also read PDB and
-mmCIF format files directly to extract sequences and secondary structure
-information, and retrieve records from the European Protein
-Databank (PDBe) using the Sequence Fetcher (see \ref{fetchseq}).
+and coloured using the sequence alignment.} It also supports the use of UCSF
+Chimera, a powerful molecular graphics system that needs separate installation.
+Jalview can also read PDB and mmCIF format files directly to extract sequences
+and secondary structure information, and retrieve records from the European
+Protein Databank (PDBe) using the Sequence Fetcher (see \ref{fetchseq}).
 
 \subsection{Configuring the default structure viewer}
 \label{configuring3dviewer}
@@ -2945,25 +2957,29 @@ To configure which viewer is used when creating a new
 structure view, open the Structures preferences window {\sl via} {\sl Tools $\Rightarrow$ Preferences\ldots} and
 select either JMOL or CHIMERA as the default viewer. If you select Chimera,
 Jalview will search for the installed program, and if it cannot be found,
-you will be prompted to locate the Chimera binary, or directed to the UCSF
-Chimera download page.
+you will be prompted to locate the Chimera binary, or alternately, open the UCSF
+Chimera download page to obtain the software.
 
 \section{Automatic Association of PDB Structures with Sequences}
-Jalview can automatically determine which structures are associated with a
-sequence via its ID, and any associated database references. To do this, open
-the Sequence ID popup menu and select {\sl View 3D Structure}, to open the 3D
-Structure Chooser. 
+Jalview will attempt to automatically determine which structures are associated
+with a sequence via its ID, and any associated database references. To do this
+for a particular sequence or the current selection, open the Sequence ID popup
+menu and select {\sl View 3D Structure}, to open the 3D Structure Chooser. 
 %(Figure\ref{auto}). 
 
 When the structure chooser is first opened, if no database identifiers are
-available, Jalview will attempt to discover identifiers for the sequence and from there discover any
-associated PDB structures. This can take a few seconds for each sequence and
-will be performed for all selected sequences. After this is done, you can see
-the added database references in a tool tip by mousing over the sequence
-ID\footnote{Tip:
-If sequence ID tooltip obscures your view, then use the {\sl View $\Rightarrow$ Sequence ID Tooltip $\Rightarrow$ } 
-submenu option to disable the display of database cross references or non-positional
-features. }, now shows the Uniprot ID and any associated PDB structures. 
+available, Jalview will automatically perform a database reference
+retrieval (See \ref{fetchdbrefs}) to discover identifiers for the
+sequences to use to search the PDB. This can take a
+few seconds for each sequence and will be performed for all selected
+sequences.\footnote{After this is done, you can can see the added database
+references in a tool tip by mousing over the sequence ID. You can use the {\sl
+View $\Rightarrow$ Sequence ID Tooltip $\Rightarrow$ Show Db References }
+submenu option to enable or disable these data in the tooltip.}
+
+Once the retrieval has finished, the structure chooser dialog will show any
+available PDB entries for the selected sequences.
+
 % 
 % \begin{figure}[htbp]
 % \begin{center}
@@ -2981,12 +2997,11 @@ features. }, now shows the Uniprot ID and any associated PDB structures.
 \subsection{Drag-and-Drop Association of PDB Files with Sequences by Filename
 Match}
 \label{multipdbfileassoc}
-If one or more PDB files stored on your computer are dragged from their location
-on the file browser onto an alignment window, Jalview will search the alignment
-for sequences with IDs that match any of the files dropped onto the alignment.
-If it discovers matches, a dialog like the one in Figure
-\ref{multipdbfileassocfig} is shown, giving the option of creating associations
-for the matches.
+If you have PDB files stored on your computer named the same way as the
+sequences in the alignment, then you can drag them from their location on the
+file browser onto an alignment window. Jalview will search the alignment for
+sequences with IDs that match any of the files, and offer a dialog like the one
+in Figure \ref{multipdbfileassocfig}.
 
 If no associations are made, then sequences extracted
 from the structure will be simply added to the alignment. However, if only
@@ -2999,6 +3014,12 @@ future so Jalview will automatically search for PDB files matching your
 sequence within a local directory. Check out 
 \href{http://issues.jalview.org/browse/JAL-801}{Jalview issue 801}}
 
+After associating sequences with PDB files, you can view the PDB structures by
+opening the Sequence ID popup
+menu and selecting {\sl View 3D Structure}. The PDB files you loaded will be
+shown in the {\bf Cached Structures} view, after selecting it from the drop down
+menu in the dialog box. 
+
 % there is no mention of the other footnote (#3) that appears saying: Tip: The sequence ID tooltip can often become large for heavily cross-referenced sequence IDs. Use the ...
 % JBP: yes there is - under 'Discovery of ' subsection.
 \begin{figure}[htbp]
@@ -3015,27 +3036,34 @@ file with any sequences with matching IDs. }
 
 
 \section{Viewing Structures}
-\label{viewAllStructures}
-The structure viewer is launched from the sequence ID context
-menu. To view a particular structure associated with a sequence in the
-alignment, select the sequence and right click the mouse to open context
-menu {\sl Structure $\Rightarrow$ 3D Structure data $\Rightarrow$} opens a Structure Chooser dialog box.
-The second way is most useful if you want to view all structural data available for
-a set of sequences in an alignment. Select all the sequence ids in the sequence
-ID panel and right click the mouse to open context
-menu {\sl Structure $\Rightarrow$ 3D Structure data $\Rightarrow$}. If any of
-the {\bf currently selected} sequences have structures associated they will
-appear in the Structure Chooser dialog box. The structures can be ranked by
-different parameters, 'Best Quality' is defaul option. Select the
-structures required and click {\sl View} to open a structure viewer containing
-the associated structures superposed according to the alignment.
-
-The structure to be displayed will be downloaded or loaded from
+\label{structurechooser}
+The structure viewer is launched via the Sequence ID context
+menu. To view structures associated with a sequence or a selected set of
+sequences in the alignment, simply right click the mouse to open the context
+menu, and select {\sl 3D Structure data \ldots} to open the Structure Chooser
+dialog box. 
+
+If any of
+the {\bf currently selected} sequences have structures in the PDB, 
+they will appear in the Structure Chooser dialog box. The structures can be ranked by
+different parameters, but are by default ordered according to their PDB
+quality score. 
+
+To view one or more structures, simply click {\sl
+View} to open a structure viewer containing the structures selected in the
+dialog. If several structures were picked, these will be shown
+superposed according to the alignment.
+You may find Jalview has already picked the best structure - using one of the
+criteria shown in the dropdown menu (e.g. 'Best Quality', which is picked by
+default). However, you are free to select your own.
+
+The structure(s) to be displayed will be downloaded or loaded from
 the local file system, and shown as a ribbon diagram coloured according to the
 associated sequence in the current alignment view (Figure \ref{structure}
 (right)). The structure can be rotated by clicking and dragging in the structure
 window. The structure can be zoomed using the mouse scroll wheel or by
 [SHIFT]-dragging the structure.
+
 Moving the mouse cursor over a sequence to which the structure is linked in the
 alignment view highlights the respective residue's sidechain atoms. The
 sidechain highlight may be obscured by other parts of the molecule. Similarly,
@@ -3050,21 +3078,23 @@ disabled for the current view.
 
 \begin{figure}[htbp]
 \begin{center}
-\parbox{3in}{
+\parbox{4in}{
 {\centering 
 \begin{center}
-\includegraphics[scale=0.5]{images/structure1.pdf}
+\includegraphics[width=4in]{images/structure1.pdf}
 \end{center}
 }
 }
-\parbox{3.2in}{
+\parbox{2.2in}{
 {\centering 
 \begin{center}
-\includegraphics[width=3in]{images/structure2.pdf}
+\includegraphics[width=2.2in]{images/structure2.pdf}
 \end{center}
 }
 }
-\caption{{\bf Structure visualization} The structure viewer is launched from the sequence ID context menu (left) and allows the structure to be visualized using the embedded Jmol molecular viewer (right). }
+\caption{{\bf Structure visualization} Structure viewers are launched from
+the 3D Structure chooser dialog (left). Jalview shows the displayed structures
+coloured according the alignment view (right). }
 \label{structure}
 \end{center}
 \end{figure}
@@ -3268,7 +3298,7 @@ structure data. {\sl Invert selection} and {\sl Select all views} options are al
 
 Note that the {\sl Select many views} option is useful if you have different
 views that colour different areas or domains of the alignment. This option is
-further explored in Section \ref{complexstructurecolours}.
+further explored in exercise \ref{complexstructurecolours}.
 
 
 \exercise{Aligning Structures using the Ferredoxin
@@ -3718,7 +3748,7 @@ now includes some specific features for working with nucleic acid sequences
 and alignments. Jalview recognises nucleotide sequences and alignments based on
 the presence of nucleotide symbols [ACGT] in greater than 85\% of the
 sequences. Built in codon-translation tables can be used to translate ORFs
-into peptides for further analysis. EMBL nucleotide records retrieved {\sl via} the
+into peptides for further analysis. ENA nucleotide records retrieved {\sl via} the
 sequence fetcher (see Section \ref{fetchseq}) are also parsed in order to
 identify codon regions and extract peptide products. Furthermore, Jalview
 records mappings between protein sequences that are derived from regions of a
@@ -3806,7 +3836,7 @@ window is only available when working with a nucleic acid alignment. It uses the
 \subsection{Linked DNA and Protein Views}
 
 \parbox{3.5in}{
-Views of alignments involving DNA sequences are linked to views of alignments containing their peptide products in a similar way to views of protein sequences and views of their associated structures. Peptides translated from cDNA that have been fetched from EMBL records for DNA contigs are linked to their `parent' coding regions. Mousing over a region of the peptide highlights codons in views showing the original coding region.
+Views of alignments involving DNA sequences are linked to views of alignments containing their peptide products in a similar way to views of protein sequences and views of their associated structures. Peptides translated from cDNA that have been fetched from ENA records for DNA contigs are linked to their `parent' coding regions. Mousing over a region of the peptide highlights codons in views showing the original coding region.
 }\parbox{3in}{
 \begin{center}
 %\begin{figure}[htbp]
@@ -3819,21 +3849,21 @@ Views of alignments involving DNA sequences are linked to views of alignments co
 }
 
 
-\subsection{Coding Regions from EMBL Records}
+\subsection{Coding Regions from ENA Records}
 
-Many EMBL records that can be retrieved with the sequence fetcher contain exons.
-Coding regions will be marked as features on the EMBL nucleotide sequence, and
+Many ENA records that can be retrieved with the sequence fetcher contain exons.
+Coding regions will be marked as features on the ENA nucleotide sequence, and
 Uniprot database cross references will be listed in the tooltip displayed when
 the mouse hovers over the sequence ID. Uniprot database cross references
-extracted from EMBL records are sequence cross references, and associate a
+extracted from ENA records are sequence cross references, and associate a
 Uniprot sequence's coordinate system with the coding regions annotated on the
-EMBL sequence. Jalview utilises cross-reference information in two ways.
+ENA sequence. Jalview utilises cross-reference information in two ways.
 \subsubsection{Retrieval of Protein or DNA Cross References}
-The {\sl Calculate $\Rightarrow$ Get Cross References } function is only available when Jalview recognises that there are protein/DNA cross-references present on sequences in the alignment. When selected, it retrieves the cross references from the alignment's dataset (a set of sequence and annotation metadata shared between alignments) or using the sequence database fetcher. This function can be used for EMBL sequences containing coding regions to open the Uniprot protein products in a new alignment window. The new alignment window that is opened to show the protein products will also allow dynamic highlighting of codon positions in the EMBL record for each residue in the protein product(s).
+The {\sl Calculate $\Rightarrow$ Get Cross References } function is only available when Jalview recognises that there are protein/DNA cross-references present on sequences in the alignment. When selected, it retrieves the cross references from the alignment's dataset (a set of sequence and annotation metadata shared between alignments) or using the sequence database fetcher. This function can be used for ENA sequences containing coding regions to open the Uniprot protein products in a new alignment window. The new alignment window that is opened to show the protein products will also allow dynamic highlighting of codon positions in the ENA record for each residue in the protein product(s).
 
 \subsubsection{Retrieval of Protein Features on Coding Regions}
 
-The Uniprot cross-references derived from EMBL records can be used by Jalview to visualize protein sequence features directly on nucleotide alignments.
+The Uniprot cross-references derived from ENA records can be used by Jalview to visualize protein sequence features directly on nucleotide alignments.
 This is because the database cross references include the sequence coordinate mapping information to correspond regions on the protein sequence with that of the nucleotide contig. 
 Jalview will use the Uniprot accession numbers associated with the sequence to retrieve features, and then map them onto the nucleotide sequence's coordinate system using 
 the coding region location.
@@ -3844,7 +3874,7 @@ the coding region location.
 \includegraphics[width=5in]{images/dnadasfeatures.pdf}
 
 \caption{Uniprot and PDB sum features retrieved and mapped onto
-coding regions of EMBL record V00488 (an earlier version of Jalview is shown
+coding regions of ENA record V00488 (an earlier version of Jalview is shown
 here).}
 
 \end{center}
@@ -3852,7 +3882,7 @@ here).}
 
 \exercise{Visualizing Protein Features on Coding Regions}
 {
-\exstep{Use the sequence fetcher to retrieve EMBL record D49489.}
+\exstep{Use the sequence fetcher to retrieve ENA record D49489.}
 \exstep{Ensure that {\sl View $\Rightarrow$ Show Sequence Features} is checked and change the 
 alignment view format to {\sl Wrapped} mode so the distinct exons can be seen.}
 \exstep{Open the {\sl DAS Settings} tab in the {\sl Sequence Feature Settings\ldots}