JAL-4036 JAL-4012 note about Uniprot FTS workaround in search documentation, and...
[jalview.git] / help / help / html / features / uniprotsequencefetcher.html
1 <html>
2 <!--
3  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
4  * Copyright (C) $$Year-Rel$$ The Jalview Authors
5  * 
6  * This file is part of Jalview.
7  * 
8  * Jalview is free software: you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License 
10  * as published by the Free Software Foundation, either version 3
11  * of the License, or (at your option) any later version.
12  *  
13  * Jalview is distributed in the hope that it will be useful, but 
14  * WITHOUT ANY WARRANTY; without even the implied warranty 
15  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
16  * PURPOSE.  See the GNU General Public License for more details.
17  * 
18  * You should have received a copy of the GNU General Public License
19  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
20  * The Jalview Authors are detailed in the 'AUTHORS' file.
21  -->
22 <head>
23 <title>The UniProt Free Text Search Interface</title>
24 </head>
25 <body>
26
27   <strong>The UniProt Free Text Search Interface</strong>
28   <br /> Since version 2.10 (October 2016), the Jalview Desktop
29   provides a search interface for interactive discovery and retrieval of
30   sequence data from UniProt. This dialog enables UniProt sequence
31   metadata to be searched with free text and structured queries, which
32   allows sequences to be located via gene name, keywords, or even
33   <em>via</em> manual cross-referencing from UniProt or other
34   bioinformatics websites.
35   <br/>
36   <br />
37   <strong>Please Note:</strong>Versions of Jalview older than 2.11.2.3 may need a configuration change
38   in order to access freetext search. Please see this post:
39   <a
40     href="https://discourse.jalview.org/t/uniprot-free-text-search-not-working-in-jalview-2-11-2-2-and-earlier/1825">https://discourse.jalview.org/t/uniprot-free-text-search-not-working-in-jalview-2-11-2-2-and-earlier/1825</a>
41   in Jalview's discussion forum for a workaround.
42   <br />
43   <p>
44     To open the UniProt Sequence Fetcher, select UniProt as the database
45     from any <a href="seqfetch.html">Sequence Fetcher</a> dialog (opened
46     <em>via</em> <strong>&quot;File &#8594;Fetch
47       Sequences&quot;</strong>).
48   </p>
49   <p>
50     <img src="uniprotseqfetcher.png" align="left"
51       alt="UniProt sequence fetcher (introduced in Jalview 2.10)" />
52   </p>
53
54   <p>
55     <a name="uniprotfts"><strong>Searching the UniProt Database</strong></a>
56   </p>
57   <p>To search UniProt, simply begin typing in the text box. If the
58     'autosearch' check box is enabled, then after a short delay (about
59     1.5 seconds), results will be shown in the table below. Results are
60     also updated whenever you press Enter, and you can access previous
61     searches by pressing the 'Down' arrow or clicking the drop-down menu
62     icon at the side of the search box.</p>
63   <p>You can sort results by clicking on the displayed columns,
64     and select entries with the mouse or keyboard. Once you have
65     selected one or more entries, hit the <strong>OK</strong> button to
66     retrieve the sequences.
67   </p>
68   <ul>
69     <li><strong>Searching a specific UniProt field </strong> To
70       find sequences with particular UniProt metadata, you can select a
71       field to search from the drop-down menu.</li>
72
73
74     <li><strong>Bulk UniProt record retrieval</strong><br> To
75       retrieve sequences for a list of Uniprot accessions, please enter
76       them via the 'Retrieve IDs' tab.</li>
77
78     <li><strong><a name="text-search">Complex queries
79           with the UniProt query Syntax</a></strong> The text box also allows complex
80       queries to be entered. The table below provides a brief overview
81       of the supported syntax (see <a href="uniprotqueryfields.html">query
82         fields for UniProtKB</a>):
83       <table border="1" width="95%">
84         <tr>
85           <td><code>human antigen</code></td>
86           <td rowspan="3">All entries containing both terms.</td>
87         </tr>
88         <tr>
89           <td><code>human AND antigen</code></td>
90         </tr>
91         <tr>
92           <td><code>human &amp;&amp; antigen</code></td>
93         </tr>
94         <tr>
95           <td><code>"human antigen"</code></td>
96           <td>All entries containing both terms in the exact order.</td>
97         </tr>
98         <tr>
99           <td><code>human -antigen</code></td>
100           <td rowspan="3">All entries containing the term <code>human</code>
101             but not <code>antigen</code>.
102           </td>
103         </tr>
104         <tr>
105           <td><code>human NOT antigen</code></td>
106         </tr>
107         <tr>
108           <td><code>human ! antigen</code></td>
109         </tr>
110         <tr>
111           <td><code>human OR mouse</code></td>
112           <td rowspan="2">All entries containing either term.</td>
113         </tr>
114         <tr>
115           <td><code>human || mouse</code></td>
116         </tr>
117         <tr>
118           <td><code>antigen AND (human OR mouse)</code></td>
119           <td>Using parentheses to override boolean precedence
120             rules.</td>
121         </tr>
122         <tr>
123           <td><code>anti*</code></td>
124           <td>All entries containing terms starting with <code>anti</code>.
125             Asterisks can also be used at the beginning and within
126             terms. <strong>Note:</strong> Terms starting with an
127             asterisk or a single letter followed by an asterisk can slow
128             down queries considerably.
129           </td>
130         </tr>
131         <tr>
132           <td><code> author:Tiger*</code></td>
133           <td>Citations that have an author whose name starts with
134             <code>Tiger</code>. To search in a specific field of a
135             dataset, you must prefix your search term with the field
136             name and a colon. To discover what fields can be queried
137             explicitly, observe the query hints that are shown after
138             submitting a query or use the query builder (see below).
139           </td>
140         </tr>
141         <tr>
142           <td><code>length:[100 TO *]</code></td>
143           <td>All entries with a sequence of at least 100 amino
144             acids.</td>
145         </tr>
146         <tr>
147           <td><code>citation:(author:Arai author:Chung)</code></td>
148           <td>All entries with a publication that was coauthored by
149             two specific authors.</td>
150         </tr>
151       </table></li>
152   </ul>
153   <p>
154     <strong>Result pagination</strong>
155   </p>
156   The query results returned from the UniProt server are paginated for
157   performance optimisation. The button labelled
158   <strong>'&nbsp;&lt;&lt;&nbsp;'</strong> and
159   <strong>'&nbsp;&gt;&gt;&nbsp;'</strong> can be used to navigate to the
160   next or previous result page respectively. The page range is shown on
161   the title bar of the Free Text Search interface. Jalview's pagination
162   implementation supports multiple selection of entries across multiple
163   pages.
164
165
166   <p>
167     <strong>Customising The UniProt Sequence Fetcher</strong>
168   </p>
169   <p>To change the displayed meta-data in the search result, click
170     the 'Customise Displayed Options' tab, and select the fields you'd
171     like to be displayed or removed.</p>
172   <p>
173     <em>The UniProt Free Test Search Interface was introduced in
174       Jalview 2.10.0</em>
175   </p>
176 </body>
177 </html>