1d368ef8ef0c3699ebd59e4c68edcb131a79fbc3
[jalview.git] / help / help / html / features / uniprotsequencefetcher.html
1 <html>
2 <!--
3  * Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)
4  * Copyright (C) $$Year-Rel$$ The Jalview Authors
5  * 
6  * This file is part of Jalview.
7  * 
8  * Jalview is free software: you can redistribute it and/or
9  * modify it under the terms of the GNU General Public License 
10  * as published by the Free Software Foundation, either version 3
11  * of the License, or (at your option) any later version.
12  *  
13  * Jalview is distributed in the hope that it will be useful, but 
14  * WITHOUT ANY WARRANTY; without even the implied warranty 
15  * of MERCHANTABILITY or FITNESS FOR A PARTICULAR 
16  * PURPOSE.  See the GNU General Public License for more details.
17  * 
18  * You should have received a copy of the GNU General Public License
19  * along with Jalview.  If not, see <http://www.gnu.org/licenses/>.
20  * The Jalview Authors are detailed in the 'AUTHORS' file.
21  -->
22 <head>
23 <title>The UniProt Free Text Search Interface</title>
24 </head>
25 <body>
26
27   <strong>The UniProt Free Text Search Interface</strong>
28   <br /> Since version 2.10 (October 2016), the Jalview Desktop
29   provides a search interface for interactive discovery and retrieval of
30   sequence data from UniProt. This dialog enables UniProt sequence
31   metadata to be searched with free text and structured queries, which
32   allows sequences to be located via gene name, keywords, or even
33   <em>via</em> manual cross-referencing from UniProt or other
34   bioinformatics websites.
35   <br />
36   <br />
37   <strong>Please Note:</strong>UniProt updated their API in July 2022.  Versions of Jalview older than 2.11.2.4 will not work with the July 2022 UniProt free text search.
38   <br />
39   <strong>The new UniProt API has a different search syntax</strong> for ranges of dates and numbers, and different query fields for advanced searches.  The general syntax of combining queries remains the same.  Because of these differences, your previously saved searches will not appear in the dropdown list next to the search box.  If you need to access these old searches they can be found in your <code>~/.jalview_properties</code> file with the label <code>CACHE.UNIPROT_FTS</code>.  If you want to transfer them to the new API search then copy the values to the <code>CACHE.UNIPROT_2022_FTS</code> label (or rename the existing label if the new one does not exist) (see the <a href="uniprotqueryfields.html">UniProtKB query fields</a> page).
40   <p>
41     To open the UniProt Sequence Fetcher, select UniProt as the database
42     from any <a href="seqfetch.html">Sequence Fetcher</a> dialog (opened
43     <em>via</em> <strong>&quot;File &#8594;Fetch
44       Sequences&quot;</strong>).
45   </p>
46   <p>
47     <img src="uniprotseqfetcher.png" align="left"
48       alt="UniProt sequence fetcher (introduced in Jalview 2.10)" />
49   </p>
50
51   <p>
52     <a name="uniprotfts"><strong>Searching the UniProt Database</strong></a>
53   </p>
54   <p>To search UniProt, simply begin typing in the text box. If the
55     'autosearch' check box is enabled, then after a short delay (about
56     1.5 seconds), results will be shown in the table below. Results are
57     also updated whenever you press Enter, and you can access previous
58     searches by pressing the 'Down' arrow or clicking the drop-down menu
59     icon at the side of the search box.</p>
60   <p>You can sort results by clicking on the displayed columns,
61     and select entries with the mouse or keyboard. Once you have
62     selected one or more entries, hit the <strong>OK</strong> button to
63     retrieve the sequences.
64   </p>
65   <ul>
66     <li><strong>Searching a specific UniProt field </strong> To
67       find sequences with particular UniProt metadata, you can select a
68       field to search from the drop-down menu.</li>
69
70
71     <li><strong>Bulk UniProt record retrieval</strong><br> To
72       retrieve sequences for a list of Uniprot accessions, please enter
73       them via the 'Retrieve IDs' tab.</li>
74
75     <li><strong><a name="text-search">Complex queries
76           with the UniProt query Syntax</a></strong> The text box also allows complex
77       queries to be entered. The table below provides a brief overview
78       of the supported syntax (see the <a href="uniprotqueryfields.html">UniProtKB query fields</a> page for more details):
79       <table border="1" width="95%">
80         <tr>
81           <td><code>human antigen</code></td>
82           <td rowspan="3">All entries containing both terms.</td>
83         </tr>
84         <tr>
85           <td><code>human AND antigen</code></td>
86         </tr>
87         <tr>
88           <td><code>human &amp;&amp; antigen</code></td>
89         </tr>
90         <tr>
91           <td><code>"human antigen"</code></td>
92           <td>All entries containing both terms in the exact order.</td>
93         </tr>
94         <tr>
95           <td><code>human -antigen</code></td>
96           <td rowspan="3">All entries containing the term <code>human</code>
97             but not <code>antigen</code>.
98           </td>
99         </tr>
100         <tr>
101           <td><code>human NOT antigen</code></td>
102         </tr>
103         <tr>
104           <td><code>human ! antigen</code></td>
105         </tr>
106         <tr>
107           <td><code>human OR mouse</code></td>
108           <td rowspan="2">All entries containing either term.</td>
109         </tr>
110         <tr>
111           <td><code>human || mouse</code></td>
112         </tr>
113         <tr>
114           <td><code>antigen AND (human OR mouse)</code></td>
115           <td>Using parentheses to override boolean precedence
116             rules.</td>
117         </tr>
118         <tr>
119           <td><code>anti*</code></td>
120           <td>All entries containing terms starting with <code>anti</code>.
121             Asterisks can also be used at the beginning and within
122             terms. <strong>Note:</strong> Terms starting with an
123             asterisk or a single letter followed by an asterisk can slow
124             down queries considerably.
125           </td>
126         </tr>
127         <tr>
128           <td><code> author:Tiger*</code></td>
129           <td>Citations that have an author whose name starts with
130             <code>Tiger</code>. To search in a specific field of a
131             dataset, you must prefix your search term with the field
132             name and a colon. To discover what fields can be queried
133             explicitly, observe the query hints that are shown after
134             submitting a query or use the query builder (see below).
135           </td>
136         </tr>
137         <tr>
138           <td><code>length:[100 TO *]</code></td>
139           <td>All entries with a sequence of at least 100 amino
140             acids.</td>
141         </tr>
142         <tr>
143           <td><code>(lit_author:Arai) AND (lit_author:Chung)</code></td>
144           <td>All entries with a publication that was coauthored by
145             two specific authors.</td>
146         </tr>
147       </table></li>
148   </ul>
149   <p>
150     <strong>Result pagination</strong>
151   </p>
152   The query results returned from the UniProt server are paginated for
153   performance optimisation. The button labelled
154   <strong>'&nbsp;&lt;&lt;&nbsp;'</strong> and
155   <strong>'&nbsp;&gt;&gt;&nbsp;'</strong> can be used to navigate to the
156   next or previous result page respectively. The page range is shown on
157   the title bar of the Free Text Search interface. Jalview's pagination
158   implementation supports multiple selection of entries across multiple
159   pages.
160
161
162   <p>
163     <strong>Customising The UniProt Sequence Fetcher</strong>
164   </p>
165   <p>To change the displayed meta-data in the search result, click
166     the 'Customise Displayed Options' tab, and select the fields you'd
167     like to be displayed or removed.</p>
168   <p>
169     <em>The UniProt Free Test Search Interface was introduced in
170       Jalview 2.10.0 and updated to the July 2022 API in Jalview 2.11.2.4</em>
171   </p>
172 </body>
173 </html>