exclude cancelled jobs from incomplete
[jabaws.git] / TODO.txt
1 TODO: \r
2 Registry 1 week\r
3 webservices - 1 week\r
4 client - 1 week\r
5 docs - 1 week\r
6 \r
7 Cluster stats: \r
8  +cancelled should not be reported as incomplete!\r
9  -Remove hyperlinks from tasks which workdirs were removed \r
10  -graph generation \r
11  -user documentation (do not forget how to enable follow symlinks!)\r
12  -use the same name for output for different executables\r
13  +ant task to clean up clean stat db task before packing web app\r
14  +pack web apps with stat db (NOT TESTED!)\r
15  +change input size bites\r
16  +add help info for each column in the detailed job list table\r
17  +replace default -1 with ? \r
18  +delete and re-import the database to fix clustal input staff    \r
19 \r
20 add to help text: To disable a web service remove it from WEB-INF/sun-jaxws.xml descriptor\r
21 \r
22 add to help: VirtualBox 4.0.4 works fine with JABAWS update links \r
23 \r
24 rename jaba.war to jabaws.war and make sure jabaws context path is used throughout. \r
25 \r
26 Current stat collector has to rely on file dates! \r
27 \r
28 Test all WS as names from Executables were removed\r
29 \r
30 Add default names for input and output in every executable and use them consistently\r
31 throughts (e.g. in all WS). Best of all use the same name from SceletalExectuable \r
32 For statistics. \r
33 \r
34 FIXME: \r
35 Conecting to JABAWS version 2 service\r
36 09-Feb-2011 15:27:53 compbio.ws.client.Jws2Client connect\r
37 INFO: Connected successfully!\r
38 Exception in thread "main" java.lang.NullPointerException\r
39         at compbio.ws.client.MetadataHelper.getParametersList(MetadataHelper.java:30)\r
40         at compbio.ws.client.Jws2Client.<init>(Jws2Client.java:179)\r
41         at compbio.ws.client.Jws2Client.main(Jws2Client.java:483)\r
42         \r
43 ScoreManager should output scores properly \r
44 \r
45 Allow empty Parameters and Preset files! \r
46 \r
47 Check the WS input and reject it on submission rather then of access with error message\r
48 \r
49 Globprot need a proper reference to bio python and sav_gol binaries -> they should be \r
50 somehow taken from disembl. \r
51 \r
52 Add registry service to query services status\r
53 \r
54 Refactor web services checker to enable a programmatic access to its methods.\r
55 Rename it to avoid confusion with jabaws client\r
56 \r
57 Finish the client\r
58 \r
59 Add interface for Jalview annotation \r
60 Add the method to return Jalview Annotation to SequenceAnnotation IF  \r
61 \r
62 Develop generic Interface to return Jalview annotation for easy to add new \r
63 services (?) \r
64 \r
65 Replace conservation.Method with server.ws.Method \r
66 and try building WS. If this does not work - get rid of Method\r
67 \r
68 Output file parsing for stat reporting\r
69 cluster engine stat of www-jws2 user\r
70 \r
71 integrate the above to tweak the size of the local job\r
72 \r
73 Add AACon ws\r
74 Add iupred ws http://iupred.enzim.hu/\r
75 Add globprot ws - does not report raw scores, just regions\r
76 Add ronn ws\r
77 \r
78 Philogeny Mrbayes + Philip\r
79  \r
80 USE CASE - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE\r
81 - Receive user alignment \r
82 - use hmmerbuild to turn it to profile\r
83 - use hmmersearch to search the database \r
84 \r
85 #END OF - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE \r
86 \r
87 New data model for representing psiblast,blast,phmmer,jackhmmer results\r
88 \r
89 new parsers for the above programmes output (Stockholm MSA format?)\r
90 \r
91 Think hard on what to do with large output files? \r
92 e.g. serve the hits table in full, but retrieve alignments on demand.\r
93 What actually needs to be sent?   \r
94 \r
95 Add facility to distribute other results of the calculations like the trees and \r
96 annotation file for probcons. \r
97 \r
98 # END OF SEARCHING SEQUENCE DATABASE USECASE\r
99 \r
100 Good toString method for Limits (test with command line client -limits)\r
101 \r
102 JABA DOCS\r
103 (later) Define limits for presets - if required\r
104 (later) Add documentation on Presets, Parameters and Limits\r
105 (later) Explain how to define a limit\r
106 \r
107 Add test for repeated result collection from cluster engine\r
108 \r
109 (low) Pack the test cases and build file to run them in one of the distributives \r
110 \r
111 (low) Add logging facility to WSTester so more details of the problem can be reported\r
112 \r
113 (low) Statistics collector for engines (number of operations/timing)\r
114 \r
115 (later) WRAP Amps\r
116 \r
117 (later) Implement utility to rerun died tasks\r
118 \r
119 (later) Add recognition for executables for the different architectures\r
120 \r
121 (later) use Latch to manage engine reservations. Reservations for parallel jobs? \r
122 \r
123 DONE\r
124 WILL NOT DO: Progress bars - needs assessing how long does it take to run a task\r
125 DONE: LocalExecutor service must be shutdown on web application undeploy event not on JVM shutdown. \r
126       This is because JVM is still running even after web application is shut down!\r
127 DONE: Use absolute path for web site download links as archives are not included into distro!\r
128 DONE: Rearrange web site docs - add links to the top of the page to the topics discussed below\r
129 DONE: Put the documentation for various executables online\r
130 DONE: Make left gradient image one-two characters larger + change "For developer ->For Developers"\r
131 DONE: test local/cluster execution - test Load balancer\r
132 DONE: Improve SimpleWS client so it can be scripted against: give user alignment and accept parameters\r
133 DONE: Make a configuration tester class (check that configuration files point to the executables, and they can be executed)\r
134 DONE: PUT CLIENT JAR INTO WEB-INF/LIB - most likely need to get rid of dist prefix in the build file\r
135 DONE: Different packages for download and dundee. generic vs specific settings. \r
136 DONE: JAVADOC\r
137 DONE: Refactor EngineResourcesLeak tester to hide a map implementation!\r
138 DONE: Compile executables for linux in the most generic way\r
139 DONE: Make different log4j configuration files / web services logs.\r
140 DONE: System manual\r
141 DONE: Developer doc\r
142 DONE: How to\r
143 DONE: Prepare different packages\r
144 DONE: extract commonly used names into variable in the build script\r
145 DONE: Test for high load conditions (TestNG?)\r
146 DONE: (low) Fix: Started jobs with unknown completion status reported as FINISHED by  msaws.getJobStatus(taskId) (see SimpleWSClient)\r
147 DONE: fix compile binaries script\r
148 DONE: Make script to change executable flag for linux systems\r
149 DONE: jobsout must be created within war\r
150 DONE: enable relative paths for local engine conf temp dir\r
151 COUND NOT REPRODUCE: fix cluster job status - RUNNING -> UNDEFINED\r
152 DONE: throw JobSubmission exception with appropriate method instead - (low) code discoverer/tester for ws - e.g. after war deployment to find out what actually works\r
153 DONE: fix build scripts after reorganising project\r
154 DONE: package as war file for deployment\r
155 DONE: package for jalview distro for local execution\r
156 DONE: reorganise project into independent chunks\r
157 DONE: test Parameter & Option toCommand method\r
158 DONE: Replace WS methods with new CommandBuilder.toCommand()\r
159 DONE: Setting default values is validated as external method \r
160 DONE: Refactoring to extract data model, and engines is performed\r
161 DONE: Default value is adopted for passing new Option values to server side\r
162 DONE: Converting Options to commands delegated to CommandBuilder  \r
163 DONE: Make Arguments mutable to facilitate default value setting for WS\r
164 DONE: Matrix files for alignment programme\r
165 DONE: Clean up testcases\r
166 DONE: Replace List<String> as command line parameters abstraction to dedicated CommandBuilder class \r
167 DONE: Parallel execution for tcoffee jobs\r
168 DONE: Copyright added\r
169 DONE: WRAP ProbCons\r
170 DONE: think about time limits and cluster parameters for parallel execution - NativeSpecs for cluster is implemented\r
171 DONE: (low) Use for WS: (@WebParam(name = "name") String name) {\r
172 DONE: Implement rough policy for runtimes (e.g. do not run excessively long tasks on the local machine if cluster is available)\r
173 DONE: Write tomcat conf to expose WS\r
174 DONE: access control to web.xml\r
175 DONE: Statistics collector for WS\r
176 DONE: implements limits for web services\r
177 DONE: WS clients must be able to connect to a web service given the service url. \r
178 e.i. ws URL should not be compiled in using wsimport, but determined from \r
179 the configuration file.  \r
180 \r
181 DONE: Could not find configuration files if run from within servlet container\r
182 DONE: Add ways to get engine based on the key for everything but submission of the new tasks \r
183 DONE: Add cache to Cluster JOBID - so that at least jobs for which results have not been collected is cached.\r
184 DONE: FINISHED overrides FINISHED with time stamp!\r
185 DONE: Consider think about JobStatus and StatFileStatus\r
186 DONE: a method to read 3 chars at the beginning of the file to indicate a progress is added\r
187 DONE: ConfiguredExecutable<?> al = sexec.getResults(jobId); || Alignment ?\r
188 DONE: ClustalW - OUTput must be set !\r
189 DONE: Add accessor methods to get a DUMP of the process output \r
190 DONE: FilePuller should be cached to avoid excessive fs exercise\r
191 DONE: Test List of the processes (ensure no memory leaks)\r
192 PART DONE - On the client on shutdown remember the task list - server tasks could be loaded and executed from saved run configurations, client should decide for themselves what they want\r
193 DONE: Persist the task list to enable later result collection on the server side\r
194 DONE Wrap TCoffee\r
195 DONE: improve parameters handling - new schema + update for all parameters\r
196 DONE: Cluster jobs report submitting and result collecting/finishing time (for sync jobs only(!)) and cluster jobid in the corresponding files  \r
197 DONE: Local jobs report starting and finising times in files with corresponding names in the task directory  \r
198 DONE: Generalize getResult method for MSA runners\r
199 DONE: Create test suits\r
200 DONE: Convert junit tests to TestNG\r
201 DONE: Redirect output & error streams to the named files as some processed need this  \r
202 DONE: Extract generilyzed class with most of the method for individual executable to use\r
203 DONE: Refit wrappers to use the generalised class to avoid duplication  \r
204 DONE: Pass environment variable settings to the executable\r
205 DONE: Complete AsyncExecutors implementation\r
206 DONE: Look to unify methods for engines\r
207 DONE: Provide way around of generated directory setup for test cases(?)\r
208 DONE: Fix the test cases for local engine (need to set directory on executable explicitly)\r
209 DONE: Make log files for processes err and out for local execution\r
210 DONE: Trace where AsyncExcel called with null Executable and attempts to create a new directory repeatedly\r
211 DONE: directory generator\r
212 DONE: tests for cancel \r
213 DONE tests for getStatus\r
214 DONE  ws async\r
215 DONE: parametrized clustal operations\r
216 DONE: test large datasets handling \r
217 DONE: write load balancer \r
218 DONE: (low) task persistance\r
219 DONE: Look at CancellableTask if with Sync and AsyncExecutor \r