Add exec statistics processor & derby database
[jabaws.git] / TODO.txt
1 TODO: \r
2 \r
3 Current stat collector has to rely on file dates! \r
4 \r
5 Test all WS as names from Executables were removed\r
6 \r
7 Add default names for input and output in every executable and use them consistently\r
8 throughts (e.g. in all WS). Best of all use the same name from SceletalExectuable \r
9 For statistics. \r
10 \r
11 FIXME: \r
12 Conecting to JABAWS version 2 service\r
13 09-Feb-2011 15:27:53 compbio.ws.client.Jws2Client connect\r
14 INFO: Connected successfully!\r
15 Exception in thread "main" java.lang.NullPointerException\r
16         at compbio.ws.client.MetadataHelper.getParametersList(MetadataHelper.java:30)\r
17         at compbio.ws.client.Jws2Client.<init>(Jws2Client.java:179)\r
18         at compbio.ws.client.Jws2Client.main(Jws2Client.java:483)\r
19         \r
20 ScoreManager should output scores properly \r
21 \r
22 Allow empty Parameters and Preset files! \r
23 \r
24 Check the WS input and reject it on submission rather then of access with error message\r
25 \r
26 Globprot need a proper reference to bio python and sav_gol binaries -> they should be \r
27 somehow taken from disembl. \r
28 \r
29 Add registry service to query services status\r
30 \r
31 Refactor web services checker to enable a programmatic access to its methods.\r
32 Rename it to avoid confusion with jabaws client\r
33 \r
34 Finish the client\r
35 \r
36 Add interface for Jalview annotation \r
37 Add the method to return Jalview Annotation to SequenceAnnotation IF  \r
38 \r
39 Develop generic Interface to return Jalview annotation for easy to add new \r
40 services (?) \r
41 \r
42 Replace conservation.Method with server.ws.Method \r
43 and try building WS. If this does not work - get rid of Method\r
44 \r
45 Output file parsing for stat reporting\r
46 cluster engine stat of www-jws2 user\r
47 \r
48 integrate the above to tweak the size of the local job\r
49 \r
50 Add AACon ws\r
51 Add iupred ws http://iupred.enzim.hu/\r
52 Add globprot ws - does not report raw scores, just regions\r
53 Add ronn ws\r
54 \r
55 Philogeny Mrbayes + Philip\r
56  \r
57 USE CASE - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE\r
58 - Receive user alignment \r
59 - use hmmerbuild to turn it to profile\r
60 - use hmmersearch to search the database \r
61 \r
62 #END OF - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE \r
63 \r
64 New data model for representing psiblast,blast,phmmer,jackhmmer results\r
65 \r
66 new parsers for the above programmes output (Stockholm MSA format?)\r
67 \r
68 Think hard on what to do with large output files? \r
69 e.g. serve the hits table in full, but retrieve alignments on demand.\r
70 What actually needs to be sent?   \r
71 \r
72 Add facility to distribute other results of the calculations like the trees and \r
73 annotation file for probcons. \r
74 \r
75 # END OF SEARCHING SEQUENCE DATABASE USECASE\r
76 \r
77 Good toString method for Limits (test with command line client -limits)\r
78 \r
79 JABA DOCS\r
80 (later) Define limits for presets - if required\r
81 (later) Add documentation on Presets, Parameters and Limits\r
82 (later) Explain how to define a limit\r
83 \r
84 Add test for repeated result collection from cluster engine\r
85 \r
86 (low) Pack the test cases and build file to run them in one of the distributives \r
87 \r
88 (low) Add logging facility to WSTester so more details of the problem can be reported\r
89 \r
90 (low) Statistics collector for engines (number of operations/timing)\r
91 \r
92 (later) WRAP Amps\r
93 \r
94 (later) Implement utility to rerun died tasks\r
95 \r
96 (later) Add recognition for executables for the different architectures\r
97 \r
98 (later) use Latch to manage engine reservations. Reservations for parallel jobs? \r
99 \r
100 DONE\r
101 WILL NOT DO: Progress bars - needs assessing how long does it take to run a task\r
102 DONE: LocalExecutor service must be shutdown on web application undeploy event not on JVM shutdown. \r
103       This is because JVM is still running even after web application is shut down!\r
104 DONE: Use absolute path for web site download links as archives are not included into distro!\r
105 DONE: Rearrange web site docs - add links to the top of the page to the topics discussed below\r
106 DONE: Put the documentation for various executables online\r
107 DONE: Make left gradient image one-two characters larger + change "For developer ->For Developers"\r
108 DONE: test local/cluster execution - test Load balancer\r
109 DONE: Improve SimpleWS client so it can be scripted against: give user alignment and accept parameters\r
110 DONE: Make a configuration tester class (check that configuration files point to the executables, and they can be executed)\r
111 DONE: PUT CLIENT JAR INTO WEB-INF/LIB - most likely need to get rid of dist prefix in the build file\r
112 DONE: Different packages for download and dundee. generic vs specific settings. \r
113 DONE: JAVADOC\r
114 DONE: Refactor EngineResourcesLeak tester to hide a map implementation!\r
115 DONE: Compile executables for linux in the most generic way\r
116 DONE: Make different log4j configuration files / web services logs.\r
117 DONE: System manual\r
118 DONE: Developer doc\r
119 DONE: How to\r
120 DONE: Prepare different packages\r
121 DONE: extract commonly used names into variable in the build script\r
122 DONE: Test for high load conditions (TestNG?)\r
123 DONE: (low) Fix: Started jobs with unknown completion status reported as FINISHED by  msaws.getJobStatus(taskId) (see SimpleWSClient)\r
124 DONE: fix compile binaries script\r
125 DONE: Make script to change executable flag for linux systems\r
126 DONE: jobsout must be created within war\r
127 DONE: enable relative paths for local engine conf temp dir\r
128 COUND NOT REPRODUCE: fix cluster job status - RUNNING -> UNDEFINED\r
129 DONE: throw JobSubmission exception with appropriate method instead - (low) code discoverer/tester for ws - e.g. after war deployment to find out what actually works\r
130 DONE: fix build scripts after reorganising project\r
131 DONE: package as war file for deployment\r
132 DONE: package for jalview distro for local execution\r
133 DONE: reorganise project into independent chunks\r
134 DONE: test Parameter & Option toCommand method\r
135 DONE: Replace WS methods with new CommandBuilder.toCommand()\r
136 DONE: Setting default values is validated as external method \r
137 DONE: Refactoring to extract data model, and engines is performed\r
138 DONE: Default value is adopted for passing new Option values to server side\r
139 DONE: Converting Options to commands delegated to CommandBuilder  \r
140 DONE: Make Arguments mutable to facilitate default value setting for WS\r
141 DONE: Matrix files for alignment programme\r
142 DONE: Clean up testcases\r
143 DONE: Replace List<String> as command line parameters abstraction to dedicated CommandBuilder class \r
144 DONE: Parallel execution for tcoffee jobs\r
145 DONE: Copyright added\r
146 DONE: WRAP ProbCons\r
147 DONE: think about time limits and cluster parameters for parallel execution - NativeSpecs for cluster is implemented\r
148 DONE: (low) Use for WS: (@WebParam(name = "name") String name) {\r
149 DONE: Implement rough policy for runtimes (e.g. do not run excessively long tasks on the local machine if cluster is available)\r
150 DONE: Write tomcat conf to expose WS\r
151 DONE: access control to web.xml\r
152 DONE: Statistics collector for WS\r
153 DONE: implements limits for web services\r
154 DONE: WS clients must be able to connect to a web service given the service url. \r
155 e.i. ws URL should not be compiled in using wsimport, but determined from \r
156 the configuration file.  \r
157 \r
158 DONE: Could not find configuration files if run from within servlet container\r
159 DONE: Add ways to get engine based on the key for everything but submission of the new tasks \r
160 DONE: Add cache to Cluster JOBID - so that at least jobs for which results have not been collected is cached.\r
161 DONE: FINISHED overrides FINISHED with time stamp!\r
162 DONE: Consider think about JobStatus and StatFileStatus\r
163 DONE: a method to read 3 chars at the beginning of the file to indicate a progress is added\r
164 DONE: ConfiguredExecutable<?> al = sexec.getResults(jobId); || Alignment ?\r
165 DONE: ClustalW - OUTput must be set !\r
166 DONE: Add accessor methods to get a DUMP of the process output \r
167 DONE: FilePuller should be cached to avoid excessive fs exercise\r
168 DONE: Test List of the processes (ensure no memory leaks)\r
169 PART DONE - On the client on shutdown remember the task list - server tasks could be loaded and executed from saved run configurations, client should decide for themselves what they want\r
170 DONE: Persist the task list to enable later result collection on the server side\r
171 DONE Wrap TCoffee\r
172 DONE: improve parameters handling - new schema + update for all parameters\r
173 DONE: Cluster jobs report submitting and result collecting/finishing time (for sync jobs only(!)) and cluster jobid in the corresponding files  \r
174 DONE: Local jobs report starting and finising times in files with corresponding names in the task directory  \r
175 DONE: Generalize getResult method for MSA runners\r
176 DONE: Create test suits\r
177 DONE: Convert junit tests to TestNG\r
178 DONE: Redirect output & error streams to the named files as some processed need this  \r
179 DONE: Extract generilyzed class with most of the method for individual executable to use\r
180 DONE: Refit wrappers to use the generalised class to avoid duplication  \r
181 DONE: Pass environment variable settings to the executable\r
182 DONE: Complete AsyncExecutors implementation\r
183 DONE: Look to unify methods for engines\r
184 DONE: Provide way around of generated directory setup for test cases(?)\r
185 DONE: Fix the test cases for local engine (need to set directory on executable explicitly)\r
186 DONE: Make log files for processes err and out for local execution\r
187 DONE: Trace where AsyncExcel called with null Executable and attempts to create a new directory repeatedly\r
188 DONE: directory generator\r
189 DONE: tests for cancel \r
190 DONE tests for getStatus\r
191 DONE  ws async\r
192 DONE: parametrized clustal operations\r
193 DONE: test large datasets handling \r
194 DONE: write load balancer \r
195 DONE: (low) task persistance\r
196 DONE: Look at CancellableTask if with Sync and AsyncExecutor \r