Centralized statistic collector. All WS are converted to use the same input and outpu...
[jabaws.git] / TODO.txt
1 TODO: \r
2 \r
3 Test all WS as names from Executables were removed\r
4 \r
5 Add default names for input and output in every executable and use them consistently\r
6 throughts (e.g. in all WS). Best of all use the same name from SceletalExectuable \r
7 For statistics. \r
8 \r
9 FIXME: \r
10 Conecting to JABAWS version 2 service\r
11 09-Feb-2011 15:27:53 compbio.ws.client.Jws2Client connect\r
12 INFO: Connected successfully!\r
13 Exception in thread "main" java.lang.NullPointerException\r
14         at compbio.ws.client.MetadataHelper.getParametersList(MetadataHelper.java:30)\r
15         at compbio.ws.client.Jws2Client.<init>(Jws2Client.java:179)\r
16         at compbio.ws.client.Jws2Client.main(Jws2Client.java:483)\r
17         \r
18 ScoreManager should output scores properly \r
19 \r
20 Allow empty Parameters and Preset files! \r
21 \r
22 Check the WS input and reject it on submission rather then of access with error message\r
23 \r
24 Globprot need a proper reference to bio python and sav_gol binaries -> they should be \r
25 somehow taken from disembl. \r
26 \r
27 Add registry service to query services status\r
28 \r
29 Refactor web services checker to enable a programmatic access to its methods.\r
30 Rename it to avoid confusion with jabaws client\r
31 \r
32 Finish the client\r
33 \r
34 Add interface for Jalview annotation \r
35 Add the method to return Jalview Annotation to SequenceAnnotation IF  \r
36 \r
37 Develop generic Interface to return Jalview annotation for easy to add new \r
38 services (?) \r
39 \r
40 Replace conservation.Method with server.ws.Method \r
41 and try building WS. If this does not work - get rid of Method\r
42 \r
43 Output file parsing for stat reporting\r
44 cluster engine stat of www-jws2 user\r
45 \r
46 integrate the above to tweak the size of the local job\r
47 \r
48 Add AACon ws\r
49 Add iupred ws http://iupred.enzim.hu/\r
50 Add globprot ws - does not report raw scores, just regions\r
51 Add ronn ws\r
52 \r
53 Philogeny Mrbayes + Philip\r
54  \r
55 USE CASE - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE\r
56 - Receive user alignment \r
57 - use hmmerbuild to turn it to profile\r
58 - use hmmersearch to search the database \r
59 \r
60 #END OF - TURN ALIGNMENT INTO PROFILE AND SEARCH SEQUENCE DATABASE USECASE \r
61 \r
62 New data model for representing psiblast,blast,phmmer,jackhmmer results\r
63 \r
64 new parsers for the above programmes output (Stockholm MSA format?)\r
65 \r
66 Think hard on what to do with large output files? \r
67 e.g. serve the hits table in full, but retrieve alignments on demand.\r
68 What actually needs to be sent?   \r
69 \r
70 Add facility to distribute other results of the calculations like the trees and \r
71 annotation file for probcons. \r
72 \r
73 # END OF SEARCHING SEQUENCE DATABASE USECASE\r
74 \r
75 Good toString method for Limits (test with command line client -limits)\r
76 \r
77 JABA DOCS\r
78 (later) Define limits for presets - if required\r
79 (later) Add documentation on Presets, Parameters and Limits\r
80 (later) Explain how to define a limit\r
81 \r
82 Add test for repeated result collection from cluster engine\r
83 \r
84 (low) Pack the test cases and build file to run them in one of the distributives \r
85 \r
86 (low) Add logging facility to WSTester so more details of the problem can be reported\r
87 \r
88 (low) Statistics collector for engines (number of operations/timing)\r
89 \r
90 (later) WRAP Amps\r
91 \r
92 (later) Implement utility to rerun died tasks\r
93 \r
94 (later) Add recognition for executables for the different architectures\r
95 \r
96 (later) use Latch to manage engine reservations. Reservations for parallel jobs? \r
97 \r
98 DONE\r
99 WILL NOT DO: Progress bars - needs assessing how long does it take to run a task\r
100 DONE: LocalExecutor service must be shutdown on web application undeploy event not on JVM shutdown. \r
101       This is because JVM is still running even after web application is shut down!\r
102 DONE: Use absolute path for web site download links as archives are not included into distro!\r
103 DONE: Rearrange web site docs - add links to the top of the page to the topics discussed below\r
104 DONE: Put the documentation for various executables online\r
105 DONE: Make left gradient image one-two characters larger + change "For developer ->For Developers"\r
106 DONE: test local/cluster execution - test Load balancer\r
107 DONE: Improve SimpleWS client so it can be scripted against: give user alignment and accept parameters\r
108 DONE: Make a configuration tester class (check that configuration files point to the executables, and they can be executed)\r
109 DONE: PUT CLIENT JAR INTO WEB-INF/LIB - most likely need to get rid of dist prefix in the build file\r
110 DONE: Different packages for download and dundee. generic vs specific settings. \r
111 DONE: JAVADOC\r
112 DONE: Refactor EngineResourcesLeak tester to hide a map implementation!\r
113 DONE: Compile executables for linux in the most generic way\r
114 DONE: Make different log4j configuration files / web services logs.\r
115 DONE: System manual\r
116 DONE: Developer doc\r
117 DONE: How to\r
118 DONE: Prepare different packages\r
119 DONE: extract commonly used names into variable in the build script\r
120 DONE: Test for high load conditions (TestNG?)\r
121 DONE: (low) Fix: Started jobs with unknown completion status reported as FINISHED by  msaws.getJobStatus(taskId) (see SimpleWSClient)\r
122 DONE: fix compile binaries script\r
123 DONE: Make script to change executable flag for linux systems\r
124 DONE: jobsout must be created within war\r
125 DONE: enable relative paths for local engine conf temp dir\r
126 COUND NOT REPRODUCE: fix cluster job status - RUNNING -> UNDEFINED\r
127 DONE: throw JobSubmission exception with appropriate method instead - (low) code discoverer/tester for ws - e.g. after war deployment to find out what actually works\r
128 DONE: fix build scripts after reorganising project\r
129 DONE: package as war file for deployment\r
130 DONE: package for jalview distro for local execution\r
131 DONE: reorganise project into independent chunks\r
132 DONE: test Parameter & Option toCommand method\r
133 DONE: Replace WS methods with new CommandBuilder.toCommand()\r
134 DONE: Setting default values is validated as external method \r
135 DONE: Refactoring to extract data model, and engines is performed\r
136 DONE: Default value is adopted for passing new Option values to server side\r
137 DONE: Converting Options to commands delegated to CommandBuilder  \r
138 DONE: Make Arguments mutable to facilitate default value setting for WS\r
139 DONE: Matrix files for alignment programme\r
140 DONE: Clean up testcases\r
141 DONE: Replace List<String> as command line parameters abstraction to dedicated CommandBuilder class \r
142 DONE: Parallel execution for tcoffee jobs\r
143 DONE: Copyright added\r
144 DONE: WRAP ProbCons\r
145 DONE: think about time limits and cluster parameters for parallel execution - NativeSpecs for cluster is implemented\r
146 DONE: (low) Use for WS: (@WebParam(name = "name") String name) {\r
147 DONE: Implement rough policy for runtimes (e.g. do not run excessively long tasks on the local machine if cluster is available)\r
148 DONE: Write tomcat conf to expose WS\r
149 DONE: access control to web.xml\r
150 DONE: Statistics collector for WS\r
151 DONE: implements limits for web services\r
152 DONE: WS clients must be able to connect to a web service given the service url. \r
153 e.i. ws URL should not be compiled in using wsimport, but determined from \r
154 the configuration file.  \r
155 \r
156 DONE: Could not find configuration files if run from within servlet container\r
157 DONE: Add ways to get engine based on the key for everything but submission of the new tasks \r
158 DONE: Add cache to Cluster JOBID - so that at least jobs for which results have not been collected is cached.\r
159 DONE: FINISHED overrides FINISHED with time stamp!\r
160 DONE: Consider think about JobStatus and StatFileStatus\r
161 DONE: a method to read 3 chars at the beginning of the file to indicate a progress is added\r
162 DONE: ConfiguredExecutable<?> al = sexec.getResults(jobId); || Alignment ?\r
163 DONE: ClustalW - OUTput must be set !\r
164 DONE: Add accessor methods to get a DUMP of the process output \r
165 DONE: FilePuller should be cached to avoid excessive fs exercise\r
166 DONE: Test List of the processes (ensure no memory leaks)\r
167 PART DONE - On the client on shutdown remember the task list - server tasks could be loaded and executed from saved run configurations, client should decide for themselves what they want\r
168 DONE: Persist the task list to enable later result collection on the server side\r
169 DONE Wrap TCoffee\r
170 DONE: improve parameters handling - new schema + update for all parameters\r
171 DONE: Cluster jobs report submitting and result collecting/finishing time (for sync jobs only(!)) and cluster jobid in the corresponding files  \r
172 DONE: Local jobs report starting and finising times in files with corresponding names in the task directory  \r
173 DONE: Generalize getResult method for MSA runners\r
174 DONE: Create test suits\r
175 DONE: Convert junit tests to TestNG\r
176 DONE: Redirect output & error streams to the named files as some processed need this  \r
177 DONE: Extract generilyzed class with most of the method for individual executable to use\r
178 DONE: Refit wrappers to use the generalised class to avoid duplication  \r
179 DONE: Pass environment variable settings to the executable\r
180 DONE: Complete AsyncExecutors implementation\r
181 DONE: Look to unify methods for engines\r
182 DONE: Provide way around of generated directory setup for test cases(?)\r
183 DONE: Fix the test cases for local engine (need to set directory on executable explicitly)\r
184 DONE: Make log files for processes err and out for local execution\r
185 DONE: Trace where AsyncExcel called with null Executable and attempts to create a new directory repeatedly\r
186 DONE: directory generator\r
187 DONE: tests for cancel \r
188 DONE tests for getStatus\r
189 DONE  ws async\r
190 DONE: parametrized clustal operations\r
191 DONE: test large datasets handling \r
192 DONE: write load balancer \r
193 DONE: (low) task persistance\r
194 DONE: Look at CancellableTask if with Sync and AsyncExecutor \r