in progress
[jalview.git] / forester / java / src / org / forester / util / BasicTableParser.java
1 // $Id:
2 // FORESTER -- software libraries and applications
3 // for evolutionary biology research and applications.
4 //
5 // Copyright (C) 2008-2009 Christian M. Zmasek
6 // Copyright (C) 2008-2009 Burnham Institute for Medical Research
7 // All rights reserved
8 //
9 // This library is free software; you can redistribute it and/or
10 // modify it under the terms of the GNU Lesser General Public
11 // License as published by the Free Software Foundation; either
12 // version 2.1 of the License, or (at your option) any later version.
13 //
14 // This library is distributed in the hope that it will be useful,
15 // but WITHOUT ANY WARRANTY; without even the implied warranty of
16 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
17 // Lesser General Public License for more details.
18 //
19 // You should have received a copy of the GNU Lesser General Public
20 // License along with this library; if not, write to the Free Software
21 // Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA
22 //
23 // Contact: phylosoft @ gmail . com
24 // WWW: www.phylosoft.org/forester
25
26 package org.forester.util;
27
28 import java.io.BufferedReader;
29 import java.io.IOException;
30 import java.util.ArrayList;
31 import java.util.List;
32 import java.util.StringTokenizer;
33
34 public class BasicTableParser {
35
36     private final static String START_OF_COMMENT_LINE_DEFAULT = "#";
37
38     private BasicTableParser() {
39     }
40
41     public static BasicTable<String> parse( final Object source, final String column_delimiter ) throws IOException {
42         return BasicTableParser.parse( source, column_delimiter, false, false, START_OF_COMMENT_LINE_DEFAULT, false )
43                 .get( 0 );
44     }
45
46     public static BasicTable<String> parse( final Object source,
47                                             final String column_delimiter,
48                                             final boolean use_first_separator_only,
49                                             final boolean use_last_separator_only ) throws IOException {
50         return BasicTableParser.parse( source,
51                                        column_delimiter,
52                                        use_first_separator_only,
53                                        use_last_separator_only,
54                                        START_OF_COMMENT_LINE_DEFAULT,
55                                        false ).get( 0 );
56     }
57
58     public static List<BasicTable<String>> parse( final Object source,
59                                                   final String column_delimiter,
60                                                   final boolean use_first_separator_only,
61                                                   final boolean use_last_separator_only,
62                                                   final String start_of_comment_line,
63                                                   final boolean tables_separated_by_single_string_line )
64             throws IOException {
65         final BufferedReader reader = ForesterUtil.obtainReader( source );
66         final List<BasicTable<String>> tables = new ArrayList<BasicTable<String>>();
67         BasicTable<String> table = new BasicTable<String>();
68         int row = 0;
69         String line;
70         boolean saw_first_table = false;
71         final boolean use_start_of_comment_line = !( ForesterUtil.isEmpty( start_of_comment_line ) );
72         while ( ( line = reader.readLine() ) != null ) {
73             line = line.trim();
74             if ( !ForesterUtil.isEmpty( line )
75                     && ( ( ( line.charAt( 0 ) == '"' ) && ( line.charAt( line.length() - 1 ) == '"' ) && ( ForesterUtil
76                             .countChars( line, '"' ) == 2 ) ) || ( ( line.charAt( 0 ) == '\'' )
77                             && ( line.charAt( line.length() - 1 ) == '\'' ) && ( ForesterUtil.countChars( line, '\'' ) == 2 ) ) ) ) {
78                 line = line.substring( 1, line.length() - 1 ).trim();
79             }
80             if ( saw_first_table
81                     && ( ForesterUtil.isEmpty( line ) || ( tables_separated_by_single_string_line && ( line
82                             .indexOf( column_delimiter ) < 0 ) ) ) ) {
83                 if ( !table.isEmpty() ) {
84                     tables.add( table );
85                 }
86                 table = new BasicTable<String>();
87                 row = 0;
88             }
89             else if ( !ForesterUtil.isEmpty( line )
90                     && ( !use_start_of_comment_line || !line.startsWith( start_of_comment_line ) ) ) {
91                 saw_first_table = true;
92                 if ( use_last_separator_only ) {
93                     String e[] = line.split( column_delimiter );
94                     final StringBuffer rest = new StringBuffer();
95                     for( int i = 0; i < e.length - 1; ++i ) {
96                         rest.append( e[ i ].trim() );
97                     }
98                     table.setValue( 0, row, e[ e.length - 1 ] );
99                     table.setValue( 1, row, rest.toString() );
100                 }
101                 else {
102                     final StringTokenizer st = new StringTokenizer( line, column_delimiter );
103                     int col = 0;
104                     if ( st.hasMoreTokens() ) {
105                         table.setValue( col++, row, st.nextToken().trim() );
106                     }
107                     if ( use_first_separator_only ) {
108                         final StringBuffer rest = new StringBuffer();
109                         while ( st.hasMoreTokens() ) {
110                             rest.append( st.nextToken() );
111                         }
112                         table.setValue( col++, row, rest.toString() );
113                     }
114                     else {
115                         while ( st.hasMoreTokens() ) {
116                             table.setValue( col++, row, st.nextToken().trim() );
117                         }
118                     }
119                 }
120             }
121             ++row;
122         }
123         if ( !table.isEmpty() ) {
124             tables.add( table );
125         }
126         reader.close();
127         return tables;
128     }
129 }