tbrugz.sqldump.datadump.DataDump Maven / Gradle / Ivy

Show more of this group Show more artifacts with this name
Show all versions of sqldump Show documentation
Utility to dump schema and data from a RDBMS
There is a newer version: 0.9.17
package tbrugz.sqldump.datadump;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
import java.io.Writer;
import java.nio.charset.Charset;
import java.nio.charset.CharsetEncoder;
import java.nio.charset.CodingErrorAction;
import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.ResultSetMetaData;
import java.sql.SQLException;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Date;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;

import tbrugz.sqldump.dbmd.DBMSFeatures;
import tbrugz.sqldump.dbmodel.Constraint;
import tbrugz.sqldump.dbmodel.DBObject;
import tbrugz.sqldump.dbmodel.DBObjectType;
import tbrugz.sqldump.dbmodel.FK;
import tbrugz.sqldump.dbmodel.ModelUtils;
import tbrugz.sqldump.dbmodel.Table;
import tbrugz.sqldump.dbmodel.TableType;
import tbrugz.sqldump.def.AbstractSQLProc;
import tbrugz.sqldump.def.DBMSResources;
import tbrugz.sqldump.def.Defs;
import tbrugz.sqldump.def.ProcessingException;
import tbrugz.sqldump.resultset.ResultSetDecoratorFactory;
import tbrugz.sqldump.util.CategorizedOut;
import tbrugz.sqldump.util.SQLUtils;
import tbrugz.sqldump.util.StringDecorator;
import tbrugz.sqldump.util.Utils;
import tbrugz.util.LongFactory;
import tbrugz.util.NonNullGetMap;

/*
 * TODO: floatFormatter!
 * TODO: option to include, or not, partition columns in output
 * XXX: partition by schemaname?
 */
public class DataDump extends AbstractSQLProc {

	//prefix
	static final String DATADUMP_PROP_PREFIX = "sqldump.datadump.";
	
	//suffixes
	static final String SUFFIX_DATADUMP_WRITEBOM = "writebom";
	
	//generic props
	public static final String PROP_DATADUMP_OUTFILEPATTERN = "sqldump.datadump.outfilepattern";
	//static final String PROP_DATADUMP_INSERTINTO = "sqldump.datadump.useinsertintosyntax";
	static final String PROP_DATADUMP_SYNTAXES = "sqldump.datadump.dumpsyntaxes";
	static final String PROP_DATADUMP_CHARSET = "sqldump.datadump.charset";
	static final String PROP_DATADUMP_ROWLIMIT = "sqldump.datadump.rowlimit";
	static final String PROP_DATADUMP_TABLES = "sqldump.datadump.tables";
	static final String PROP_DATADUMP_IGNORETABLES = "sqldump.datadump.ignoretables";
	@Deprecated
	static final String PROP_DATADUMP_DATEFORMAT = "sqldump.datadump.dateformat";
	static final String PROP_DATADUMP_ORDERBYPK = "sqldump.datadump.orderbypk";
	static final String PROP_DATADUMP_TABLETYPES = "sqldump.datadump.tabletypes";
	static final String PROP_DATADUMP_LOG_EACH_X_ROWS = "sqldump.datadump.logeachxrows";
	static final String PROP_DATADUMP_LOG_1ST_ROW = "sqldump.datadump.log1strow";
	static final String PROP_DATADUMP_WRITEBOM = DATADUMP_PROP_PREFIX+SUFFIX_DATADUMP_WRITEBOM;
	static final String PROP_DATADUMP_WRITEAPPEND = "sqldump.datadump.writeappend";
	static final String PROP_DATADUMP_CREATEEMPTYFILES = "sqldump.datadump.createemptyfiles";
	static final String PROP_DATADUMP_PARTITIONBY_DATEFORMAT = "sqldump.datadump.partitionby.dateformat";
	static final String PROP_DATADUMP_FETCHSIZE = DATADUMP_PROP_PREFIX+"fetchsize";

	//defaults
	static final String CHARSET_DEFAULT = DataDumpUtils.CHARSET_UTF8;
	static final long LOG_EACH_X_ROWS_DEFAULT = 50000;
	
	static final String PATTERN_TABLE_QUERY_ID = "id";
	static final String PATTERN_PARTITIONBY = "partitionby";
	static final String PATTERN_SYNTAXFILEEXT = "syntaxfileext"; //syntaxdefaultfileext, defaultsyntaxfileext, defaultfileext, fileext
	
	static final String PATTERN_TABLE_QUERY_ID_FINAL = Pattern.quote(Defs.addSquareBraquets(PATTERN_TABLE_QUERY_ID));
	public static final String PATTERN_TABLENAME_FINAL = Pattern.quote(Defs.addSquareBraquets(Defs.PATTERN_TABLENAME));
	static final String PATTERN_PARTITIONBY_FINAL = Pattern.quote(Defs.addSquareBraquets(PATTERN_PARTITIONBY));
	static final String PATTERN_SYNTAXFILEEXT_FINAL = Pattern.quote(Defs.addSquareBraquets(PATTERN_SYNTAXFILEEXT));
	//XXX add [schema] pattern
	//XXX add [tabletype] pattern - TABLE, VIEW, QUERY ?
	//XXX add [syntaxid] pattern - may be different from [syntaxfileext]
		
	@Deprecated
	static final String FILENAME_PATTERN_TABLE_QUERY_ID = "\\$\\{id\\}";
	@Deprecated
	public static final String FILENAME_PATTERN_TABLENAME = "\\$\\{tablename\\}";
	@Deprecated
	static final String FILENAME_PATTERN_PARTITIONBY = "\\$\\{partitionby\\}";
	@Deprecated
	public static final String FILENAME_PATTERN_SYNTAXFILEEXT = "\\$\\{syntaxfileext\\}";
	
	private static final Log log = LogFactory.getLog(DataDump.class);
	private static final Log logDir = LogFactory.getLog(DataDump.class.getName()+".datadump-dir");
	private static final Log logNewFile = LogFactory.getLog(DataDump.class.getName()+".datadump-file");
	private static final Log log1stRow = LogFactory.getLog(DataDump.class.getName()+".datadump-1st");
	private static final Log logRow = LogFactory.getLog(DataDump.class.getName()+".datadump-row");
	
	static DateFormat partitionByDateFormatter = new SimpleDateFormat("yyyy-MM-dd");
	
	final Set bomWarned = new HashSet();
	
	/*
	 * charset: http://download.oracle.com/javase/6/docs/api/java/nio/charset/Charset.html
	 *
	 * US-ASCII 	Seven-bit ASCII, a.k.a. ISO646-US, a.k.a. the Basic Latin block of the Unicode character set
	 * ISO-8859-1   	ISO Latin Alphabet No. 1, a.k.a. ISO-LATIN-1
	 * UTF-8 	Eight-bit UCS Transformation Format
	 * UTF-16BE 	Sixteen-bit UCS Transformation Format, big-endian byte order
	 * UTF-16LE 	Sixteen-bit UCS Transformation Format, little-endian byte order
	 * UTF-16 	Sixteen-bit UCS Transformation Format, byte order identified by an optional byte-order mark
	 *
	 * XXX: use java.nio.charset.Charset.availableCharsets() ?
	 *  
	 */
	
	static class Outputter {
		final OutputStream os;
		final Writer w;
		
		private Outputter(OutputStream os) {
			this.os = os;
			this.w = null;
		}

		private Outputter(Writer w) {
			this.os = null;
			this.w = w;
		}
		
		/*Object getOutput(DumpSyntax ds) {
			if(ds.isWriterIndependent()) {
				return null;
			}
			if(ds.acceptsOutputStream()) {
				return os;
			}
			return w;
		}*/
		
		static Outputter getOutputter(OutputStream os) {
			if(os==null) { return null; }
			return new Outputter(os);
		}

		static Outputter getOutputter(Writer w) {
			if(w==null) { return null; }
			return new Outputter(w);
		}
	}
	
	@Override
	public void process() {
		try {
			dumpData(conn, model.getTables(), prop);
		} catch (SQLException e) {
			throw new ProcessingException(e);
		}
	}

	//TODOne: filter tables by table type (table, view, ...)
	void dumpData(Connection conn, Collection tablesForDataDump, Properties prop) throws SQLException {
		log.info("data dumping...");
		
		String charset = prop.getProperty(PROP_DATADUMP_CHARSET, CHARSET_DEFAULT);
		boolean orderByPK = Utils.getPropBool(prop, PROP_DATADUMP_ORDERBYPK, true);

		List tables4dump = getTables4dump(prop);
		
		DBMSFeatures feat = DBMSResources.instance().getSpecificFeatures(conn.getMetaData());
		String quote = feat.getIdentifierQuoteString();
		
		List syntaxList = getSyntaxList(prop, feat, PROP_DATADUMP_SYNTAXES);
		if(syntaxList==null) {
			log.error("no datadump syntax(es) defined [prop '"+PROP_DATADUMP_SYNTAXES+"']");
			if(failonerror) {
				throw new ProcessingException("DataDump: no datadump syntax(es) defined");
			}
		}
		
		List typesToDump = new ArrayList();
		List types = Utils.getStringListFromProp(prop, PROP_DATADUMP_TABLETYPES, ",");
		if(types!=null) {
			for(String type: types) {
				try {
					TableType ttype = TableType.valueOf(type.trim());
					typesToDump.add(ttype);
				}
				catch(IllegalArgumentException e) {
					log.warn("unknown table type: "+type.trim());
				}
			}
			log.info("table types for dumping: "+Utils.join(typesToDump, ", "));
		}
		else {
			typesToDump.addAll(Arrays.asList(TableType.values()));
			typesToDump.remove(TableType.VIEW);
			typesToDump.remove(TableType.MATERIALIZED_VIEW);
		}
		
		List ignoretablesregex = Utils.getStringListFromProp(prop, PROP_DATADUMP_IGNORETABLES, "\\|");
		if(ignoretablesregex!=null) {
			for(int i=0;i tablesForDataDumpLoop = null;
		if(tables4dump==null) {
			tablesForDataDumpLoop = tablesForDataDump;
		}
		else {
			//ordering tables for dump
			tablesForDataDumpLoop = new ArrayList();
			for(String tName: tables4dump) {
				Table t = DBObject.getDBIdentifiableByTypeAndName(tablesForDataDump, DBObjectType.TABLE, tName);
				if(t==null) {
					log.warn("table '"+tName+"' not found for dump");
					ignoredTables++;
				}
				else {
					tablesForDataDumpLoop.add(t);
				}
			}
			for(Table t: tablesForDataDump) {
				if(!tables4dump.contains(t.getName())) {
					log.debug("ignoring table: "+t.getName()+" [filtered]");
					ignoredTables++;
					continue;
				}
			}
		}
		
		LABEL_TABLE:
		for(Table table: tablesForDataDumpLoop) {
			String tableName = table.getName();
			String schemaName = table.getSchemaName();
			String tableFullName = table.getQualifiedName();
			if(tables4dump!=null) { tables4dump.remove(tableName); }
			if(typesToDump!=null) {
				if(!typesToDump.contains(table.getType())) {
					log.debug("ignoring table '"+tableFullName+"' by type [type="+table.getType()+"]");
					ignoredTables++;
					continue;
				}
			}
			if(ignoretablesregex!=null) {
				for(String tregex: ignoretablesregex) {
					if(tableName.matches(tregex)) {
						log.debug("ignoring table '"+tableFullName+"' by regex [regex="+tregex+"]");
						ignoredTables++;
						continue LABEL_TABLE;
					}
				}
			}
			List importedFKs = ModelUtils.getImportedKeys(table, model.getForeignKeys());
			List uniqueKeys = ModelUtils.getUKs(table);
			
			long rowlimit = getTableRowLimit(prop, tableName);

			String whereClause = prop.getProperty(DATADUMP_PROP_PREFIX+tableName+".where");
			String selectColumns = prop.getProperty(DATADUMP_PROP_PREFIX+tableName+".columns");
			if(selectColumns==null) { selectColumns = "*"; }
			String orderClause = prop.getProperty(DATADUMP_PROP_PREFIX+tableName+".order");

			List pkCols = null;  
			if(table.getPKConstraint()!=null) {
				pkCols = table.getPKConstraint().getUniqueColumns();
			} 
			
			String sql = getQuery(table, selectColumns, whereClause, orderClause, orderByPK, quote);
			
			try {
				//XXX: table dump with partitionBy?
				runQuery(conn, sql, null, prop, schemaName, tableName, tableName, charset, 
						rowlimit,
						syntaxList,
						null, //partitionby
						pkCols,
						importedFKs,
						uniqueKeys,
						null //decoratorFactory
						);
				queriesRunned++;
			}
			catch(Exception e) {
				log.warn("error dumping data from table: "+tableFullName+"\n\tsql: "+sql+"\n\texception: "+e);
				log.info("exception:", e);
				if(failonerror) {
					throw new ProcessingException(e);
				}
			}
		}
		
		if(tablesForDataDump.size()==0) {
			log.warn("no tables found in model for data dumping...");
		}
		else {
			if(tables4dump!=null && tables4dump.size()>0) {
				log.warn("tables selected for dump but not found: "+Utils.join(tables4dump, ", "));
			}
			log.info("..."+queriesRunned+" queries dumped"
					+(ignoredTables>0?" ["+ignoredTables+" tables ignored]":"") );
		}
	}
	
	/*@Deprecated
	public static String getQuery(Table table, String selectColumns, String whereClause, String orderClause, boolean orderByPK) {
		return getQuery(table, selectColumns, whereClause, orderClause, orderByPK, "\"");
	}*/
	
	//XXX: move to DataDumpUtils?
	public static String getQuery(Table table, String selectColumns, String whereClause, String orderClause, boolean orderByPK, String quote) {
		String tableName = table.getName();
		
		//String quote = DBMSResources.instance().getIdentifierQuoteString();
		StringDecorator quoteAllDecorator = new StringDecorator.StringQuoterDecorator(quote);
		
		if(orderClause==null && orderByPK) { 
			Constraint ctt = table.getPKConstraint();
			if(ctt!=null) {
				orderClause = Utils.join(ctt.getUniqueColumns(), ", ", quoteAllDecorator);
			}
			else {
				log.warn("table '"+tableName+"' has no PK for datadump ordering");
			}
		}

		log.debug("dumping data/inserts from table: "+tableName);
		//String sql = "select "+selectColumns+" from \""+table.schemaName+"."+tableName+"\""
		
		String sql = "select "+selectColumns
				+" from "+DBObject.getFinalName(table, quoteAllDecorator, true)
				+ (whereClause!=null?" where "+whereClause:"")
				+ (orderClause!=null?" order by "+orderClause:"");
		log.debug("sql: "+sql);

		return sql;
	} 
	
	public void runQuery(Connection conn, String sql, List