All Downloads are FREE. Search and download functionalities are using the official Maven repository.

cn.hutool.core.text.csv.CsvBaseReader Maven / Gradle / Ivy

Go to download

Hutool是一个小而全的Java工具类库,通过静态方法封装,降低相关API的学习成本,提高工作效率,使Java拥有函数式语言般的优雅,让Java语言也可以“甜甜的”。

There is a newer version: 5.8.34
Show newest version
package cn.hutool.core.text.csv;

import cn.hutool.core.io.FileUtil;
import cn.hutool.core.io.IORuntimeException;
import cn.hutool.core.io.IoUtil;
import cn.hutool.core.lang.Assert;
import cn.hutool.core.util.CharsetUtil;
import cn.hutool.core.util.ObjectUtil;

import java.io.File;
import java.io.Reader;
import java.io.Serializable;
import java.io.StringReader;
import java.nio.charset.Charset;
import java.nio.file.Path;
import java.util.ArrayList;
import java.util.List;
import java.util.Map;
import java.util.Objects;

/**
 * CSV文件读取器基础类,提供灵活的文件、路径中的CSV读取,一次构造可多次调用读取不同数据,参考:FastCSV
 *
 * @author Looly
 * @since 5.0.4
 */
public class CsvBaseReader implements Serializable {
	private static final long serialVersionUID = 1L;

	/**
	 * 默认编码
	 */
	protected static final Charset DEFAULT_CHARSET = CharsetUtil.CHARSET_UTF_8;

	private final CsvReadConfig config;

	//--------------------------------------------------------------------------------------------- Constructor start

	/**
	 * 构造,使用默认配置项
	 */
	public CsvBaseReader() {
		this(null);
	}

	/**
	 * 构造
	 *
	 * @param config 配置项
	 */
	public CsvBaseReader(CsvReadConfig config) {
		this.config = ObjectUtil.defaultIfNull(config, CsvReadConfig::defaultConfig);
	}
	//--------------------------------------------------------------------------------------------- Constructor end

	/**
	 * 设置字段分隔符,默认逗号','
	 *
	 * @param fieldSeparator 字段分隔符,默认逗号','
	 */
	public void setFieldSeparator(char fieldSeparator) {
		this.config.setFieldSeparator(fieldSeparator);
	}

	/**
	 * 设置 文本分隔符,文本包装符,默认双引号'"'
	 *
	 * @param textDelimiter 文本分隔符,文本包装符,默认双引号'"'
	 */
	public void setTextDelimiter(char textDelimiter) {
		this.config.setTextDelimiter(textDelimiter);
	}

	/**
	 * 设置是否首行做为标题行,默认false
	 *
	 * @param containsHeader 是否首行做为标题行,默认false
	 */
	public void setContainsHeader(boolean containsHeader) {
		this.config.setContainsHeader(containsHeader);
	}

	/**
	 * 设置是否跳过空白行,默认true
	 *
	 * @param skipEmptyRows 是否跳过空白行,默认true
	 */
	public void setSkipEmptyRows(boolean skipEmptyRows) {
		this.config.setSkipEmptyRows(skipEmptyRows);
	}

	/**
	 * 设置每行字段个数不同时是否抛出异常,默认false
	 *
	 * @param errorOnDifferentFieldCount 每行字段个数不同时是否抛出异常,默认false
	 */
	public void setErrorOnDifferentFieldCount(boolean errorOnDifferentFieldCount) {
		this.config.setErrorOnDifferentFieldCount(errorOnDifferentFieldCount);
	}

	/**
	 * 读取CSV文件,默认UTF-8编码
	 *
	 * @param file CSV文件
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(File file) throws IORuntimeException {
		return read(file, DEFAULT_CHARSET);
	}

	/**
	 * 从字符串中读取CSV数据
	 *
	 * @param csvStr CSV字符串
	 * @return {@link CsvData},包含数据列表和行信息
	 */
	public CsvData readFromStr(String csvStr) {
		return read(new StringReader(csvStr));
	}

	/**
	 * 从字符串中读取CSV数据
	 *
	 * @param csvStr     CSV字符串
	 * @param rowHandler 行处理器,用于一行一行的处理数据
	 */
	public void readFromStr(String csvStr, CsvRowHandler rowHandler) {
		read(parse(new StringReader(csvStr)), true, rowHandler);
	}


	/**
	 * 读取CSV文件
	 *
	 * @param file    CSV文件
	 * @param charset 文件编码,默认系统编码
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(File file, Charset charset) throws IORuntimeException {
		return read(Objects.requireNonNull(file.toPath(), "file must not be null"), charset);
	}

	/**
	 * 读取CSV文件,默认UTF-8编码
	 *
	 * @param path CSV文件
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(Path path) throws IORuntimeException {
		return read(path, DEFAULT_CHARSET);
	}

	/**
	 * 读取CSV文件
	 *
	 * @param path    CSV文件
	 * @param charset 文件编码,默认系统编码
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(Path path, Charset charset) throws IORuntimeException {
		Assert.notNull(path, "path must not be null");
		return read(FileUtil.getReader(path, charset));
	}

	/**
	 * 从Reader中读取CSV数据,读取后关闭Reader
	 *
	 * @param reader Reader
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(Reader reader) throws IORuntimeException {
		return read(reader, true);
	}

	/**
	 * 从Reader中读取CSV数据
	 *
	 * @param reader Reader
	 * @param close 读取结束是否关闭Reader
	 * @return {@link CsvData},包含数据列表和行信息
	 * @throws IORuntimeException IO异常
	 */
	public CsvData read(Reader reader, boolean close) throws IORuntimeException {
		final CsvParser csvParser = parse(reader);
		final List rows = new ArrayList<>();
		read(csvParser, close, rows::add);
		final List header = config.headerLineNo > -1 ? csvParser.getHeader() : null;

		return new CsvData(header, rows);
	}

	/**
	 * 从Reader中读取CSV数据,结果为Map,读取后关闭Reader。
* 此方法默认识别首行为标题行。 * * @param reader Reader * @return {@link CsvData},包含数据列表和行信息 * @throws IORuntimeException IO异常 */ public List> readMapList(Reader reader) throws IORuntimeException { // 此方法必须包含标题 this.config.setContainsHeader(true); final List> result = new ArrayList<>(); read(reader, (row) -> result.add(row.getFieldMap())); return result; } /** * 从Reader中读取CSV数据并转换为Bean列表,读取后关闭Reader。
* 此方法默认识别首行为标题行。 * * @param Bean类型 * @param reader Reader * @param clazz Bean类型 * @return Bean列表 */ public List read(Reader reader, Class clazz) { // 此方法必须包含标题 this.config.setContainsHeader(true); final List result = new ArrayList<>(); read(reader, (row) -> result.add(row.toBean(clazz))); return result; } /** * 从字符串中读取CSV数据并转换为Bean列表,读取后关闭Reader。
* 此方法默认识别首行为标题行。 * * @param Bean类型 * @param csvStr csv字符串 * @param clazz Bean类型 * @return Bean列表 */ public List read(String csvStr, Class clazz) { // 此方法必须包含标题 this.config.setContainsHeader(true); final List result = new ArrayList<>(); read(new StringReader(csvStr), (row) -> result.add(row.toBean(clazz))); return result; } /** * 从Reader中读取CSV数据,读取后关闭Reader * * @param reader Reader * @param rowHandler 行处理器,用于一行一行的处理数据 * @throws IORuntimeException IO异常 */ public void read(Reader reader, CsvRowHandler rowHandler) throws IORuntimeException { read(reader, true, rowHandler); } /** * 从Reader中读取CSV数据,读取后关闭Reader * * @param reader Reader * @param close 读取结束是否关闭Reader * @param rowHandler 行处理器,用于一行一行的处理数据 * @throws IORuntimeException IO异常 */ public void read(Reader reader, boolean close, CsvRowHandler rowHandler) throws IORuntimeException { read(parse(reader), close, rowHandler); } //--------------------------------------------------------------------------------------------- Private method start /** * 读取CSV数据,读取后关闭Parser * * @param csvParser CSV解析器 * @param close 读取结束是否关闭{@link CsvParser} * @param rowHandler 行处理器,用于一行一行的处理数据 * @throws IORuntimeException IO异常 * @since 5.0.4 */ private void read(CsvParser csvParser, boolean close, CsvRowHandler rowHandler) throws IORuntimeException { try { while (csvParser.hasNext()) { rowHandler.handle(csvParser.next()); } } finally { if(close){ IoUtil.close(csvParser); } } } /** * 构建 {@link CsvParser} * * @param reader Reader * @return CsvParser * @throws IORuntimeException IO异常 */ protected CsvParser parse(Reader reader) throws IORuntimeException { return new CsvParser(reader, this.config); } //--------------------------------------------------------------------------------------------- Private method start }




© 2015 - 2024 Weber Informatics LLC | Privacy Policy