All Downloads are FREE. Search and download functionalities are using the official Maven repository.

cn.hutool.core.util.ReUtil Maven / Gradle / Ivy

There is a newer version: 5.8.33
Show newest version
package cn.hutool.core.util;

import cn.hutool.core.collection.CollUtil;
import cn.hutool.core.comparator.LengthComparator;
import cn.hutool.core.convert.Convert;
import cn.hutool.core.exceptions.UtilException;
import cn.hutool.core.lang.Assert;
import cn.hutool.core.lang.PatternPool;
import cn.hutool.core.lang.RegexPool;
import cn.hutool.core.lang.Validator;
import cn.hutool.core.lang.func.Func1;
import cn.hutool.core.lang.mutable.Mutable;
import cn.hutool.core.lang.mutable.MutableObj;
import cn.hutool.core.map.MapUtil;

import java.util.ArrayList;
import java.util.Collection;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.TreeSet;
import java.util.function.Consumer;
import java.util.regex.MatchResult;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则相关工具类
* 常用正则请见 {@link Validator} * * @author xiaoleilu */ public class ReUtil { /** * 正则表达式匹配中文汉字 */ public final static String RE_CHINESE = RegexPool.CHINESE; /** * 正则表达式匹配中文字符串 */ public final static String RE_CHINESES = RegexPool.CHINESES; /** * 正则中需要被转义的关键字 */ public final static Set RE_KEYS = CollUtil.newHashSet('$', '(', ')', '*', '+', '.', '[', ']', '?', '\\', '^', '{', '}', '|'); /** * 获得匹配的字符串,获得正则中分组0的内容 * * @param regex 匹配的正则 * @param content 被匹配的内容 * @return 匹配后得到的字符串,未匹配返回null * @since 3.1.2 */ public static String getGroup0(String regex, CharSequence content) { return get(regex, content, 0); } /** * 获得匹配的字符串,获得正则中分组1的内容 * * @param regex 匹配的正则 * @param content 被匹配的内容 * @return 匹配后得到的字符串,未匹配返回null * @since 3.1.2 */ public static String getGroup1(String regex, CharSequence content) { return get(regex, content, 1); } /** * 获得匹配的字符串 * * @param regex 匹配的正则 * @param content 被匹配的内容 * @param groupIndex 匹配正则的分组序号 * @return 匹配后得到的字符串,未匹配返回null */ public static String get(String regex, CharSequence content, int groupIndex) { if (null == content || null == regex) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return get(pattern, content, groupIndex); } /** * 获得匹配的字符串 * * @param regex 匹配的正则 * @param content 被匹配的内容 * @param groupName 匹配正则的分组名称 * @return 匹配后得到的字符串,未匹配返回null */ public static String get(String regex, CharSequence content, String groupName) { if (null == content || null == regex) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return get(pattern, content, groupName); } /** * 获得匹配的字符串,获得正则中分组0的内容 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @return 匹配后得到的字符串,未匹配返回null * @since 3.1.2 */ public static String getGroup0(Pattern pattern, CharSequence content) { return get(pattern, content, 0); } /** * 获得匹配的字符串,获得正则中分组1的内容 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @return 匹配后得到的字符串,未匹配返回null * @since 3.1.2 */ public static String getGroup1(Pattern pattern, CharSequence content) { return get(pattern, content, 1); } /** * 获得匹配的字符串,对应分组0表示整个匹配内容,1表示第一个括号分组内容,依次类推 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @param groupIndex 匹配正则的分组序号,0表示整个匹配内容,1表示第一个括号分组内容,依次类推 * @return 匹配后得到的字符串,未匹配返回null */ public static String get(Pattern pattern, CharSequence content, int groupIndex) { if (null == content || null == pattern) { return null; } final MutableObj result = new MutableObj<>(); get(pattern, content, matcher -> result.set(matcher.group(groupIndex))); return result.get(); } /** * 获得匹配的字符串 * * @param pattern 匹配的正则 * @param content 被匹配的内容 * @param groupName 匹配正则的分组名称 * @return 匹配后得到的字符串,未匹配返回null * @since 5.7.15 */ public static String get(Pattern pattern, CharSequence content, String groupName) { if (null == content || null == pattern || null == groupName) { return null; } final MutableObj result = new MutableObj<>(); get(pattern, content, matcher -> result.set(matcher.group(groupName))); return result.get(); } /** * 在给定字符串中查找给定规则的字符,如果找到则使用{@link Consumer}处理之
* 如果内容中有多个匹配项,则只处理找到的第一个结果。 * * @param pattern 匹配的正则 * @param content 被匹配的内容 * @param consumer 匹配到的内容处理器 * @since 5.7.15 */ public static void get(Pattern pattern, CharSequence content, Consumer consumer) { if (null == content || null == pattern || null == consumer) { return; } final Matcher m = pattern.matcher(content); if (m.find()) { consumer.accept(m); } } /** * 获得匹配的字符串匹配到的所有分组 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @return 匹配后得到的字符串数组,按照分组顺序依次列出,未匹配到返回空列表,任何一个参数为null返回null * @since 3.1.0 */ public static List getAllGroups(Pattern pattern, CharSequence content) { return getAllGroups(pattern, content, true); } /** * 获得匹配的字符串匹配到的所有分组 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @param withGroup0 是否包括分组0,此分组表示全匹配的信息 * @return 匹配后得到的字符串数组,按照分组顺序依次列出,未匹配到返回空列表,任何一个参数为null返回null * @since 4.0.13 */ public static List getAllGroups(Pattern pattern, CharSequence content, boolean withGroup0) { return getAllGroups(pattern, content, withGroup0, false); } /** * 获得匹配的字符串匹配到的所有分组 * * @param pattern 编译后的正则模式 * @param content 被匹配的内容 * @param withGroup0 是否包括分组0,此分组表示全匹配的信息 * @param findAll 是否查找所有匹配到的内容,{@code false}表示只读取第一个匹配到的内容 * @return 匹配后得到的字符串数组,按照分组顺序依次列出,未匹配到返回空列表,任何一个参数为null返回null * @since 4.0.13 */ public static List getAllGroups(Pattern pattern, CharSequence content, boolean withGroup0, boolean findAll) { if (null == content || null == pattern) { return null; } ArrayList result = new ArrayList<>(); final Matcher matcher = pattern.matcher(content); while (matcher.find()) { final int startGroup = withGroup0 ? 0 : 1; final int groupCount = matcher.groupCount(); for (int i = startGroup; i <= groupCount; i++) { result.add(matcher.group(i)); } if(false == findAll){ break; } } return result; } /** * 根据给定正则查找字符串中的匹配项,返回所有匹配的分组名对应分组值
*
	 * pattern: (?<year>\\d+)-(?<month>\\d+)-(?<day>\\d+)
	 * content: 2021-10-11
	 * result : year: 2021, month: 10, day: 11
	 * 
* * @param pattern 匹配的正则 * @param content 被匹配的内容 * @return 命名捕获组,key为分组名,value为对应值 * @since 5.7.15 */ public static Map getAllGroupNames(Pattern pattern, CharSequence content) { if (null == content || null == pattern) { return null; } final Matcher m = pattern.matcher(content); final Map result = MapUtil.newHashMap(m.groupCount()); if (m.find()) { // 通过反射获取 namedGroups 方法 final Map map = ReflectUtil.invoke(pattern, "namedGroups"); map.forEach((key, value) -> result.put(key, m.group(value))); } return result; } /** * 从content中匹配出多个值并根据template生成新的字符串
* 例如:
* content 2013年5月 pattern (.*?)年(.*?)月 template: $1-$2 return 2013-5 * * @param pattern 匹配正则 * @param content 被匹配的内容 * @param template 生成内容模板,变量 $1 表示group1的内容,以此类推 * @return 新字符串 */ public static String extractMulti(Pattern pattern, CharSequence content, String template) { if (null == content || null == pattern || null == template) { return null; } //提取模板中的编号 final TreeSet varNums = new TreeSet<>((o1, o2) -> ObjectUtil.compare(o2, o1)); final Matcher matcherForTemplate = PatternPool.GROUP_VAR.matcher(template); while (matcherForTemplate.find()) { varNums.add(Integer.parseInt(matcherForTemplate.group(1))); } final Matcher matcher = pattern.matcher(content); if (matcher.find()) { for (Integer group : varNums) { template = template.replace("$" + group, matcher.group(group)); } return template; } return null; } /** * 从content中匹配出多个值并根据template生成新的字符串
* 匹配结束后会删除匹配内容之前的内容(包括匹配内容)
* 例如:
* content 2013年5月 pattern (.*?)年(.*?)月 template: $1-$2 return 2013-5 * * @param regex 匹配正则字符串 * @param content 被匹配的内容 * @param template 生成内容模板,变量 $1 表示group1的内容,以此类推 * @return 按照template拼接后的字符串 */ public static String extractMulti(String regex, CharSequence content, String template) { if (null == content || null == regex || null == template) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return extractMulti(pattern, content, template); } /** * 从content中匹配出多个值并根据template生成新的字符串
* 匹配结束后会删除匹配内容之前的内容(包括匹配内容)
* 例如:
* content 2013年5月 pattern (.*?)年(.*?)月 template: $1-$2 return 2013-5 * * @param pattern 匹配正则 * @param contentHolder 被匹配的内容的Holder,value为内容正文,经过这个方法的原文将被去掉匹配之前的内容 * @param template 生成内容模板,变量 $1 表示group1的内容,以此类推 * @return 新字符串 * @since 5.8.0 */ public static String extractMultiAndDelPre(Pattern pattern, Mutable contentHolder, String template) { if (null == contentHolder || null == pattern || null == template) { return null; } HashSet varNums = findAll(PatternPool.GROUP_VAR, template, 1, new HashSet<>()); final CharSequence content = contentHolder.get(); Matcher matcher = pattern.matcher(content); if (matcher.find()) { for (String var : varNums) { int group = Integer.parseInt(var); template = template.replace("$" + var, matcher.group(group)); } contentHolder.set(StrUtil.sub(content, matcher.end(), content.length())); return template; } return null; } /** * 从content中匹配出多个值并根据template生成新的字符串
* 例如:
* content 2013年5月 pattern (.*?)年(.*?)月 template: $1-$2 return 2013-5 * * @param regex 匹配正则字符串 * @param contentHolder 被匹配的内容的Holder,value为内容正文,经过这个方法的原文将被去掉匹配之前的内容 * @param template 生成内容模板,变量 $1 表示group1的内容,以此类推 * @return 按照template拼接后的字符串 */ public static String extractMultiAndDelPre(String regex, Mutable contentHolder, String template) { if (null == contentHolder || null == regex || null == template) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return extractMultiAndDelPre(pattern, contentHolder, template); } /** * 删除匹配的第一个内容 * * @param regex 正则 * @param content 被匹配的内容 * @return 删除后剩余的内容 */ public static String delFirst(String regex, CharSequence content) { if (StrUtil.hasBlank(regex, content)) { return StrUtil.str(content); } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return delFirst(pattern, content); } /** * 删除匹配的第一个内容 * * @param pattern 正则 * @param content 被匹配的内容 * @return 删除后剩余的内容 */ public static String delFirst(Pattern pattern, CharSequence content) { return replaceFirst(pattern, content, StrUtil.EMPTY); } /** * 替换匹配的第一个内容 * * @param pattern 正则 * @param content 被匹配的内容 * @param replacement 替换的内容 * @return 替换后剩余的内容 * @since 5.6.5 */ public static String replaceFirst(Pattern pattern, CharSequence content, String replacement) { if (null == pattern || StrUtil.isEmpty(content)) { return StrUtil.str(content); } return pattern.matcher(content).replaceFirst(replacement); } /** * 删除匹配的最后一个内容 * * @param regex 正则 * @param str 被匹配的内容 * @return 删除后剩余的内容 * @since 5.6.5 */ public static String delLast(String regex, CharSequence str) { if (StrUtil.hasBlank(regex, str)) { return StrUtil.str(str); } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return delLast(pattern, str); } /** * 删除匹配的最后一个内容 * * @param pattern 正则 * @param str 被匹配的内容 * @return 删除后剩余的内容 * @since 5.6.5 */ public static String delLast(Pattern pattern, CharSequence str) { if (null != pattern && StrUtil.isNotEmpty(str)) { final MatchResult matchResult = lastIndexOf(pattern, str); if (null != matchResult) { return StrUtil.subPre(str, matchResult.start()) + StrUtil.subSuf(str, matchResult.end()); } } return StrUtil.str(str); } /** * 删除匹配的全部内容 * * @param regex 正则 * @param content 被匹配的内容 * @return 删除后剩余的内容 */ public static String delAll(String regex, CharSequence content) { if (StrUtil.hasBlank(regex, content)) { return StrUtil.str(content); } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return delAll(pattern, content); } /** * 删除匹配的全部内容 * * @param pattern 正则 * @param content 被匹配的内容 * @return 删除后剩余的内容 */ public static String delAll(Pattern pattern, CharSequence content) { if (null == pattern || StrUtil.isBlank(content)) { return StrUtil.str(content); } return pattern.matcher(content).replaceAll(StrUtil.EMPTY); } /** * 删除正则匹配到的内容之前的字符 如果没有找到,则返回原文 * * @param regex 定位正则 * @param content 被查找的内容 * @return 删除前缀后的新内容 */ public static String delPre(String regex, CharSequence content) { if (null == content || null == regex) { return StrUtil.str(content); } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return delPre(pattern, content); } /** * 删除正则匹配到的内容之前的字符 如果没有找到,则返回原文 * * @param pattern 定位正则模式 * @param content 被查找的内容 * @return 删除前缀后的新内容 */ public static String delPre(Pattern pattern, CharSequence content) { if (null == content || null == pattern) { return StrUtil.str(content); } final Matcher matcher = pattern.matcher(content); if (matcher.find()) { return StrUtil.sub(content, matcher.end(), content.length()); } return StrUtil.str(content); } /** * 取得内容中匹配的所有结果,获得匹配的所有结果中正则对应分组0的内容 * * @param regex 正则 * @param content 被查找的内容 * @return 结果列表 * @since 3.1.2 */ public static List findAllGroup0(String regex, CharSequence content) { return findAll(regex, content, 0); } /** * 取得内容中匹配的所有结果,获得匹配的所有结果中正则对应分组1的内容 * * @param regex 正则 * @param content 被查找的内容 * @return 结果列表 * @since 3.1.2 */ public static List findAllGroup1(String regex, CharSequence content) { return findAll(regex, content, 1); } /** * 取得内容中匹配的所有结果 * * @param regex 正则 * @param content 被查找的内容 * @param group 正则的分组 * @return 结果列表 * @since 3.0.6 */ public static List findAll(String regex, CharSequence content, int group) { return findAll(regex, content, group, new ArrayList<>()); } /** * 取得内容中匹配的所有结果 * * @param 集合类型 * @param regex 正则 * @param content 被查找的内容 * @param group 正则的分组 * @param collection 返回的集合类型 * @return 结果集 */ public static > T findAll(String regex, CharSequence content, int group, T collection) { if (null == regex) { return collection; } return findAll(PatternPool.get(regex, Pattern.DOTALL), content, group, collection); } /** * 取得内容中匹配的所有结果,获得匹配的所有结果中正则对应分组0的内容 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @return 结果列表 * @since 3.1.2 */ public static List findAllGroup0(Pattern pattern, CharSequence content) { return findAll(pattern, content, 0); } /** * 取得内容中匹配的所有结果,获得匹配的所有结果中正则对应分组1的内容 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @return 结果列表 * @since 3.1.2 */ public static List findAllGroup1(Pattern pattern, CharSequence content) { return findAll(pattern, content, 1); } /** * 取得内容中匹配的所有结果 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @param group 正则的分组 * @return 结果列表 * @since 3.0.6 */ public static List findAll(Pattern pattern, CharSequence content, int group) { return findAll(pattern, content, group, new ArrayList<>()); } /** * 取得内容中匹配的所有结果 * * @param 集合类型 * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @param group 正则的分组 * @param collection 返回的集合类型 * @return 结果集 */ public static > T findAll(Pattern pattern, CharSequence content, int group, T collection) { if (null == pattern || null == content) { return null; } Assert.notNull(collection, "Collection must be not null !"); findAll(pattern, content, (matcher) -> collection.add(matcher.group(group))); return collection; } /** * 取得内容中匹配的所有结果,使用{@link Consumer}完成匹配结果处理 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @param consumer 匹配结果处理函数 * @since 5.7.15 */ public static void findAll(Pattern pattern, CharSequence content, Consumer consumer) { if (null == pattern || null == content) { return; } final Matcher matcher = pattern.matcher(content); while (matcher.find()) { consumer.accept(matcher); } } /** * 计算指定字符串中,匹配pattern的个数 * * @param regex 正则表达式 * @param content 被查找的内容 * @return 匹配个数 */ public static int count(String regex, CharSequence content) { if (null == regex || null == content) { return 0; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return count(pattern, content); } /** * 计算指定字符串中,匹配pattern的个数 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @return 匹配个数 */ public static int count(Pattern pattern, CharSequence content) { if (null == pattern || null == content) { return 0; } int count = 0; final Matcher matcher = pattern.matcher(content); while (matcher.find()) { count++; } return count; } /** * 指定内容中是否有表达式匹配的内容 * * @param regex 正则表达式 * @param content 被查找的内容 * @return 指定内容中是否有表达式匹配的内容 * @since 3.3.1 */ public static boolean contains(String regex, CharSequence content) { if (null == regex || null == content) { return false; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return contains(pattern, content); } /** * 指定内容中是否有表达式匹配的内容 * * @param pattern 编译后的正则模式 * @param content 被查找的内容 * @return 指定内容中是否有表达式匹配的内容 * @since 3.3.1 */ public static boolean contains(Pattern pattern, CharSequence content) { if (null == pattern || null == content) { return false; } return pattern.matcher(content).find(); } /** * 找到指定正则匹配到字符串的开始位置 * * @param regex 正则 * @param content 字符串 * @return 位置,{@code null}表示未找到 * @since 5.6.5 */ public static MatchResult indexOf(String regex, CharSequence content) { if (null == regex || null == content) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return indexOf(pattern, content); } /** * 找到指定模式匹配到字符串的开始位置 * * @param pattern 模式 * @param content 字符串 * @return 位置,{@code null}表示未找到 * @since 5.6.5 */ public static MatchResult indexOf(Pattern pattern, CharSequence content) { if (null != pattern && null != content) { final Matcher matcher = pattern.matcher(content); if (matcher.find()) { return matcher.toMatchResult(); } } return null; } /** * 找到指定正则匹配到第一个字符串的位置 * * @param regex 正则 * @param content 字符串 * @return 位置,{@code null}表示未找到 * @since 5.6.5 */ public static MatchResult lastIndexOf(String regex, CharSequence content) { if (null == regex || null == content) { return null; } final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return lastIndexOf(pattern, content); } /** * 找到指定模式匹配到最后一个字符串的位置 * * @param pattern 模式 * @param content 字符串 * @return 位置,{@code null}表示未找到 * @since 5.6.5 */ public static MatchResult lastIndexOf(Pattern pattern, CharSequence content) { MatchResult result = null; if (null != pattern && null != content) { final Matcher matcher = pattern.matcher(content); while (matcher.find()) { result = matcher.toMatchResult(); } } return result; } /** * 从字符串中获得第一个整数 * * @param StringWithNumber 带数字的字符串 * @return 整数 */ public static Integer getFirstNumber(CharSequence StringWithNumber) { return Convert.toInt(get(PatternPool.NUMBERS, StringWithNumber, 0), null); } /** * 给定内容是否匹配正则 * * @param regex 正则 * @param content 内容 * @return 正则为null或者""则不检查,返回true,内容为null返回false */ public static boolean isMatch(String regex, CharSequence content) { if (content == null) { // 提供null的字符串为不匹配 return false; } if (StrUtil.isEmpty(regex)) { // 正则不存在则为全匹配 return true; } // Pattern pattern = Pattern.compile(regex, Pattern.DOTALL); final Pattern pattern = PatternPool.get(regex, Pattern.DOTALL); return isMatch(pattern, content); } /** * 给定内容是否匹配正则 * * @param pattern 模式 * @param content 内容 * @return 正则为null或者""则不检查,返回true,内容为null返回false */ public static boolean isMatch(Pattern pattern, CharSequence content) { if (content == null || pattern == null) { // 提供null的字符串为不匹配 return false; } return pattern.matcher(content).matches(); } /** * 正则替换指定值
* 通过正则查找到字符串,然后把匹配到的字符串加入到replacementTemplate中,$1表示分组1的字符串 * *

* 例如:原字符串是:中文1234,我想把1234换成(1234),则可以: * *

	 * ReUtil.replaceAll("中文1234", "(\\d+)", "($1)"))
	 *
	 * 结果:中文(1234)
	 * 
* * @param content 文本 * @param regex 正则 * @param replacementTemplate 替换的文本模板,可以使用$1类似的变量提取正则匹配出的内容 * @return 处理后的文本 */ public static String replaceAll(CharSequence content, String regex, String replacementTemplate) { final Pattern pattern = Pattern.compile(regex, Pattern.DOTALL); return replaceAll(content, pattern, replacementTemplate); } /** * 正则替换指定值
* 通过正则查找到字符串,然后把匹配到的字符串加入到replacementTemplate中,$1表示分组1的字符串 * * @param content 文本 * @param pattern {@link Pattern} * @param replacementTemplate 替换的文本模板,可以使用$1类似的变量提取正则匹配出的内容 * @return 处理后的文本 * @since 3.0.4 */ public static String replaceAll(CharSequence content, Pattern pattern, String replacementTemplate) { if (StrUtil.isEmpty(content)) { return StrUtil.str(content); } final Matcher matcher = pattern.matcher(content); boolean result = matcher.find(); if (result) { final Set varNums = findAll(PatternPool.GROUP_VAR, replacementTemplate, 1, new TreeSet<>(LengthComparator.INSTANCE.reversed())); final StringBuffer sb = new StringBuffer(); do { String replacement = replacementTemplate; for (final String var : varNums) { final int group = Integer.parseInt(var); replacement = replacement.replace("$" + var, matcher.group(group)); } matcher.appendReplacement(sb, escape(replacement)); result = matcher.find(); } while (result); matcher.appendTail(sb); return sb.toString(); } return StrUtil.str(content); } /** * 替换所有正则匹配的文本,并使用自定义函数决定如何替换
* replaceFun可以通过{@link Matcher}提取出匹配到的内容的不同部分,然后经过重新处理、组装变成新的内容放回原位。 * *
	 *     replaceAll(this.content, "(\\d+)", parameters -> "-" + parameters.group(1) + "-")
	 *     // 结果为:"ZZZaaabbbccc中文-1234-"
	 * 
* * @param str 要替换的字符串 * @param regex 用于匹配的正则式 * @param replaceFun 决定如何替换的函数 * @return 替换后的文本 * @since 4.2.2 */ public static String replaceAll(CharSequence str, String regex, Func1 replaceFun) { return replaceAll(str, Pattern.compile(regex), replaceFun); } /** * 替换所有正则匹配的文本,并使用自定义函数决定如何替换
* replaceFun可以通过{@link Matcher}提取出匹配到的内容的不同部分,然后经过重新处理、组装变成新的内容放回原位。 * *
	 *     replaceAll(this.content, "(\\d+)", parameters -> "-" + parameters.group(1) + "-")
	 *     // 结果为:"ZZZaaabbbccc中文-1234-"
	 * 
* * @param str 要替换的字符串 * @param pattern 用于匹配的正则式 * @param replaceFun 决定如何替换的函数,可能被多次调用(当有多个匹配时) * @return 替换后的字符串 * @since 4.2.2 */ public static String replaceAll(CharSequence str, Pattern pattern, Func1 replaceFun) { if (StrUtil.isEmpty(str)) { return StrUtil.str(str); } final Matcher matcher = pattern.matcher(str); final StringBuffer buffer = new StringBuffer(); while (matcher.find()) { try { matcher.appendReplacement(buffer, replaceFun.call(matcher)); } catch (Exception e) { throw new UtilException(e); } } matcher.appendTail(buffer); return buffer.toString(); } /** * 转义字符,将正则的关键字转义 * * @param c 字符 * @return 转义后的文本 */ public static String escape(char c) { final StringBuilder builder = new StringBuilder(); if (RE_KEYS.contains(c)) { builder.append('\\'); } builder.append(c); return builder.toString(); } /** * 转义字符串,将正则的关键字转义 * * @param content 文本 * @return 转义后的文本 */ public static String escape(CharSequence content) { if (StrUtil.isBlank(content)) { return StrUtil.str(content); } final StringBuilder builder = new StringBuilder(); int len = content.length(); char current; for (int i = 0; i < len; i++) { current = content.charAt(i); if (RE_KEYS.contains(current)) { builder.append('\\'); } builder.append(current); } return builder.toString(); } }




© 2015 - 2024 Weber Informatics LLC | Privacy Policy