org.ladsn.tool.dfa.SensitiveUtil Maven / Gradle / Ivy
The newest version!
package org.ladsn.tool.dfa;
import java.util.Collection;
import java.util.List;
import java.util.concurrent.Callable;
import org.ladsn.tool.core.thread.ThreadUtil;
import org.ladsn.tool.core.util.StrUtil;
import org.ladsn.tool.json.JSONUtil;
/**
* 敏感词工具类
* @author Looly
*
*/
public final class SensitiveUtil {
// private static final Log log = LogFactory.get();
public static final char DEFAULT_SEPARATOR = StrUtil.C_COMMA;
private static WordTree sensitiveTree = new WordTree();
/**
* @return 是否已经被初始化
*/
public static boolean isInited(){
return !sensitiveTree.isEmpty();
}
/**
* 初始化敏感词树
* @param isAsync 是否异步初始化
* @param sensitiveWords 敏感词列表
*/
public static void init(final Collection sensitiveWords, boolean isAsync){
if(isAsync){
ThreadUtil.execAsync(new Callable(){
@Override
public Boolean call() throws Exception {
init(sensitiveWords);
return true;
}
});
}else{
init(sensitiveWords);
}
}
/**
* 初始化敏感词树
* @param sensitiveWords 敏感词列表
*/
public static void init(Collection sensitiveWords){
sensitiveTree.clear();
sensitiveTree.addWords(sensitiveWords);
// log.debug("Sensitive init finished, sensitives: {}", sensitiveWords);
}
/**
* 初始化敏感词树
* @param sensitiveWords 敏感词列表组成的字符串
* @param isAsync 是否异步初始化
* @param separator 分隔符
*/
public static void init(String sensitiveWords, char separator, boolean isAsync){
if(StrUtil.isNotBlank(sensitiveWords)){
init(StrUtil.split(sensitiveWords, separator), isAsync);
}
}
/**
* 初始化敏感词树,使用逗号分隔每个单词
* @param sensitiveWords 敏感词列表组成的字符串
* @param isAsync 是否异步初始化
*/
public static void init(String sensitiveWords, boolean isAsync){
init(sensitiveWords, DEFAULT_SEPARATOR, isAsync);
}
/**
* 是否包含敏感词
* @param text 文本
* @return 是否包含
*/
public static boolean containsSensitive(String text){
return sensitiveTree.isMatch(text);
}
/**
* 是否包含敏感词
* @param obj bean,会被转为JSON字符串
* @return 是否包含
*/
public static boolean containsSensitive(Object obj){
return sensitiveTree.isMatch(JSONUtil.toJsonStr(obj));
}
/**
* 查找敏感词,返回找到的第一个敏感词
* @param text 文本
* @return 敏感词
*/
public static String getFindedFirstSensitive(String text){
return sensitiveTree.match(text);
}
/**
* 查找敏感词,返回找到的第一个敏感词
* @param obj bean,会被转为JSON字符串
* @return 敏感词
*/
public static String getFindedFirstSensitive(Object obj){
return sensitiveTree.match(JSONUtil.toJsonStr(obj));
}
/**
* 查找敏感词,返回找到的所有敏感词
* @param text 文本
* @return 敏感词
*/
public static List getFindedAllSensitive(String text){
return sensitiveTree.matchAll(text);
}
/**
* 查找敏感词,返回找到的所有敏感词
* 密集匹配原则:假如关键词有 ab,b,文本是abab,将匹配 [ab,b,ab]
* 贪婪匹配(最长匹配)原则:假如关键字a,ab,最长匹配将匹配[a, ab]
*
* @param text 文本
* @param isDensityMatch 是否使用密集匹配原则
* @param isGreedMatch 是否使用贪婪匹配(最长匹配)原则
* @return 敏感词
*/
public static List getFindedAllSensitive(String text, boolean isDensityMatch, boolean isGreedMatch){
return sensitiveTree.matchAll(text, -1, isDensityMatch, isGreedMatch);
}
/**
* 查找敏感词,返回找到的所有敏感词
* @param bean 对象,会被转为JSON
* @return 敏感词
*/
public static List getFindedAllSensitive(Object bean){
return sensitiveTree.matchAll(JSONUtil.toJsonStr(bean));
}
/**
* 查找敏感词,返回找到的所有敏感词
* 密集匹配原则:假如关键词有 ab,b,文本是abab,将匹配 [ab,b,ab]
* 贪婪匹配(最长匹配)原则:假如关键字a,ab,最长匹配将匹配[a, ab]
*
* @param bean 对象,会被转为JSON
* @param isDensityMatch 是否使用密集匹配原则
* @param isGreedMatch 是否使用贪婪匹配(最长匹配)原则
* @return 敏感词
*/
public static List getFindedAllSensitive(Object bean, boolean isDensityMatch, boolean isGreedMatch){
return getFindedAllSensitive(JSONUtil.toJsonStr(bean), isDensityMatch, isGreedMatch);
}
}