Please wait. This can take some minutes ...
Many resources are needed to download a project. Please understand that we have to compensate our server costs. Thank you in advance.
Project price only 1 $
You can buy this project and download/modify it how often you want.
com.github.xiaoyuge5201.words.StopChar Maven / Gradle / Ivy
package com.github.xiaoyuge5201.words;
import com.github.xiaoyuge5201.other.LangUtil;
import java.util.Arrays;
import java.util.HashSet;
import java.util.Set;
/**
* 过滤词及一些简单处理
*
* @author taofucheng
*/
public class StopChar {
/**
* 不需要处理的词,如标点符号、空格等
*/
public static final Set STOP_WORD = new HashSet(Arrays.asList(new String[]{" ", "'", "、", "。",
"·", "ˉ", "ˇ", "々", "—", "~", "‖", "…", "‘", "’", "“", "”", "〔", "〕", "〈", "〉", "《", "》", "「", "」", "『",
"』", "〖", "〗", "【", "】", "±", "+", "-", "×", "÷", "∧", "∨", "∑", "∏", "∪", "∩", "∈", "√", "⊥", "⊙", "∫",
"∮", "≡", "≌", "≈", "∽", "∝", "≠", "≮", "≯", "≤", "≥", "∞", "∶", "∵", "∴", "∷", "♂", "♀", "°", "′", "〃",
"℃", "$", "¤", "¢", "£", "‰", "§", "☆", "★", "〇", "○", "●", "◎", "◇", "◆", "□", "■", "△", "▽", "⊿", "▲",
"▼", "◣", "◤", "◢", "◥", "▁", "▂", "▃", "▄", "▅", "▆", "▇", "█", "▉", "▊", "▋", "▌", "▍", "▎", "▏", "▓",
"※", "→", "←", "↑", "↓", "↖", "↗", "↘", "↙", "〓", "ⅰ", "ⅱ", "ⅲ", "ⅳ", "ⅴ", "ⅵ", "ⅶ", "ⅷ", "ⅸ", "ⅹ", "①",
"②", "③", "④", "⑤", "⑥", "⑦", "⑧", "⑨", "⑩", "⒈", "⒉", "⒊", "⒋", "⒌", "⒍", "⒎", "⒏", "⒐", "⒑", "⒒", "⒓",
"⒔", "⒕", "⒖", "⒗", "⒘", "⒙", "⒚", "⒛", "⑴", "⑵", "⑶", "⑷", "⑸", "⑹", "⑺", "⑻", "⑼", "⑽", "⑾", "⑿", "⒀",
"⒁", "⒂", "⒃", "⒄", "⒅", "⒆", "⒇", "Ⅰ", "Ⅱ", "Ⅲ", "Ⅳ", "Ⅴ", "Ⅵ", "Ⅶ", "Ⅷ", "Ⅸ", "Ⅹ", "Ⅺ", "Ⅻ", "!", "”",
"#", "¥", "%", "&", "’", "(", ")", "*", "+", ",", "-", ".", "/", "0", "1", "2", "3", "4", "5", "6", "7",
"8", "9", ":", ";", "<", "=", ">", "?", "@", "〔", "\", "〕", "^", "_", "‘", "{", "|", "}", "∏", "Ρ", "∑",
"Υ", "Φ", "Χ", "Ψ", "Ω", "α", "β", "γ", "δ", "ε", "ζ", "η", "θ", "ι", "κ", "λ", "μ", "ν", "ξ", "ο", "π",
"ρ", "σ", "τ", "υ", "φ", "χ", "ψ", "ω", "(", ")", "〔", "〕", "^", "﹊", "﹍", "╭", "╮", "╰", "╯", "", "_",
"", "^", "(", "^", ":", "!", "/", "\\", "\"", "<", ">", "`", "·", "。", "{", "}", "~", "~", "(", ")", "-",
"√", "$", "@", "*", "&", "#", "卐", "㎎", "㎏", "㎜", "㎝", "㎞", "㎡", "㏄", "㏎", "㏑", "㏒", "㏕"}));
/**
* 判断指定的词是否是不处理的词。
* 如果参数为空,则返回true,因为空也属于不处理的字符。
*
* @param ch 指定的词
* @return 是否是不处理的词
*/
public static boolean isStopChar(String ch) {
if (LangUtil.isEmpty(ch)) return true;
return STOP_WORD.contains(ch);
}
/**
* 判断指定的词是否是不处理的词。
* 如果参数为空,则返回true,因为空也属于不处理的字符。
*
* @param ch 指定的词
* @return 是否是不处理的词
*/
public static boolean isStopChar(char ch) {
return STOP_WORD.contains(String.valueOf(ch));
}
@Override
public String toString() {
return super.toString();
}
}