ord.1.3.source-code.punctuation.txt Maven / Gradle / Ivy
Go to download
Show more of this group Show more artifacts with this name
Show all versions of word Show documentation
Show all versions of word Show documentation
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。
能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。
同时提供了Lucene、Solr、ElasticSearch插件。
#逗号
,
,
#顿号
、
#句号
。
#问号
?
?
#叹号
!
!
#引号(双引号和单引号)
“
”
‘
’
"
"
'
#破折号
─
#连接号
—
-
#冒号
:
:
#分号
;
;
#省略号
…
#间隔号
·
#书名号
《
》
〈
〉
#大于小于号
<
>
#左右括号
(
)
(
)
#直行文稿引号
﹄
﹃
﹂
﹁
#台湾香港使用的双引号
『
』
#六角括号
〔
〕
#方头括号
【
】
#方括号
[
]
#浪纹
~
#浪线
﹏