All Downloads are FREE. Search and download functionalities are using the official Maven repository.

ord.1.3.source-code.punctuation.txt Maven / Gradle / Ivy

Go to download

word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。

There is a newer version: 1.3.1
Show newest version
#逗号
,
,
#顿号
、
#句号
。
#问号
?
?
#叹号
!
!
#引号(双引号和单引号)
“ 
”
‘ 
’
"
"
'
#破折号
─
#连接号
—
-
#冒号
:
:
#分号
;
;
#省略号
…
#间隔号
·
#书名号
《 
》
〈
〉
#大于小于号
<
>
#左右括号
( 
)
(
)
#直行文稿引号
﹄
﹃
﹂
﹁
#台湾香港使用的双引号
『
』
#六角括号
〔
〕
#方头括号
【
】
#方括号
[
]
#浪纹
~
#浪线
﹏




© 2015 - 2024 Weber Informatics LLC | Privacy Policy