热门搜索： json Test query CSS java java java java

您现在的位置是：虫虫源码 > Java > MMSEG java中文分析器，或发布

MMSEG java中文分析器，或发布

资源大小：1.95 MB
上传时间：2021-06-29
下载次数：0次
浏览次数：1次
资源积分：1积分
标签： 中文发布分析器

资源简介

代码迁移到 Github https://github.com/chenlb/mmseg4j-solr mmseg4j-solr-2.0.0.jar 兼容 lucene/solr [4.3.0, 4.7.1] com.chenlb.mmseg4j mmseg4j-solr 2.0.0 有问题优先 https://github.com/chenlb/mmseg4j-solr/issues 报告。 mmseg4j 1.8.6 支持 maven 依赖，代码从 git svn 迁移的地址是 https://github.com/chenlb/mmseg4j-from-googlecode 1、mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器，并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。 2、MMSeg 算法有两种分词方法：Simple和Complex，都是基于正向最大匹配。Complex 加了四个规则过虑。官方说：词语的正确识别率达到了 98.41%。mmseg4j 已经实现了这两种分词算法。 * 1.5版的分词速度simple算法是 1100kb/s左右、complex算法是 700kb/s左右，（测试机：AMD athlon 64 2800+ 1G内存 xp）。 * 1.6版在complex基础上实现了最多分词(max-word)。“很好听” -> "很好|好听"; “中华人民共和国” -> "中华|华人|共和|国"; “中国人民银行” -> "中国|人民|银行"。 * 1.7-beta 版, 目前 complex

文件列表

mmseg4j-1.9.1
dist
mmseg4j-analysis
mmseg4j-core
mmseg4j-solr
CHANGES.txt
LICENSE.txt
README.txt
build.properties
build.xml
pom.xml

您可能感兴趣的

同类别推荐

麦田守望者 1天前成为了本站会员
lighting！ 1天前成为了本站会员
威尔史密斯 1天前成为了本站会员
清水煮白开 2天前成为了本站会员
你看我困不 2天前成为了本站会员
蒋治杉 2天前成为了本站会员
。 2天前成为了本站会员
超↗人不会飛 2天前成为了本站会员
白白狐疑酱 3天前成为了本站会员
꧁꫞꯭微米꯭꫞꧂? 3天前成为了本站会员

麦田守望者 1天前成为了本站会员
lighting！ 1天前成为了本站会员
威尔史密斯 1天前成为了本站会员
清水煮白开 2天前成为了本站会员
你看我困不 2天前成为了本站会员
蒋治杉 2天前成为了本站会员
。 2天前成为了本站会员
超↗人不会飛 2天前成为了本站会员
白白狐疑酱 3天前成为了本站会员
꧁꫞꯭微米꯭꫞꧂? 3天前成为了本站会员

麦田守望者 1天前下载了：

UCenter Home 是一套采用PHP+MYSQL构建的社会化网络软件（Social Network Software，简称SNS）。通过 UCen...
麦田守望者 1天前下载了：

像开源的Facebook
麦田守望者 1天前下载了：

PHPSPACE社交门户网站
FeiFei 1天前下载了：

wince TTS语音播报
FeiFei 1天前下载了：

利用微软的语音引擎使你的程序会朗读，需要安装微软语音引擎或者金山词霸...
lighting！ 1天前下载了：

steger warming 分裂格式
白白狐疑酱 2天前下载了：

25种人工神经网络matlab源码
超↗人不会飛 2天前下载了：

使用的谱分析C语言代码
节 3天前下载了：

MMC-HVDC模型预测控制
甘露去柚 4天前下载了：

stm32 流水灯

麦田守望者 1天前下载了：

UCenter Home 是一套采用PHP+MYSQL构建的社会化网络软件（Social Network Software，简称SNS）。通过 UCen...
麦田守望者 1天前下载了：

像开源的Facebook
麦田守望者 1天前下载了：

PHPSPACE社交门户网站
FeiFei 1天前下载了：

wince TTS语音播报
FeiFei 1天前下载了：

利用微软的语音引擎使你的程序会朗读，需要安装微软语音引擎或者金山词霸...
lighting！ 1天前下载了：

steger warming 分裂格式
白白狐疑酱 2天前下载了：

25种人工神经网络matlab源码
超↗人不会飛 2天前下载了：

使用的谱分析C语言代码
节 3天前下载了：

MMC-HVDC模型预测控制
甘露去柚 4天前下载了：

stm32 流水灯

您现在的位置是：虫虫源码 > Java > MMSEG java中文分析器，或发布

MMSEG java中文分析器，或发布

资 源 简 介

文 件 列 表

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

文件列表

相关资源

您可能感兴趣的

同类别推荐