热门搜索： json Test query CSS java java java java

您现在的位置是：虫虫源码 > 其他 > 基于structured svm的中文分词工具

基于structured svm的中文分词工具

资源大小：54.56 MB
上传时间：2021-06-30
下载次数：0次
浏览次数：1次
资源积分：1积分
标签： 中文分词工具 StructuredSVM 基于

资源简介

基于structured svm的中文分词工具此分词工具为本人参加bakeoff2010中文分词比赛时所用模型的一个简化版技术文档：http://acl.eldoc.ub.rug.nl/mirror/W/W10/W10-4130.pdf 分词工具 ustcsplit.exe 本工具基于structured svm算法，扩展了跨领域分词和用户自定义词典的功能使用方法： ustcsplit.exe ./input.txt ./ngram.entr ./fe.txt ./model ./customlex.txt > out.txt input.txt为输入文本 ngram.entr为ngram统计信息 fe.txt特征文件 model，structured svm 训练的模型 customlex.txt，用户词典文件用于改善分词效果 out.txt，为输出文件用户词典文件的作用：当分词系统在某个词多次出现错误的时候，有时需要立即修正这个错误，又不想重新训练模型，可以在词典文件中加入这个词演示工具ustc_cws1.0.exe 使用方法：工具需要文件model，fe.txt，ngram.entr，customlex.txt，ustcseg.dll 分词功能：在输入文本框中输入句子，点击分词按钮。自定义词典优化功能：可以将需要强制分词的词加入customlex文件中，点击导入用户词典即可动态更新用户词典。联系方式：cyzhang9@mail.ustc.edu.cn

文件列表

USTC_CWS1.0
clpsplitdll.dll
customlex.txt
fe.txt
input.txt
lex.txt
minisplit.exe
model
ngram.entr
readme.txt
ustc_cws1.0.exe
readme.txt.bak
out.txt
seg.bat
ustcseg.dll
ustcsplit.exe
clpsplit.bat
USTC_CWS1.0

您可能感兴趣的

同类别推荐

. 2小时前成为了本站会员
奋斗 11小时前成为了本站会员
✨ 12小时前成为了本站会员
一天不玩浑身难受 1天前成为了本站会员
Aloha 1天前成为了本站会员
嘻嘻嘻 1天前成为了本站会员
maihaoweilai 1天前成为了本站会员
紫麟鹿 1天前成为了本站会员
天狼 1天前成为了本站会员
李红远 1天前成为了本站会员

毛海彬 1周前下载了：

一个很好的汇编集成开发环境，支持多种汇编编译器。
毛海彬 1周前下载了：

汇编语言编写的发声程序! 无密码. 希望能给初学汇编的人一点启发吧!...
毛海彬 1周前下载了：

这是一个汇编的程序包，所包含了一般的汇编初学者所要参考的汇编小程序...
dybabc123 1周前下载了：

这是一个旅行商问题的算法源程序
dybabc123 1周前下载了：

unix下的ping代码源程序
dybabc123 1周前下载了：

这是一个运用多种排序法对数据进行排序的程序,排序时间复杂性小,空间复杂性小,排序速度快.压缩包包括源程序文件,再vc中运行.
dybabc123 1周前下载了：

Three-dimensional finite-difference ground-water flow model 三维流体有限元源代码
dybabc123 1周前下载了：

介绍windows环境下命令行
dybabc123 1周前下载了：

这是一个通过字符串操作来实现文本加密解密的源程序,通过打乱原文本字符串的顺序,隐藏信息,通过解密,可以回复原字符正常顺序,达到加密解密的目的.压缩包包括源程序文件,再vc中运行.
dybabc123 1周前下载了：

Thinking in java 3 习题答案

您现在的位置是：虫虫源码 > 其他 > 基于structured svm的中文分词工具

基于structured svm的中文分词工具

资 源 简 介

文 件 列 表

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

文件列表

相关资源

您可能感兴趣的

同类别推荐