首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > C/C++/VC++ > ctbparser 中文依存句法分析工具包

ctbparser 中文依存句法分析工具包

资 源 简 介

简介 ctbparser是一个用C++语言实现的开源的中文处理工具包(GBK编码),用于分词、词性标注、依存句法分析,采用的是中文宾州树库(Chinese Tree Bank, CTB)标准。 优点 用户可以自行编辑词条以改善分词,词性标注效果。 可以处理繁体中文。 分词、词性标注、句法分析采用条件随机场模型,而非传统的HHMM模型。该模型具有较好的新词识别能力。 评测 操作系统:64位CentOS 5,CPU: Intel(R) Xeon(R) E5405, 2.00GHz 测试语料:CTB6标准测试集 内存占用:270M 速度:30句/秒 分词F-score:95.3% 词性标注精度:94.27% 句法分析精度(LAS):81% 参考文献 Mark A. Paskin, "Cubic-time Parsing and Learning Algorithms for Grammatical Bigram Models", technique report, 2001 Xian Qian, Qi Zhang, Xuangjing Huang and Lide Wu. "2D Trie for fast parsing", COLING 2010

文 件 列 表

GBK2GB2312
Makefile
base_feature.cpp
base_feature.h
config.txt
const.h
crf.cpp
crf.h
crf_thread.cpp
crf_thread.h
crfparser.cpp
crfparser.h
crfparser_thread.cpp
crfparser_thread.h
ctbparser.cpp
ctbparser.exe
ctbparser.h
dat.h
dependency_model_l1
dict.txt
freelist.h
fun.cpp
fun.h
in.txt
lbfgs.cpp
lbfgs.h
main.cpp
ner_model_l1
normalstr.cpp
normalstr.h
pos_model_l1
readme.html
readme_cn.html
seg_model_l1
templet_feature.cpp
templet_feature.h
tf
thread.h
trie.cpp
trie.h
user.cpp

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

VIP VIP