热门搜索： json Test query CSS java java java java

您现在的位置是：虫虫源码 > 其他 > 跨平台工具箱中提取、过滤、对齐和将多语言文档的文本数据转换为统计机器翻译系统的并行训练语料。

跨平台工具箱中提取、过滤、对齐和将多语言文档的文本数据转换为统计机器翻译系统的并行训练语料。

资源大小：21.39 kB
上传时间：2021-06-30
下载次数：0次
浏览次数：1次
资源积分：1积分
标签： 系统跨平台文档提取转换工具箱训练文本数据统计过滤并行对齐多语机器翻译语料

资源简介

**Media filter graph metaphor * Workflow manager for parallel language data * Configuration-driven, modular filters * Reusable plug-in architecture * Standardized base-classes** Statistical machine translation SMT is growing from an academic novelty to a commercially viable capability. High quality parallel linguistic corpora drive SMT"s high quality translations. If you are looking to transform your existing asset of translation memories (and other parallel language data) into valuable training corpus that can drive new, accurate SMT operations, this tool is for you. This tool box provides a common framework, reusable filtering interfaces and aligned document work-flow to manage the transformation of ad-hoc data in thousands of documents with millions of sentence pairs into an catalogued set of parallel language corpora. This common framework can manage the work-flow for any open-source NLP, such as sentence breaking, word segmentation (e.g. MeCab for Japanese text)

您可能感兴趣的

同类别推荐

SkinkEBravia 1天前成为了本站会员
飞想 1天前成为了本站会员
서 씨. 1天前成为了本站会员
kewenyong 1天前成为了本站会员
null 1天前成为了本站会员
•̀ᴗ-) 1天前成为了本站会员
悟 1天前成为了本站会员
小帆船 1天前成为了本站会员
云淡风清 1天前成为了本站会员
我 1天前成为了本站会员

SkinkEBravia 1天前成为了本站会员
飞想 1天前成为了本站会员
서 씨. 1天前成为了本站会员
kewenyong 1天前成为了本站会员
null 1天前成为了本站会员
•̀ᴗ-) 1天前成为了本站会员
悟 1天前成为了本站会员
小帆船 1天前成为了本站会员
云淡风清 1天前成为了本站会员
我 1天前成为了本站会员

今天也要加油 1天前下载了：

斜视 sar 成像
今天也要加油 1天前下载了：

CS算法
null 1天前下载了：

32驱动保护进程
•̀ᴗ-) 1天前下载了：

吉林大学开发的类似于PASCAL语言的SNL编译器。
•̀ᴗ-) 1天前下载了：

snl编译器
•̀ᴗ-) 1天前下载了：

snl语言是一个简单的具有嵌套过程定义的过程式语言
FeiFei 1天前下载了：

vb下语音合成原代码，选择一篇txt的文档，然后可以朗读出来，可选择男声女声，音量等。...
FeiFei 1天前下载了：

VB与VC混合编程中处理消息的方法(带部分源代码)
FeiFei 1天前下载了：

VB源码，让DOS命令边执行边输出的源码。VB code for DOS command simultaneous implementation and the...
FeiFei 1天前下载了：

加入一个用VB编写CGI的VB源程序。（你需要在Win98上首先安装20Personal WebServer...

今天也要加油 1天前下载了：

斜视 sar 成像
今天也要加油 1天前下载了：

CS算法
null 1天前下载了：

32驱动保护进程
•̀ᴗ-) 1天前下载了：

吉林大学开发的类似于PASCAL语言的SNL编译器。
•̀ᴗ-) 1天前下载了：

snl编译器
•̀ᴗ-) 1天前下载了：

snl语言是一个简单的具有嵌套过程定义的过程式语言
FeiFei 1天前下载了：

vb下语音合成原代码，选择一篇txt的文档，然后可以朗读出来，可选择男声女声，音量等。...
FeiFei 1天前下载了：

VB与VC混合编程中处理消息的方法(带部分源代码)
FeiFei 1天前下载了：

VB源码，让DOS命令边执行边输出的源码。VB code for DOS command simultaneous implementation and the...
FeiFei 1天前下载了：

加入一个用VB编写CGI的VB源程序。（你需要在Win98上首先安装20Personal WebServer...

您现在的位置是：虫虫源码 > 其他 > 跨平台工具箱中提取、过滤、对齐和将多语言文档的文本数据转换为统计机器翻译系统的并行训练语料。

跨平台工具箱中提取、过滤、对齐和将多语言文档的文本数据转换为统计机器翻译系统的并行训练语料。

资 源 简 介

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

相关资源

您可能感兴趣的

同类别推荐