首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Java > 快速重复数据删除引擎

快速重复数据删除引擎

  • 资源大小:4.41 MB
  • 上传时间:2021-06-30
  • 下载次数:0次
  • 浏览次数:1次
  • 资源积分:1积分
  • 标      签: 引擎 数据 快速 重复 删除

资 源 简 介

Duke has moved to Github Duke is a fast and flexible deduplication (or entity resolution, or record linkage) engine written in Java on top of Lucene. The latest version is 1.1 (see ReleaseNotes). Features High performance. Highly configurable. Support for CSV, JDBC, SPARQL, and NTriples DataSources. Many built-in comparators. Plug in your own data sources, comparators, and cleaners. GeneticAlgorithm for automatically tuning configurations. Command-line client for getting started. API for embedding into any kind of application. Support for batch processing and continuous processing. Can maintain database of links found via JNDI/JDBC. Can run in multiple threads. Duke has moved to

文 件 列 表

duke-1.1
lucene-core-4.0.0.jar
lucene-analyzers-common-4.0.0.jar
lucene-spatial-4.0.0.jar
spatial4j-0.3.jar
lucene-queries-4.0.0.jar
doc
README.txt
duke-1.1-javadoc.jar
duke-1.1-sources.jar
duke-1.1.jar

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

VIP VIP
  • 杨波 13小时前 成为了本站会员

  • ZS 13小时前 成为了本站会员

  • . 1天前 成为了本站会员

  • 奋斗 1天前 成为了本站会员

  • 1天前 成为了本站会员

  • 一天不玩浑身难受 2天前 成为了本站会员

  • Aloha 2天前 成为了本站会员

  • 嘻嘻嘻 2天前 成为了本站会员

  • maihaoweilai 2天前 成为了本站会员

  • 紫麟鹿 2天前 成为了本站会员