热门搜索： json Test query CSS java java java java

您现在的位置是：虫虫源码 > Java > dynasty-search-engine

dynasty-search-engine

资源大小：2.26 MB
上传时间：2021-06-30
下载次数：0次
浏览次数：1次
资源积分：1积分
标签：

资源简介

项目为一个Java搜索引擎的实现(非Lucene)，根据搜索引擎的工作流程将实现分为三个模块，分别是：网络爬虫、预处理模块以及查询服务模块。系统首先使用网络爬虫爬取各个网页的源码并保存到本地，随后调用预处理模块将这些原始网页处理后进行分词并建立倒排索引以方便查询，最后搭建web服务器用JSP提供搜索服务。网络爬虫采用多线程机制，提高网页的爬取效率；在预处理中，使用数据库存储网页的索引信息(由于系统规模不大)，分词器读取外部的词典对网页正文进行分词，用户可方便的编辑替换词典用于垂直搜索，倒排索引保存在内存中以方便查询；采用Tomcat搭建的web服务器提供JSP服务，是系统与用户交互的接口：接受用户输入并且返回查询结果。 PS:单纯的看代码可能对于了解搜索引擎的流程有些困难，对应的一个教程可以在http://www.ibm.com/developerworks/cn/views/java/libraryview.jsp?search_by=dySE 获得。

文件列表

SearchEngine
WebRoot
src
Raws
lib
Dictionary
.classpath
.mymetadata
.project
.settings
org.eclipse.jdt.core.prefs
SearchEngine.war
.settings

您可能感兴趣的

同类别推荐

有你共鸣 30分钟前成为了本站会员
榕树下 1小时前成为了本站会员
% 2小时前成为了本站会员
想你了徐圆婷 2天前成为了本站会员
吾每网络 4天前成为了本站会员
Carl 4天前成为了本站会员
。。。 4天前成为了本站会员
Yaku 4天前成为了本站会员
UnlikeRainday 4天前成为了本站会员
鸢一 4天前成为了本站会员

有你共鸣 30分钟前成为了本站会员
榕树下 1小时前成为了本站会员
% 2小时前成为了本站会员
想你了徐圆婷 2天前成为了本站会员
吾每网络 4天前成为了本站会员
Carl 4天前成为了本站会员
。。。 4天前成为了本站会员
Yaku 4天前成为了本站会员
UnlikeRainday 4天前成为了本站会员
鸢一 4天前成为了本站会员

7777777 1天前下载了：

雷达手册中文第三版
7777777 3天前下载了：

天线工程手册
7777777 3天前下载了：

天线工程手册 - 林昌禄，聂在平
7777777 3天前下载了：

中文版《天线理论与设计》R.S.Elliott 著王茂光等译.pdf )
7777777 3天前下载了：

CST用户全书完整版
7777777 3天前下载了：

相控阵天线手册（第二版）中文版
UnlikeRainday 4天前下载了：

stm32嵌入式微控制器快速上手第2版.pdf
7777777 4天前下载了：

雷达手册 1051页 64.5M PDF版.pdf
7777777 4天前下载了：

雷达手册（合订本）
7777777 4天前下载了：

宽带相控阵雷达

7777777 1天前下载了：

雷达手册中文第三版
7777777 3天前下载了：

天线工程手册
7777777 3天前下载了：

天线工程手册 - 林昌禄，聂在平
7777777 3天前下载了：

中文版《天线理论与设计》R.S.Elliott 著王茂光等译.pdf )
7777777 3天前下载了：

CST用户全书完整版
7777777 3天前下载了：

相控阵天线手册（第二版）中文版
UnlikeRainday 4天前下载了：

stm32嵌入式微控制器快速上手第2版.pdf
7777777 4天前下载了：

雷达手册 1051页 64.5M PDF版.pdf
7777777 4天前下载了：

雷达手册（合订本）
7777777 4天前下载了：

宽带相控阵雷达

您现在的位置是：虫虫源码 > Java > dynasty-search-engine

dynasty-search-engine

资 源 简 介

文 件 列 表

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

文件列表

相关资源

您可能感兴趣的

同类别推荐