热门搜索： json Test query CSS java t

您现在的位置是：虫虫源码 > C# > C# 网络爬虫

C# 网络爬虫

资源大小：1.53M
上传时间：2021-07-17
下载次数：0次
浏览次数：1次
资源积分：1积分
标签： C#语言基础

资源简介

测试了下：抓取单页没事，批量抓取暂时没发现在哪里。。。网络爬虫程序源码这是一款用 C# 编写的网络爬虫主要特性有：可配置：线程数、线程等待时间，连接超时时间，可爬取文件类型和优先级、下载目录等。状态栏显示统计信息：排入队列URL数，已下载文件数，已下载总字节数，CPU使用率和可用内存等。有偏好的爬虫：可针对爬取的资源类型设置不同的优先级。健壮性：十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。较好的性能：基于正则表达式的页面解析、适度加锁、维持HTTP连接等。今后有空可能加入的特性：新特性介绍爬取文件用Berkeley DB存储提高性能：常用操作系统不善于处理大量小文件基于URL Ranking的优先级队列主题爬虫：机器学习算法对链接与主题相关度进行评估，并按照得出的优先级顺序进行爬取爬虫礼仪遵循爬虫禁止协议、以及避免对服务器资源的过度使用等性能优化用UDP取代封装好的HttpWebRequest/ResponseDNS缓存异步的DNS地址解析硬盘缓存或内存数据库以避免频繁的磁盘寻道分布式爬虫以扩展单机能力（CPU、内存和硬盘访问）

您可能感兴趣的

同类别推荐

跑刀红狼三角洲 1天前成为了本站会员
象龟 1天前成为了本站会员
里狐 2天前成为了本站会员
： 2天前成为了本站会员
天妒英才 3天前成为了本站会员
Lntano 4天前成为了本站会员
绿色心情 4天前成为了本站会员
桃子 5天前成为了本站会员
民族复兴大任的时代新人 5天前成为了本站会员
兀七 5天前成为了本站会员

毛海彬 6天前下载了：

一个很好的汇编集成开发环境，支持多种汇编编译器。
毛海彬 6天前下载了：

汇编语言编写的发声程序! 无密码. 希望能给初学汇编的人一点启发吧!...
毛海彬 6天前下载了：

这是一个汇编的程序包，所包含了一般的汇编初学者所要参考的汇编小程序...
dybabc123 6天前下载了：

这是一个旅行商问题的算法源程序
dybabc123 6天前下载了：

unix下的ping代码源程序
dybabc123 6天前下载了：

这是一个运用多种排序法对数据进行排序的程序,排序时间复杂性小,空间复杂性小,排序速度快.压缩包包括源程序文件,再vc中运行.
dybabc123 6天前下载了：

Three-dimensional finite-difference ground-water flow model 三维流体有限元源代码
dybabc123 6天前下载了：

介绍windows环境下命令行
dybabc123 6天前下载了：

这是一个通过字符串操作来实现文本加密解密的源程序,通过打乱原文本字符串的顺序,隐藏信息,通过解密,可以回复原字符正常顺序,达到加密解密的目的.压缩包包括源程序文件,再vc中运行.
dybabc123 6天前下载了：

Thinking in java 3 习题答案

您现在的位置是：虫虫源码 > C# > C# 网络爬虫

C# 网络爬虫

资 源 简 介

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

相关资源

您可能感兴趣的

同类别推荐