热门搜索： json Test query CSS java t

您现在的位置是：虫虫源码 > 其他 > sinawler

sinawler

资源大小：504.00 kB
上传时间：2021-06-30
下载次数：0次
浏览次数：1次
资源积分：1积分
标签： 爬虫 sqlserver oracle database csharp Academic DotNet DataMining Crawler 新浪微博 sina miniblog

资源简介

注：新浪微博API版本升级后，认证方式有变，程序未做相应更新。有兴趣的朋友可将源代码签出研究。也欢迎有兴趣的朋友加入项目进行更新由于本应用接口访问量大，暂被新浪封禁。若您的确希望体验本应用，在SinaMBCrawler.config文件中设置自己的appKey和appSecret即可。注：新版本可为5个机器人分别设定不同的appKey和appSecret，以及各自最短访问API的间隔时间（毫秒），这样它们可以更快速地独立工作了！国内第一个针对微博数据的爬虫程序！登录后，可以指定用户为起点，以该用户的关注人、粉丝为线索，延人脉关系搜集用户基本信息、微博数据、评论数据。该应用获取的数据可作为科研、与新浪微博相关的研发等的数据支持，但请勿用于商业用途。该应用基于.NET2.0框架，需SQL SERVER作为后台数据库，并提供了针对SQL Server的数据库脚本文件。另外，由于新浪微博API的限制，爬取的数据可能不够完整（如获取粉丝数量的限制、获取微博数量的限制等）本程序版权归作者所有。你可以免费: 拷贝、分发、呈现和表演当前作品,制作派生作品。你不可将当前作品用于商业目的。 7.x版本已经发布！基于新浪微博API2.0。基于1.0API的版本到6.5为止，也提供下载。该版本共有5个后台工作线程：爬取用户基本信息的机器人、爬取用户关系的机器人、爬取用户标签的机器人、爬取微博内容的机器人、爬取微博评论的机器人。更高的性能！最大限度挖掘爬虫潜力！以现在测试的结果看，已经能够满足自用。本程序的特点： 1、5个后台工作线程，最大限度挖掘爬虫性能潜力！ 2、界面上提供参数设置，灵活方便 3、抛弃app.config配置文件，自己实现配置信息的加密存储，保护数据库帐号信息 4、自动调整请求频率，防止超限，也避免过慢，降低效率 5、对机器人任意控制，可随时暂停、继续、停止机器人，也可选择机器人是否启动 6、良好的用户体验注意：使用时，config文件和可执行文件的文件名需要相同

您可能感兴趣的

同类别推荐

跑刀红狼三角洲 1天前成为了本站会员
象龟 1天前成为了本站会员
里狐 2天前成为了本站会员
： 2天前成为了本站会员
天妒英才 3天前成为了本站会员
Lntano 4天前成为了本站会员
绿色心情 4天前成为了本站会员
桃子 5天前成为了本站会员
民族复兴大任的时代新人 5天前成为了本站会员
兀七 5天前成为了本站会员

毛海彬 6天前下载了：

一个很好的汇编集成开发环境，支持多种汇编编译器。
毛海彬 6天前下载了：

汇编语言编写的发声程序! 无密码. 希望能给初学汇编的人一点启发吧!...
毛海彬 6天前下载了：

这是一个汇编的程序包，所包含了一般的汇编初学者所要参考的汇编小程序...
dybabc123 6天前下载了：

这是一个旅行商问题的算法源程序
dybabc123 6天前下载了：

unix下的ping代码源程序
dybabc123 6天前下载了：

Three-dimensional finite-difference ground-water flow model 三维流体有限元源代码
dybabc123 6天前下载了：

这是一个运用多种排序法对数据进行排序的程序,排序时间复杂性小,空间复杂性小,排序速度快.压缩包包括源程序文件,再vc中运行.
dybabc123 6天前下载了：

介绍windows环境下命令行
dybabc123 6天前下载了：

Thinking in java 3 习题答案
dybabc123 6天前下载了：

这是一个通过字符串操作来实现文本加密解密的源程序,通过打乱原文本字符串的顺序,隐藏信息,通过解密,可以回复原字符正常顺序,达到加密解密的目的.压缩包包括源程序文件,再vc中运行.

您现在的位置是：虫虫源码 > 其他 > sinawler

sinawler

资 源 简 介

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

资源简介

相关资源

您可能感兴趣的

同类别推荐