首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > HTML/CSS > 网络爬虫代码

网络爬虫代码

资 源 简 介

资源描述 该代码是对图片中信息的捕获 Python写个爬虫把22mm.cc上的美女图片爬下来,我们把这个爬虫项目命名为:mm_crawler。 需满足: 1. 不要把非相关的图片也爬了; 2. 你总该考虑多线程吧?或者协程; 3. 命令行-h可以查看程序运行帮助,-n可以指定并发线程数(默认10个),-o可以指定图片存储在哪个目录(默认当前运行目录的pics目录下),-l可以限制爬多少图片就结束(默认不限制); 4. 思考个问题,如果下次我要爬其他的美女网站,你这个程序如何尽可能利于复用; 5. 把你的实现思路清晰记录在该爬虫项目的目录下:readme.txt; 6. 你可以用Python内置模块与第三方模块来加速你这个任务;

文 件 列 表

mm_crawler
.DS_Store
.project
.pydevproject
.settings
mm_spider.py
pics
readme.txt

相 关 资 源

您 可 能 感 兴 趣 的

同 类 别 推 荐

VIP VIP
0.196443s