突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,
搜索->点击图片->保存最大的图片->点击下载->点击保存。
简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。
下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:
import requests#导入两个模块
import re
url=requests.get("http://www.kuman.com/")#请求url
url.encoding="utf-8"#编码格式,根据情况指定
url_text=url.text#获取到网页内容
extract=r'<a href="(.*?)" title=".*?">'#正则表达式
img_url=re.findall(extract,url_text)#根据正则表达式提取url
print(img_url)#这里可以打印看一下。
然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一 一叙述。
关注公众号,后台输入:“爬虫教程” 获取整套的爬虫视频链接。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/111425.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...