python爬虫-爬取网站图片。

全栈程序员-用户IM • 2021年9月17日下午7:00 • 未分类

python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片，想下载，只能一张图片一张图片的点击，想一想，你要下载的图片有10000张，那会是一个怎么样的画面，答案很简单，你会哭的，假如一张图片从搜索出来，到点击放大，再到下载，假如以最快速度，中间不间断，那我们来算一下时间，

搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来，除去搜索，最简单的步骤是4步，每一步算1秒钟，4秒，那就是40000秒，也就是11.1个小时，等下完这些图片，估计已经吐血了，那好，我们在来增加步骤，加上搜索，加上修改名称，网络问题不考虑，那就是6步，6万秒，只是多了两步，却是多了5个多小时，想想那是多痛苦的事。

下面，是传受你武功秘籍的时候了，只要掌握五个步骤，下载分分钟钟的事，还等什么，直接上代码：

import requests#导入两个模块

import re



url=requests.get("http://www.kuman.com/")#请求url

url.encoding="utf-8"#编码格式，根据情况指定

url_text=url.text#获取到网页内容

extract=r'<a href="(.*?)" title=".*?">'#正则表达式

img_url=re.findall(extract,url_text)#根据正则表达式提取url

print(img_url)#这里可以打印看一下。

然后一个爬虫就完成了，至于后面的操作都是根据这个重复操作得到的，就不一一叙述。

关注公众号，后台输入：“爬虫教程” 获取整套的爬虫视频链接。

python爬虫-爬取网站图片。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/111425.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

W3C标准及规范_地脚螺栓标准规范

W3C标准及规范_地脚螺栓标准规范1.概念：W3C标准中文名：万维网联盟，外文名：WorldWideWebConsortium万维网联盟标准不是某一个标准，而是一些列标准的集合。网页主要有三部分组成：结构（Structure）、表现（Presentation）、行为（Behavior）。对应的标准也有三方面：结构化标准主要包括XHTML和XML，表现标准语言主要包括CSS、行为标准主要包括（如W3CDOM）、…

全栈程序员-用户IM
2022年9月17日
dirsearch使用简记[通俗易懂]

dirsearch使用简记[通俗易懂]python3.x./dirsearch.py-u"http://xxxx.xxx"-ephpNote:dirsearch需要使用Python3.x替换"http://xxxx.xxx"为目标网址即可

全栈程序员-用户IM
2022年9月1日
利用 SSDP 协议生成 100 Gbps DDoS 流量的真相探秘「建议收藏」

利用 SSDP 协议生成 100 Gbps DDoS 流量的真相探秘「建议收藏」原文地址https://www.4hou.com/technology/5979.html上个月我们分享过一些反射型DDoS攻击数据，SSDP攻击的平均大小是12Gbps，我们记录的最大的反射式DDoS攻击是：1.30Mpps（每秒数百万个数据包）2.80Gbps（每秒数十亿位）3.使用940k反射器的IP几天前，我们注意到了一个不寻常的SSDP超级放大情况的发生…

全栈程序员-用户IM
2022年10月10日
tp-link路由器无线桥接详细教程_tp-link路由器怎么有线桥接

tp-link路由器无线桥接详细教程_tp-link路由器怎么有线桥接本文介绍了TP-Link路由器有线桥接的设置方法，路由器有线桥接其实严格上应该叫做：两个(多个)路由器串联上网。主要适用于这样的网络环境：有A、B两台TP-Link路由器，A连接Moden(猫)上网，然后在用网线连接A和B，要实现B路由器也能够上网，包括B的无线网络。方法一、路由器B设置1、用网线连接电脑和TP-Link路由器B的A、B路由器之间，暂时不需要用网线连接。只让电脑连接无线路由器2、进…

全栈程序员-用户IM
2022年10月27日
Nginx服务器重启命令，关闭「建议收藏」

Nginx服务器重启命令，关闭「建议收藏」一些Nginx相关的命令

全栈程序员-用户IM
2022年6月22日
96道前端面试题+前端常用算法「建议收藏」

96道前端面试题+前端常用算法「建议收藏」这篇文章主要分享一些收集整理的面试题，希望能对大家有所帮助。字节一面：1，说一下浏览器缓存2，cookie与session的区别3，浏览器如何做到session的功能的。4，解释一下：csrf和xss5，怎么防止csrf和xss6，跨域的处理方案有哪些7，CORS是如何做的？8，对于CORS，Get和POST有区别吗？9，了解HTTPS的过程吗？10，esmodule和commonjs的区别11，react里如何做动态加载12，动.

全栈程序员-用户IM
2022年8月28日

发表回复

关注全栈程序员社区公众号