python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

python爬虫-爬取网站图片。

突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,

搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。

下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:

import requests#导入两个模块

import re



url=requests.get("http://www.kuman.com/")#请求url

url.encoding="utf-8"#编码格式,根据情况指定

url_text=url.text#获取到网页内容

extract=r'<a href="(.*?)" title=".*?">'#正则表达式

img_url=re.findall(extract,url_text)#根据正则表达式提取url

print(img_url)#这里可以打印看一下。

 

然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一 一叙述。

 

关注公众号,后台输入:“爬虫教程”  获取整套的爬虫视频链接。

python爬虫-爬取网站图片。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/111425.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • Java之路:this关键字的用法

    Java之路:this关键字的用法(1)普通方法中,this总是指向调用该方法的对象。(2)构造方法中,this总是指向正要初始化的对象。(3)this可以让类中的一个方法,访问该类的另一个方法或属性。(4)可以使用this关键字调用重载构造方法。避免相同的初始化代码,只能在构造方法中用,并且必须位于构造方法的第一句。(5)this不能用于static方法。用this调用构造方法packagethis_const…

  • 关于scrollIntoView的使用

    关于scrollIntoView的使用当输入框被键盘挡住时,可以使用scrollIntoView让输入框回到视野&lt;divref="inputBox"style="height:400px;"&gt;//一定要设置高度才会有效果  &lt;inputtype="text"@focus="intoview()"/&gt;&lt;/div&gt;intoview:function(){  this.$r

  • Java 使用 Tess4J 实现图像识别

    Java 使用 Tess4J 实现图像识别最近需要用Java做一个图像识别的东西,查了一些资料,在此写一个基于Tess4J的教程,方便其他人参考和使用。其实做图像识别,也可以使用TESSERACT-OCR来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。首先,下载Tess4J的相关资源(一个压缩包),官网:http://tess4j.source…

  • linux嵌入式系统的缺点,arm嵌入式主板的优缺点

    嵌入式主板是嵌入在设备里面做控制、数据处理使用的CPU板,常见的有两类,即基于X86的嵌入式主板和基于RISC的ARM嵌入式主板。今天我们就来认识arm嵌入式主板,arm嵌入式主板就是一个嵌入在设备里面做控制、数据处理使用的CPU板。一般作为工控主板使用。ARM处理器是一种16/32位的嵌入式RISC微处理器,具有低成本、高性能、低功耗的特点。ARM9系列微处理器具有以下特点:支持32位ARM…

  • 大数据去重方案

    大数据去重方案

    2021年11月22日
  • H264解码流程

    H264解码流程H264解码过程比较复杂,这里仅简要概述大致流程如果是非黑即白的二值图像,不压缩的情况下一个像素只需要1个bit。如果是256种状态的灰度图像,不压缩的情况下一个像素需要8bit(1字节,256种状态)。如果用256种状态标识屏幕上某种颜色的灰度,而屏幕采用三基色红绿蓝(RGB),不压缩的情况下一个像素需要占用24bit(3字节),这个就是常说的24位真彩色。…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号