大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
python爬虫学习教程,短短25行代码批量下载豆瓣妹子图片、非常简短,代码不是很多非常适合新手练习!
学习python、python爬虫过程中有不懂的可以加入我的python零基础系统学习交流秋秋qun:前面是934,中间109,后面是170,与你分享Python企业当下人才需求及怎么从零基础学习Python,和学习什么内容。相关学习视频资料、开发工具都有分享!
代码展示:
#!/usr/bin/env python
import urllib.request
from bs4 import BeautifulSoup
def crawl(url):
headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib.request.Request(url, headers=headers)
page = urllib.request.urlopen(req, timeout=20)
contents = page.read()
soup = BeautifulSoup(contents)
my_girl = soup.find_all('img')
for girl in my_girl:
link = girl.get('src')
print(link)
content2 = urllib.request.urlopen(link).read()
with open(u'D:\doubanmeizi'+'/'+link[-11:],'wb') as code:
code.write(content2)
page_start = 0
page_stop = 10
for page in range(page_start, page_stop):
page += 1
url = 'http://www.dbmeinv.com/?pager_offset=%s' % page
crawl(url)
print("哈哈,妹子图片下载完毕啦!")
PYthon学习企鹅裙:88198-2657 领取python自动化编程资料教程
学习python爬虫过程中有不懂的可以给我留言,可以关注一下我,我会不定时分享关于python相关小案例及学习经验
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/193861.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...