大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
为了使爬虫代码更加扁平化,因此,我对2.0版本爬虫进行了一定的修改。
话不多说,请看代码。
# 导入库
import os, time, requests
# 请求头
headers = {
'User-Agent': 'Chrome 10.0'
}
# 图片数据列表
pictures = []
# 获取图片数据
def get_pic(url, nums):
for num in range(0, int(nums)):
url_all = str(url) + f'{str(num)}.jpg'
res = requests.get(url=url_all, headers=headers)
pic_content = res.content
pictures.append(pic_content)
time.sleep(0.5)
# 创建目的文件夹
def get_path(path_name):
if not os.path.exists(f'C:/Users/liu/Desktop/图集/{path_name}'):
os.mkdir(f'C:/Users/liu/Desktop/图集/{path_name}')
else:
pass
# 保存图片数据
def save_data():
for pic,i in zip(pictures, range(int(Num))):
picture = open(f'C:/Users/liu/Desktop/图集/{str(Page_Num)}/{str(i)}.jpg', 'wb')
picture.write(pic)
picture.close()
# 主函数,调用函数
def main():
url = f'https://tjg.gzhuibei.com/a/1/{str(Page_Num)}/' # 传入网页数据
get_path(path_name=Page_Num)
get_pic(url=url, nums=Num)
save_data()
# 主程序入口
if __name__ == '__main__':
Page_Num = input('Enter the Page_name:') # Page_Num指下文url所代指的数字
Num = int(input('Enter the Num:')) + 1 # Num为写真集的图片数
print('Finish!')
大家有任何疑问,都可以在下面评论区进行留言,我会不定时的对评论进行回复。
感谢大家的支持!
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/157826.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...