打造自己的ip代理池

全栈程序员-用户IM • 2022年5月31日上午10:00 • 未分类

打造自己的ip代理池在爬虫时经常需要使用代理，于是我爬取了一个可以免费提供代理的网址，从中获取免费代理，从而打造属于一个自己的代理池。如图所示，这是网址的界面展示，我们需要做的就是需要其中的ip、port列中的数据，获取数据后需要我们拼接成一个完整的IP然后保存即可，代码如下:importrequestsfromlxmlimportetreeimportosurl=’https://www.kuaidaili.com/free/inha/3/’headers=…

大家好，又见面了，我是你们的朋友全栈君。

在爬虫时经常需要使用代理，于是我爬取了一个可以免费提供代理的网址，从中获取免费代理，从而打造属于一个自己的代理池。

如图所示，这是网址的界面展示，我们需要做的就是需要其中的ip、port列中的数据，获取数据后需要我们拼接成一个完整的IP然后保存即可，代码如下:

import requests
from lxml import etree
import os

url = 'https://www.kuaidaili.com/free/inha/3/'
headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'
    }

content = requests.get(url,headers = headers).text
resonse = etree.HTML(content)
tr_list = resonse.xpath('//div[@id="list"]/table/tbody/tr')
#print(tr_list)
ip_list = []
for tr in tr_list:
    ip = tr.xpath('./td[1]/text()')
    port = tr.xpath('./td[2]/text()')
    proxy_ip = ip[0] +':' +  port[0]
    #print(proxy_ip)
    ip_list.append(proxy_ip)
print(ip_list)

代码运行后获取到完整的ip数据，接下来我们就可以使用这些代理了，这里需要使用random来随机选择一个ip。

打造自己的ip代理池

proxy=random.choice(ip_list) #本地代理
proxies={
    'http':'http://'+proxy,
    'https':'https://'+proxy
}
try:
    response=requests.get('网址',proxies=proxies)
    print(response.text)
except requests.exceptions.ConnectionError as e:
    print('错误:',e.args)

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/138540.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

使用【百度云推送】第三方SDK实现推送功能具体解释

使用【百度云推送】第三方SDK实现推送功能具体解释

全栈程序员-用户IM
2021年12月6日
vs2010注册密钥_vs2012ultimate密钥

vs2010注册密钥_vs2012ultimate密钥MicrosoftVisualStudioUltimate2012旗舰版有效注册密钥：YKCW6-BPFPF-BT8C9-7DCTH-QXGWC

全栈程序员-用户IM
2022年10月14日
ubuntu11.04发售啦

ubuntu11.04发售啦

全栈程序员-用户IM
2021年8月11日
GIT使用基础知识

GIT使用基础知识

全栈程序员-用户IM
2021年5月11日
linux open详解,Linux系统open函数详解[通俗易懂]

linux open详解,Linux系统open函数详解[通俗易懂]Linux系统中open函数主要作用就是打开和创建文件，可以根据参数来定制我们需要的文件的属性和用户权限等各种参数，下面良许教程网为大家分享一下Linux系统open函数具体使用方法。一、open函数用来干什么open函数在Linux下一般用来打开或者创建一个文件，我们可以根据参数来定制我们需要的文件的属性和用户权限等各种参数。二、open函数的定义和参数我们首先来看下open函数在Linux下的…

全栈程序员-用户IM
2022年5月26日
伽马校正算法_伽马设定

伽马校正算法_伽马设定写在前面我相信几乎所有做图像处理方面的人都听过伽马校正（GammaCorrection）这一个名词，但真正明白它是什么、为什么要有它、以及怎么用它的人其实不多。我也不例外。最初我查过一些资料，但很多文章的说法都不一样，有些很晦涩难懂。直到我最近在看《RealTimeRendering，3rdEdition》这本书的时候，才开始慢慢对它有所理解。本人才疏学浅，写的这篇文章很

全栈程序员-用户IM
2022年9月25日

发表回复

关注全栈程序员社区公众号