大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
关于<Element * at 0x******>如何查看标签中的数据
from lxml import etree
import requests
url = 'https://www.pearvideo.com/' # 首页地址
data = {
}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
"AppleWebKit/537.36 (KHTML, like Gecko) "
"Chrome/89.0.4389.82 Safari/537.36"
}
session = requests.Session()
page_one = session.get(url, headers=headers).text
# page_one.encoding = 'utf-8'
print('-------首页请求成功--------')
tree = etree.HTML(page_one)
page_list = tree.xpath('//*[@id="navbar"]/ul/li')
for li in page_list:
# todo 方法1
page_list_li = li.xpath('./a/@href') # @href采用定位的方式 找到需要的key对应的值
print(li[0].text) # 直接获取li下面的文本
print(li[0].tag) #获取<a>标签名a
print(li[0].attrib) # 获取<a>标签的属性href和class值
# todo 方法2
for li_2 in range(len(li)): # todo 从上一个li标签中获取到我要的信息。参考:https://www.jb51.net/article/132145.htm
print(li[li_2].tag) #获取<a>标签名a
print(li[li_2].attrib) # 获取<a>标签的属性href和class
print(li[li_2].text) # 获取到li下面的文本
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/197294.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...