Python lxml解析HTML并用xpath获取元素的方法-侯体宗的博客

Python lxml解析HTML并用xpath获取元素的方法
Python / 管理员发布于 8年前 251

代码

使用方法见注释

#-*- coding: UTF-8 -*-from lxml import etreesource = u'''<div><p class="p1" data-a="1">测试数据1</p><p class="p1" data-a="2">测试数据2</p><p class="p1" data-a="3" style="height:100px;"><strong class="s">测试数据3</strong></p><p class="p1" data-a="4" width="200"><img src="https:/article/1.jpg" class="img"/><br/>图片</p>'''# 从字符串解析page = etree.HTML(source)# 元素列表ps = page.xpath("//p")for p in ps:  print u"属性：%s" % p.attrib  print u"文本：%s" % p.text# 文本列表ts = page.xpath("//p/text()")for t in ts:  print t# xpath定位 ls = page.xpath('//p[@class="p1"][last()]/img')for l in ls:  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

上一条：
python之验证码生成(gvcode与captcha)
下一条：
在python中获取div的文本内容并和想定结果进行对比详解

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top