CSS选择器实现字段解析-侯体宗的博客

CSS选择器实现字段解析
前端 / 管理员发布于 8年前 279

根据上面所学的CSS基础语法知识，现在来实现字段的解析。首先还是解析标题。打开网页开发者工具，找到标题所对应的源代码。

发现是在div class="entry-header"下面的h1节点中，于是打开scrapy shell 进行调试

但是我不想要<h1>这种标签该咋办，这时候就要使用CSS选择器中的伪类方法。如下所示。

注意的是两个冒号。使用CSS选择器真的很方便。同理我用CSS实现字段解析。代码如下

# -*- coding: utf-8 -*-  import scrapy  import re  class JobboleSpider(scrapy.Spider):      name = 'jobbole'      allowed_domains = ['blog.jobbole.com']      start_urls = ['http://blog.jobbole.com/113549/']      def parse(self, response):          # title = response.xpath('//div[@class = "entry-header"]/h1/text()').extract()[0]          # create_date = response.xpath("//p[@class = 'entry-meta-hide-on-mobile']/text()").extract()[0].strip().replace("·","").strip()          # praise_numbers = response.xpath("//span[contains(@class,'vote-post-up')]/h10/text()").extract()[0]          # fav_nums = response.xpath("//span[contains(@class,'bookmark-btn')]/text()").extract()[0]          # match_re = re.match(".*?(\d+).*",fav_nums)          # if match_re:          #     fav_nums = match_re.group(1)          # comment_nums = response.xpath("//a[@href='']/span").extract()[0]          # match_re = re.match(".*?(\d+).*", comment_nums)          # if match_re:          #     comment_nums = match_re.group(1)          # content = response.xpath("//div[@class='entry']").extract()[0]  #通过CSS选择器提取字段          title = response.css(".entry-header h1::text").extract()[0]          create_date = response.css(".entry-meta-hide-on-mobile::text").extract()[0].strip().replace("·","").strip()          praise_numbers = response.css(".vote-post-up h10::text").extract()[0]          fav_nums = response.css("span.bookmark-btn::text").extract()[0]          match_re = re.match(".*?(\d+).*", fav_nums)          if match_re:  fav_nums = match_re.group(1)          comment_nums = response.css("a[href=''] span::text").extract()[0]          match_re = re.match(".*?(\d+).*", comment_nums)          if match_re:  comment_nums = match_re.group(1)          content = response.css("div.entry").extract()[0]          tags = response.css("p.entry-meta-hide-on-mobile a::text").extract()[0]          pass

总结

以上所述是小编给大家介绍的CSS选择器实现字段解析，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对站的支持！

上一条：
纯css写出爱心版加载效果的示例代码
下一条：
CSS实现Tab页切换实例代码

0条评论 (评论内容有缓存机制,请悉知!)

最新最热

相关文章
使用 Alpine.js 排序插件对元素进行排序(0个评论)
在js中使用jszip + file-saver实现批量下载OSS文件功能示例(0个评论)
在vue中实现父页面按钮显示子组件中的el-dialog效果(0个评论)
使用mock-server实现模拟接口对接流程步骤(0个评论)
vue项目打包程序实现把项目打包成一个exe可执行程序(0个评论)

近期评论
test1 在
opencode + Oh-my-openagent,我的第一个免费的ai编程智能体管家:Sisyphus中评论 test..
122 在
学历：一种延缓就业设计，生活需求下的权衡之选中评论工作几年后，报名考研了，到现在还没认真学习备考，迷茫中。作为一名北漂互联网打工人..
Zita 在
Google AI Studio升级全栈 vibe coding体验，可直接构建带登录和数据库的应用中评论 111222..
123 在
Clash for Windows作者删库跑路了，github已404中评论按理说只要你在国内，所有的流量进出都在监控范围内，不管你怎么隐藏也没用，想搞你分..
原梓番博客在
在Laravel框架中使用模型Model分表最简单的方法中评论好久好久都没看友情链接申请了，今天刚看，已经添加。..

Top