侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

python的re模块使用方法详解

Python  /  管理员 发布于 7年前   210

一、正则表达式的特殊字符介绍

正则表达式^      匹配行首      $      匹配行尾      .      任意单个字符          []     匹配包含在中括号中的任意字符[^]     匹配包含在中括号中的字符之外的字符[-]     匹配指定范围的任意单个字符?     匹配之前项的1次或者0次+      匹配之前项的1次或者多次*      匹配之前项的0次或者多次{n}     匹配之前项的n次{m,n}    匹配之前项最大n次,最小m次{n,}    配置之前项至少n次

二、re模块的方法介绍

1、匹配类方法

a、findall方法

# findall方法,该方法在字符串中查找模式匹配,将所有的匹配字符串以列表的形式返回,如果文本中没有任何字符串匹配模式,则返回一个空的列表,# 如果有一个子字符串匹配模式,则返回包含一个元素的列表,所以,无论怎么匹配,我们都可以直接遍历findall返回的结果而不会出错,这对工程师# 编写程序来说,减少了异常情况的处理,代码逻辑更加简洁
 
# re.findall() 用来输出所有符合模式匹配的子串 re_str = "hello this is python 2.7.13 and python 3.4.5" pattern = "python [0-9]\.[0-9]\.[0-9]"res = re.findall(pattern=pattern,string=re_str)print(res) # ['python 2.7.1', 'python 3.4.5'] pattern = "python [0-9]\.[0-9]\.[0-9]{2,}"res = re.findall(pattern=pattern,string=re_str)print(res) # ['python 2.7.13']  pattern = "python[0-9]\.[0-9]\.[0-9]{2,}"res = re.findall(pattern=pattern,string=re_str)print(res) # [] # re.findall() 方法,返回一个列表,如果匹配到的话,列表中的元素为匹配到的子字符串,如果没有匹配到,则返回一个空的列表 re_str = "hello this is python 2.7.13 and Python 3.4.5" pattern = "python [0-9]\.[0-9]\.[0-9]"res = re.findall(pattern=pattern,string=re_str,flags=re.IGNORECASE)print(res) # ['python 2.7.1', 'Python 3.4.5'] # 设置标志flags=re.IGNORECASE,意思为忽略大小写

b、编译的方式使用正则表达式

# 我们一般采用编译的方式使用python的正则模块,如果在大量的数据量中,编译的方式使用正则性能会提高很多,具体读者们可以可以实际测试re_str = "hello this is python 2.7.13 and Python 3.4.5"re_obj = re.compile(pattern = "python [0-9]\.[0-9]\.[0-9]",flags=re.IGNORECASE)res = re_obj.findall(re_str)print(res)

c、match方法

# match方法,类似于字符串中的startwith方法,只是match应用在正则表达式中更加强大,更富有表现力,match函数用以匹配字符串的开始部分,如果模式# 匹配成功,返回一个SRE_Match类型的对象,如果模式匹配失败,则返回一个None,因此对于普通的前缀匹配,他的用法几乎和startwith一模一样,例如我# 们要判断data字符串是否以what和是否以数字开头
s_true = "what is a boy"s_false = "What is a boy"re_obj = re.compile("what") print(re_obj.match(string=s_true))# <_sre.SRE_Match object; span=(0, 4), match='what' print(re_obj.match(string=s_false))# None s_true = "123what is a boy"s_false = "what is a boy" re_obj = re.compile("\d+") print(re_obj.match(s_true))# <_sre.SRE_Match object; span=(0, 3), match='123'> print(re_obj.match(s_true).start())# 0print(re_obj.match(s_true).end())# 3print(re_obj.match(s_true).string)# 123what is a boyprint(re_obj.match(s_true).group())# 123  print(re_obj.match(s_false))# None

d、search方法

# search方法,模式匹配成功后,也会返回一个SRE_Match对象,search方法和match的方法区别在于match只能从头开始匹配,而search可以从# 字符串的任意位置开始匹配,他们的共同点是,如果匹配成功,返回一个SRE_Match对象,如果匹配失败,返回一个None,这里还要注意,# search仅仅查找第一次匹配,也就是说一个字符串中包含多个模式的匹配,也只会返回第一个匹配的结果,如果要返回所有的结果,最简单# 的方法就是findall方法,也可以使用finditer方法

e、finditer方法

# finditer返回一个迭代器,遍历迭代器可以得到一个SRE_Match对象,比如下面的例子
re_str = "what is a different between python 2.7.14 and python 3.5.4" re_obj = re.compile("\d{1,}\.\d{1,}\.\d{1,}") for i in re_obj.finditer(re_str):  print(i) # <_sre.SRE_Match object; span=(35, 41), match='2.7.14'># <_sre.SRE_Match object; span=(53, 58), match='3.5.4'>

2、修改类方法介绍

a、sub方法

# re模块sub方法类似于字符串中的replace方法,只是sub方法支持使用正则表达式,所以,re模块的sub方法使用场景更加广泛
re_str = "what is a different between python 2.7.14 and python 3.5.4" re_obj = re.compile("\d{1,}\.\d{1,}\.\d{1,}") print(re_obj.sub("a.b.c",re_str,count=1))# what is a different between python a.b.c and python 3.5.4 print(re_obj.sub("a.b.c",re_str,count=2))# what is a different between python a.b.c and python a.b.c print(re_obj.sub("a.b.c",re_str))# what is a different between python a.b.c and python a.b.c

b、split方法

# re模块的split方法和python字符串中的split方法功能是一样的,都是将一个字符串拆分成子字符串的列表,区别在于re模块的split方法能够# 使用正则表达式# 比如下面的例子,使用. 空格 : !分割字符串,返回的是一个列表
re_str = "what is a different between python 2.7.14 and python 3.5.4 USA:NewYork!Zidan.FRA" re_obj = re.compile("[. :!]") print(re_obj.split(re_str))# ['what', 'is', 'a', 'different', 'between', 'python', '2', '7', '14', 'and', 'python', '3', '5', '4', 'USA', 'NewYork', 'Zidan', 'FRA']

c、大小写不敏感设置

# 3、大小写不敏感 # re.compile(flags=re.IGNORECASE)

d、非贪婪匹配

# 4、非贪婪匹配,贪婪匹配总是匹配到最长的那个字符串,相应的,非贪婪匹配是匹配到最小的那个字符串,只需要在匹配字符串的时候加一个?即可 # 下面的例子,注意两个.s = "Beautiful is better than ugly.Explicit is better than impliciy."  re_obj = re.compile("Beautiful.*y\.") print(re_obj.findall(s))# ['Beautiful is better than ugly.Explicit is better than implicit.'] re_obj = re.compile("Beautiful.*?\.") print(re_obj.findall(s))# ['Beautiful is better than ugly.']

e、在正则匹配字符串中加一个小括号,会有什么的效果呢?

如果是要配置一个真正的小括号,那么就需要转义符,下面的例子大家仔细看下,注意下search方法返回的对象的group(1)这个方法是报错的

import res = "=aa1239d&&& 0a ()--" # obj = re.compile("\(\)")# search# rep = obj.search(s)# print(rep)# <_sre.SRE_Match object; span=(15, 17), match='()'># print(rep.group(1))# IndexError: no such group# print(rep.group())# ()
# findall rep = obj.findall(s)print(rep)# ['()']

如果是要返回括号中匹配的字符串中,则该小括号不需要转义符,findall方法返回的是小伙好中匹配到的字符串,search.group()方法的返回的整个模式匹配到字符串,search.group(1)这个是匹配第一个小括号中的模式匹配到的字符串,search.group(2)这个是匹配第二个小括号中的模式匹配到的字符串,以此类推

s = "=aa1239d&&& 0a ()--"rep = re.compile("\w+(&+)") print(rep.findall(s))# ['&&&']print(rep.search(s).group())# aa1239d&&&print(rep.search(s).group(1))# &&&

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


  • 上一条:
    Python企业编码生成系统之系统主要函数设计详解
    下一条:
    Python将string转换到float的实例方法
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客