侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python中的正则表达式与JSON数据交换格式

Python  /  管理员 发布于 7年前   515

一、初识正则表达式

正则表达式 是一个特殊的字符序列,一个字符串是否与我们所设定的这样的字符序列,相匹配快速检索文本、实现替换文本的操作

json(xml) 轻量级 web 数据交换格式

import rea='C|C++|Java|C#||Python|Javascript'r= re.findall('Python',a)print(r)if len(r) > 0: print('字符串中包含Python')else: print('No')['Python']字符串中包含Python 

二、元字符与普通字符

import rea='C0C++7Java8C#9Python6Javascript'r= re.findall('\d',a)print(r)b=''for x in a: try: int(x) b +=x+',' except : passprint(b)

结果:

['0', '7', '8', '9', '6']
0,7,8,9,6,

'Python' 普通字符 '\d' 元字符

三、字符集

import re#找出中间一个字符不是C 和F的 单词s = 'abc, acc, adc, aec, afc, ahc'r = re.findall('a[^cf]c', s) #[a-z] [cf]print(r)

结果:

['abc', 'adc', 'aec', 'ahc']

四、概括字符集

#\d 数字 \D 字母#\w 数字和字母 =[a-zA-Z0-9_] \W #\s 空白字符 \Sa='python 11\t11java&678p\nh\rp'r = re.findall('\s', a)print(r)

结果:

[' ', '\t', '\n', '\r']

五、数量词

a='python 1111java&678php'r = re.findall('[a-z]{3,6}', a)print(r)

结果:

['python', 'java', 'php']

六、贪婪与非贪婪

a='python 1111java&678php'r = re.findall('[a-z]{3,6}?', a)#贪婪 与 非贪婪 ?print(r)

结果:

['pyt', 'hon', 'jav', 'php']

七、匹配0次1次或者无限多次

# * 匹配0次或者无限多次# + 匹配1次或者无限多次# ? 匹配0次或者1次a='pytho0python1pythonn2pythonw'r = re.findall('python*', a)print(r)

结果:

['pytho', 'python', 'pythonn', 'python']

八、边界匹配符

qq = '12345678'# 4~8 r = re.findall('^\d{4,8}$', qq)print(r)a = '123456789'# 4~8 ^规则$ ^开头 $结尾e = re.findall('^\d{4,8}$', a)print(e)

结果:

['12345678']
[]

九、组

# () 组a = 'pythonpythonpythonpythonpython'# r = re.findall('(python){3}', a)print(r)

结果:

['python'] 代表存在一组(pythonpythonpython) 这样的数据

十、匹配模式参数

# I | S 忽略大小写 | 匹配所有字符lanuage = 'PythonC#\nJavaPHP'r = re.findall('c#.{1}', lanuage,re.I | re.S)print(r)

结果:

['C#\n']

十一、re.sub正则替换

搜索替换

def convert(value): matched = value.group() # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'> return '!!'+matched+'!!'lanuage = 'PythonC#JavaC#PHPC#'# r = re.sub('C#', 'GO', lanuage, 1) 返回结果: PythonGOJavaC#PHPC## s=lanuage.replace('C#', 'GO')r = re.sub('C#', convert, lanuage) #传入参数print(r)

结果:

Python!!C#!!Java!!C#!!PHP!!C#!!

十二、把函数作为参数传递

def convert(value): matched = value.group() #拿到对象的值 # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'> if int(matched) >=6 : return '9' else: return '0'lanuage = 'A8C3721D86'r = re.sub('\d', convert, lanuage)print(r)#A9C0900D99

十三、search与match函数

s = 'A8C3721D86'# None 从开头开始匹配 假如没有找到相应的匹配结果 返回None 只匹配一次r = re.match('\d', s) print(r) #None#搜索这个字符串 一旦找到第一个满足匹配的结果就返回 只匹配一次r1 = re.search('\d', s)print(r1) #<_sre.SRE_Match object; span=(1, 2), match='8'>print(r1.group()) #8print(r1.span()) # (1, 2)r2 = re.findall('\d', s)print(r2) #['8', '3', '7', '2', '1', '8', '6']

十四、group分组

#提取life 和python 之间的值s = 'life is short,i use python'#Noner = re.search('life.*python', s)print(r.group()) #life is short,i use python group(组号)r = re.search('life(.*)python', s)print(r.group(0)) #life is short,i use python group(组号)print(r.group(1)) # is short,i use#group(0) 一种特殊情况 匹配正则表达式完整的结果r = re.findall('life(.*)python', s)print(r) #[' is short,i use ']s = 'life is short,i use python, i love python'r = re.search('life(.*)python(.*)python', s)print(r.group(0)) # life is short,i use python, i love python print(r.group(1)) # is short,i useprint(r.group(2)) # , i loveprint(r.group(0,1,2)) #('life is short,i use python, i love python', ' is short,i use ', ', i love ')print(r.groups()) # (' is short,i use ', ', i love ')

十五、一些关于学习正则的建议

#\d 数字 \D 字母#\w 数字和字母 =[a-zA-Z0-9_] \W #\s 空白字符 \S# . 匹配除了换行符\n之外其他所有字符# * 匹配0次或者无限多次# + 匹配1次或者无限多次# ? 匹配0次或者1次# () 组 # I | S 忽略大小写 | 匹配所有字符

python :爬虫,数据处理

十六、理解JSON

JSON 是一种轻量级的数据交换格式

字符串是JSON的表现形式

符合 JSON 格式的字符串叫做 JSON 字符串

{"name":"qiyue"}

JSON VS XML

优势:

跨语言交换数据

易于阅读

易于解析

网络传输效率高

十七、反序列化

import json# JSON object arrayjson_str = '{"name":"qiyue","age":18}'s = json.loads(json_str)# dict#反序列化s = json.loads(json_str) #load() 把json 的数据类型 转换为我们自己语言的数据类型print(type(s)) #<class 'dict'>print(s) #{'name': 'qiyue', 'age': 18}print(s['name']) # qiyuejson_str = '[{"name":"qiyue","age":18},{"name":"qiyue","age":18}]'s = json.loads(json_str)print(type(s)) # <class 'list'>print(s) # [{'name': 'qiyue', 'age': 18}, {'name': 'qiyue', 'age': 18}]JSON Pythonobject dictarray liststring strnumber intnumber floattrue Truefalse Falsenull None

十八、序列化

#序列化 为jsonstudent = [ {"name":"qiyue","age":18, 'flag':False}, {"name":"python","age":18}]json_str = json.dumps(student)print(type(json_str)) # <class 'str'>print(json_str) #[{"name": "qiyue", "age": 18, "flag": false}, {"name": "python", "age": 18}]

十九、小谈JSON、JSON对象与JSON字符串

JSON 是一种轻量级的数据交换格式

JSON对象 局限于语言

JSON字符串

JSON 有自己的数据类型

虽然它和JavaScript 的数据类型有些相似 但是他们不是一种语言

ECMASCRIPT一个标准 JavaScript ActionScription JSON 实现标准的一种方案

REST 服务

总结

以上所述是小编给大家介绍的Python中的正则表达式与JSON数据交换格式 ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!


  • 上一条:
    Python虚拟环境的原理及使用详解
    下一条:
    python实现共轭梯度法
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客