侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python文本处理简单易懂方法解析

Python  /  管理员 发布于 7年前   147

这篇文章主要介绍了Python文本处理简单易懂方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

自从认识了python这门语言,所有的事情好像变得容易了,作为小白,逗汁儿今天就为大家总结一下python的文本处理的一些小方法。

话不多说,代码撸起来。

python大小写字符互换

在进行大小写互换时,常用到的方法有4种,upper()、lower()、capitalize() 和title()。

str = "www.dataCASTLE.com"print(str.upper())# 把所有字符中的小写字母转换成大写字母print(str.lower())# 把所有字符中的大写字母转换成小写字母print(str.capitalize())# 把第一个字母转化为大写字母,其余小写print(str.title())# 把每个单词的第一个字母转化为大写,其余小写 WWW.DATACASTLE.COMwww.datacastle.comWww.datacastle.comWww.Datacastle.Com

还可以同时进行大小写互换:

s="hGdssWW678qqfdDDD777f8888sD8FJJss jjYYhVV #sh&" def fn(x):  if x.is lower():    return x.upper()  elif x.is upper():    return x.lower()  else:    return xresult=''.join([fn(r) for r in list(s)])print(result)HgDSSww678QQFDddd777F8888Sd8fjjSS JJyyHvv #SH&

在s当中,不仅有大小写字母,还有数字,符号作为干扰,运用代码成功将大小写进行了互换。

行列互换

01 :insert进行A行与N行的互换

with open('D:.txt','r') as f:  txt=f.readlines()  txt.insert(4,txt[1])#第二行插入第五行的位置  del(txt[1])#删除原来的第二行  print(txt)1  A  一 3  C  三 4  D  四 2  B  二 5  E  五 6  F  六

02: 矩阵的行列互换

matrix = [[1, 1, 1, 1],         [2, 2, 2, 2],         [3, 3, 3, 3],]trans = []for i in range(4):  trans.append([row[i] for row in matrix])print('', trans) [[1, 2, 3],  [1, 2, 3],  [1, 2, 3],  [1, 2, 3]]

关于行列互换的情况,python有一个很好用的库pandas,其中的操作非常简便,可以到之前的文章”十分钟上手pandas“中查看。

实现快速排序

快排的思想:首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。

01:超级"简短"的python实现的快速排序,一行代码轻松实现快速排序。

def quickSort(arg):  if(arg==[]):     return []  return quickSort([i for i in arg[1:] if i<=arg[0]])+[arg[0]]+quickSort([i for i in arg[1:] if i>arg[0]])print quickSort([11,22,8,23,7,33,13,28,66,777])[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

02:一般快排实现

def quicksort(array, left, right):  #建立递归终止条件  if left >= right:    return  low = left#low为序列左边要移动的游标  high = right#high为序列右边要移动的游标  key = array[low]#将左边的数设为基准元素  while left < right:    # 当left与right未重合,并且比基准元素要大,就将游标向左移动    while left < right and array[right] > key:      right -= 1    # 如果比基准元素小,就跳出循环,并且把其放在基准元素左边    array[left] = array[right]    # 当low与last未重合,并且比基准元素要小,就将游标向右移动    while left < right and array[left] <= key:      left += 1    # 如果比基准元素大,就跳出循环,并且把其放在基准元素右边    array[right] = array[left]  # 当low与last相等,就是基准元素的排序位置  array[right] = key  # 对排序好的元素左右两边的序列进行递归  quicksort(array, low, left - 1)  quicksort(array, left + 1, high)array = [11,22,8,23,7,33,13,28,66,777]print("Quick Sort: ")quicksort(array,0,len(array)-1)print(array)[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

03:《算法导论》中的快排程序

def quicksort(array, l, r):  if l < r:    q = partition(array, l, r)    quick_sort(array, l, q - 1)    quick_sort(array, q + 1, r)def partition(array, l, r):  x = array[r]  i = l - 1  for j in range(l, r):    if array[j] <= x:      i += 1      array[i], array[j] = array[j], array[i]  array[i + 1], array[r] = array[r], array[i+1]  return i + 1array = [11,22,8,23,7,33,13,28,66,777]print("Quick Sort: ")quicksort(array,0,len(array)-1)print(array)[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

04:python对list有一个内置函数sorted()排序

a = [11,22,8,23,7,33,13,28,66,777]b=sorted(a)print(b)print(a)[7, 8, 11, 13, 22, 23, 28, 33, 66, 777][11, 22, 8, 23, 7, 33, 13, 28, 66, 777]

sorted虽然是使用函数方法进行排序,但是效果非常好。使用sorted函数进行排序,不会改变a原有的排序,并且当文本中有其余字母符号等干扰时,也可以成功的将数字进行排序。

文本对齐

有些时候我们得到的文本可能是混乱的,需要进行对齐处理,关于对齐有以下几种方法:

01:format格式化对齐

# format格式化对齐def f1():    with open("D:.txt","r") as f:    for s in f:      l=s.rsplit ()      #左对齐,填充符号自定      t='{0:<5} {1:<7} {2}'.format(l[0],l[1],l[2])        print(str(t))f1()111   ABC     西瓜22222 AABBC   水蜜桃3333  CSDDGFF 香蕉44    QQQSED  波罗蜜

02:just对齐

#just对齐r=''def f2():  f=open("D:.txt","r")  for s in f:    l=s.rsplit() #通过指定分隔符对字符串进行切片    print(l[0].ljust(5," "),l[1].ljust(7," "),l[2])f2()111   ABC     西瓜22222 AABBC   水蜜桃3333  CSDDGFF 香蕉44    QQQSED  波罗蜜

分行输出

01:正则表达式分行输出

#正则表达式a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"import rereg=["[a-z]","[A-Z]","d","[^da-zA-Z]"]#compile和findall一起使用,返回一个列表for s in reg:    rega=re.compile(s)  s=re.findall(rega,a)  print("".join(s))abcdefghiABCDEFGHI123456789一二三四五六七八九

02:string方法分行输出

#string方法a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"import stringta=tb=tc=td=''la=string.ascii_lowercase#la为小写字母ua=string.ascii_uppercase#ua为大写字母nb=string.digits#nb为0~9的数字ub="一二三四五六七八九"#分别从a中找出小写、大写字母、数字并进行分行输出for s in a:  if s in la:    ta=ta+s  if s in ua:    tb=tb+s  if s in nb:    tc=tc+s  if s in ub:    td=td+sprint(ta)print(tb)print(tc)print(td)abcdefghiABCDEFGHI123456789一二三四五六七八九

好了,今天的分享就到这里。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


  • 上一条:
    利用OpenCV和Python实现查找图片差异
    下一条:
    python类中super() 的使用解析
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客