python 文件查找及内容匹配方法
Python  /  管理员 发布于 7年前   199
需求:程序开发中有大量的接口,但在实际的使用中有一部分是没有使用的,在开发的程序中匹配这些接口名,找到哪些接口从没有使用过。将这些没有使用过的接口名保存下来。
代码结构:
结构解析:
1、find.py 是文件查找及匹配程序
2、input_files.txt是待匹配内容
文件格式如下:
3、result.txt 用于存放查找结果
格式同上
4、text.txt 用于测试的文档(可忽略)
实际代码:
find.py
#!/usr/bin/python# -*- coding: UTF-8 -*-import os, re, datetimeclass Find(object): def __init__(self, root, input_file): """ --初始化 """ self.root = root # 文件树的根 self.input_files = [] # 待查询的字符串集合 self.files = [] # 待匹配的文件集合 self.current = 0 # 正在匹配的文件集合的位置 f = file(input_file, "r") old_content = f.read() f.close() self.input_files = old_content.split('\n') # 将待匹配字符串保存在数组中 @staticmethod def find_file(self): """ --查找文件,即遍历文件树将查找到的文件放在文件集合中 :return: """ # python中的walk方法可以查找到所给路径下的所有文件和文件夹,这里只用文件 for root, dirs, files in os.walk(self.root, topdown=True): for name in files: self.files.append(os.path.join(root, name)) # print(os.path.join(root, name)) # for name in dirs: # print(os.path.join(root, name)) @staticmethod def walk(self): """ --逐一查找,并将结果存入result.txt文件中 :param self: :return: """ for item1 in self.files: Find.traverse_file(self, item1) try: result = '' for item3 in self.input_files: result += item3 + '\n' f = file("./result_files.txt", "w") f.write(result) f.close() except IOError, msg: print "Error:", msg else: print "OK" @staticmethod def traverse_file(self, file_path): """ --遍历文件,匹配字符串 :return: """ f = file(file_path, "r") file_content = f.read() f.close() input_files = [] for item2 in self.input_files: if item2: # 正则匹配,不区分大小写 searchObj = re.search(r'(.*)' + item2 + '.*', file_content, re.M | re.I) if searchObj: continue else: input_files.append(item2) self.input_files = input_filesif __name__ == "__main__": print datetime.datetime.now() findObj = Find('F:\\projects', "./input_files.txt") findObj.find_file(findObj) findObj.walk(findObj) print datetime.datetime.now()
以上这篇python 文件查找及内容匹配方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号