侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python实现一个Git日志统计分析的小工具

Python  /  管理员 发布于 7年前   285

前言

本文介绍的是利用Python实现的一个小工具,用于分析Git commit log,获得Git Project每个成员的简单行为数据。

Warning:代码量不能代表程序员能力水平!

启动参数

共5个。

  • Repo地址
  • Commit 起始日期
  • Commit 结束日期
  • Git仓库子目录
  • 统计分析结果CSV文件目标路径

exec_git

Git Log命令:

git -C {} log --since={} --until={} --pretty=tformat:%ae --shortstat --no-merges -- {} > {}

填入参数,调用系统命令'os.system()',输出结果至本地临时文件。读取至内存,简单的String Array。

parse

Git Log输出有3种格式,对应3种正则表达式。

REPATTERN_FULL = r"\s(\d+)\D+(\d+)\D+(\d+)\D+\n"REPATTERN_INSERT_ONLY = r"\s(\d+)\D+(\d+)\sinsertion\D+\n"REPATTERN_DELETE_ONLY = r"\s(\d+)\D+(\d+)\sdeletion\D+\n"

遍历得到的数据,首先构造一个以Author为Key,分析结果为Value的字典。

分析结果构造一个元祖,包括:

  • Commit 次数
  • 增加代码行数
  • 删除代码行数
  • 变更代码行数

save_csv

简单省略。

示例代码:

#!/usr/local/bin/python3# -*- coding: utf-8 -*-'''Analyse git branch commit log, for every version, every person.'''import osimport sysimport reimport csvGIT_LOG = r'git -C {} log --since={} --until={} --pretty=tformat:%ae --shortstat --no-merges -- {} > {}'REPATTERN_FULL = r"\s(\d+)\D+(\d+)\D+(\d+)\D+\n"REPATTERN_INSERT_ONLY = r"\s(\d+)\D+(\d+)\sinsertion\D+\n"REPATTERN_DELETE_ONLY = r"\s(\d+)\D+(\d+)\sdeletion\D+\n"CSV_FILE_HEADER = ["Author", "Commit", "Insert", "Delete", "Loc"]def exec_git(repo, since, until, subdir): '''Execute git log commant, return string array.''' logfile = os.path.join(os.getcwd(), 'gitstats.txt') git_log_command = GIT_LOG.format(repo, since, until, subdir, logfile) os.system(git_log_command) lines = None with open(logfile, 'r', encoding='utf-8') as logfilehandler: lines = logfilehandler.readlines() return linesdef save_csv(stats, csvfile): '''save stats data to csv file.''' with open(csvfile, 'w', encoding='utf-8') as csvfilehandler: writer = csv.writer(csvfilehandler) writer.writerow(CSV_FILE_HEADER) for author, stat in stats.items():  writer.writerow([author, stat[0], stat[1], stat[2], stat[3]])def parse(lines): '''Analyse git log and sort to csv file.''' prog_full = re.compile(REPATTERN_FULL) prog_insert_only = re.compile(REPATTERN_INSERT_ONLY) prog_delete_only = re.compile(REPATTERN_DELETE_ONLY) stats = {} for i in range(0, len(lines), 3): author = lines[i] #empty = lines[i+1] info = lines[i+2] #change = 0 insert, delete = int(0), int(0) result = prog_full.search(info) if result:  #change = result[0]  insert = int(result.group(2))  delete = int(result.group(3)) else:  result = prog_insert_only.search(info)  if result:  #change = result[0]  insert = int(result.group(2))  delete = int(0)  else:  result = prog_delete_only.search(info)  if result:   #change = result[0]   insert = int(0)   delete = int(result.group(2))  else:   print('Regular expression fail!')   return loc = insert - delete stat = stats.get(author) if stat is None:  stats[author] = [1, insert, delete, loc] else:  stat[0] += 1  stat[1] += insert  stat[2] += delete  stat[3] += loc return statsif __name__ == "__main__": print('gitstats begin') if len(sys.argv) != 6: print('Invalid argv parameters.') exit(0) REPO = os.path.join(os.getcwd(), sys.argv[1]) SINCE = sys.argv[2] UNTIL = sys.argv[3] SUB_DIR = sys.argv[4] CSV_FILE = os.path.join(os.getcwd(), sys.argv[5]) LINES = exec_git(REPO, SINCE, UNTIL, SUB_DIR) assert LINES is not None STATS = parse(LINES) save_csv(STATS, CSV_FILE) print('gitstats done')

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家的支持。


  • 上一条:
    python绘制双柱形图代码实例
    下一条:
    详解appium+python 启动一个app步骤
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客