如果你是研发效能组的一员或者在从事 CI/CD 或 DevOps,除了提供基础设施,指标和数据是也是一个很重要的一环,比如需要分析下某个 Git 仓库代码提交情况:

  • 该仓库的代码谁提交的代码最多
  • 该仓库的活跃度是什么样子的
  • 各个时段的提交分析数据
  • 每个版本的贡献排名情况
  • 每周/每月/每年的贡献排名等等

几天前发现一个 Git 历史统计信息生成工具叫 GitStats (http://gitstats.sourceforge.net/)

这是一个用 python 写的,代码量很少,功能却非常强大的分析工具,也是我目前发现为数不多的可以生成漂亮的报告并且使用很方便的开源项目。

一、如何使用

安装依赖:Git,Python,Gnuplot。

如果有 Linux,推荐在 Linux 上下载和安装。我曾尝试用 Windows 来准备环境,要下载 Python2,配置 Cygwin,还要手动配置 Gnuplot (Gnuplot 是一个可移植的命令行驱动的图形工具),挺麻烦的。以下是我在 Linux 上来的安装和使用步骤。


  1. # 下载 Python 2
  2. sudo yum -y install python27
  3. # 安装 Gnuplot
  4. sudo yum -y install gnuplot
  5. # 下载 gitstats
  6. # 如果下面项目地址失效,可使用这个 https://gitee.com/jeffreyu/gitstats.git
  7. git clone https://github.com/hoxu/gitstats.git
  8. # 下载你要分析的代码仓库
  9. git clone https://github.com/alibaba/fastjson.git
  10. # 执行命令,生产报告
  11. cd gitstats
  12. ./gitstats ./fastjson ../html/fastjson
  13. # 经过 15 秒钟的执行,生成报告
  14. Generating report...
  15. [0.00393] >> git --git-dir=/workspace/gitstats/.git --work-tree=/workspace/gitstats rev-parse --short HEAD
  16. [0.00236] >> git --version
  17. [0.00716] >> gnuplot --version
  18. Generating graphs...
  19. [0.01676] >> gnuplot "/workspace/html/fastjson/day_of_week.plot"
  20. [0.01571] >> gnuplot "/workspace/html/fastjson/files_by_date.plot"
  21. [0.01281] >> gnuplot "/workspace/html/fastjson/month_of_year.plot"
  22. [0.09293] >> gnuplot "/workspace/html/fastjson/lines_of_code_by_author.plot"
  23. [0.01340] >> gnuplot "/workspace/html/fastjson/commits_by_year.plot"
  24. [0.01799] >> gnuplot "/workspace/html/fastjson/hour_of_day.plot"
  25. [0.01627] >> gnuplot "/workspace/html/fastjson/domains.plot"
  26. [0.01268] >> gnuplot "/workspace/html/fastjson/commits_by_year_month.plot"
  27. [0.09435] >> gnuplot "/workspace/html/fastjson/commits_by_author.plot"
  28. [0.01522] >> gnuplot "/workspace/html/fastjson/lines_of_code.plot"
  29. Execution time 15.16208 secs, 4.58247 secs (30.22 %) in external commands)
  30. You may now run:

二、如何访问

1、我产生的报告位置是在linux下

 2、我是通过nginx转发的

3、访问地址是

http://你的域名/fastjsonView/index.html

4、这里遇到一个问题,访问后nginx 报403

解决办法是nginx.conf配置文件,第一行去掉注释改成root;

改完重新加载配置即可。

三、报告分析

1、常规统计

可以看到这个项目叫 fastjson,从 2011 年 7 月 31 日开始提交第一次代码,距离当前已经 3060 天了,893 个活跃天。总共文件是 2960 个,一共的代码行数是 25 万行。

活跃度

每天中的每小时的、每周中的每天、每周中的每小时,每年中的每月的、每年的提交数量。

在过去的 32 周里,其中前 12 周到 17 周这段时间很活跃,提交很多。另外可以看到在白天 12 点到 20 点这段时间提交很少,大部分程序员在这段时间都在应对公司里的工作,无法贡献开源项目。

晚上 20 点之后提交开始增多,看来是一个非常努力的开发者。另外可以看到周一到周日都有提交,周六相对最少,应该是周六休息和放松一下。周日提交明显比周六多,看来还是花费了不少的个人宝贵周末时间。

还能看到该项目主要完成时间在 2016 年到 2017 年,完成的时区是在东八区,这个维度可对不同区域的开发者贡献数量进行分析。

2、贡献者

列举了所有的作者,提交数,第一次提交及最近一次提交。

这张图也是可以看到谁是该项目的创建者,以及这几年以来每年的谁的贡献最大。还有可以看到提交者所用的邮箱账户。

3、文件及行数

文件总数是 2960 个,代码行数是 25 万行。

另外还可以看到每年的文件增加趋势图以及这些文件类型数量的排名,可以看到 java 文件占了 96.08%,其次是 json。

4、Tags

Tags 对于团队是一个很重要分析指标(前提是所要分析的仓库在版本发布后创建了 Tag)可以看到每个版本的贡献度排名。

最后

  1. 如果感兴趣可以分析一下自己的项目或是去 GitHub 上找一个有意思、有影响力的项目拿来分析一下,比如 996.ICU 以及 vue 等。
  2. 为方便团队成员访问,建议创建一个自动化任务,可以用Jenkins来定期执行获取最新的 Git 历史记录,然后讲生成的 html 放到一个 Tomcat 服务上,这样所有的团队成员就都可以访问了。

GitStats - 统计Git所有提交记录工具的更多相关文章

  1. 规范git commit提交记录和版本发布记录

    在开发过程中我们一般都会用到git管理代码,在git commit提交代码时我们一般对git commit message随便写点简单的描述,可是随着项目参与人数的增多,发现提交的commit记录越来 ...

  2. git 跟踪提交记录

    一.克隆git仓库 git clone ssh://hwl@xxx/home/data/repositories/git.git 二.申明使用人信息,以便跟踪提交记录 $ git config --g ...

  3. git 查看提交记录

    查看提交的内容 -p 选项,同时在 - 后加数字限制一下数目 git log -p -2. commit 500eeadd71a21f1166803e12a792bfa86f4ca784 (HEAD ...

  4. Jenkins 获取 Git 的提交记录(Change Log)

    工作中用 Jenkins 做 iOS 和 Android 的持续集成,之前实现的是当 git 有新代码提交的时候,就会自动编译并上传安装包到蒲公英,然后自动发送QQ群通知或者讨论组通知给相关小伙伴,方 ...

  5. 统计git代码提交量

    以下是我写的一个脚本,可以统计在某个项目中,自己修改代码的行数,包括增加多少行,删除多少行. 可以统计当天,24小时内或全部时间内.使用时需要把代码中的author对应的值换成自己的名字. 代码如下: ...

  6. Git 删除提交记录

    .Checkout git checkout --orphan latest_branch 2. Add all the files git add -A 3. Commit the changes ...

  7. 使用gitstats分析git 仓库代码

    gitstats 是一个很不错的git 代码提交分析工具,可以帮助我们生成图表统计结果 工具文档信息 gitstats http://gitstats.sourceforge.net/ 安装 使用ce ...

  8. git log 查看提交记录

    git log 查看提交记录 1. git log 查看提交历史记录2. git log --oneline 或者 git log --pretty=oneline 以精简模式显示3. git log ...

  9. git log 查看指定文件的提交记录

    使用git log除了可以看整个仓库的提交记录外,还可以指定某个文件的提交记录. 1. 查看指定文件的历史提交记录 命令: git log -- <file> 说明:只需要指定文件名称. ...

随机推荐

  1. C# 操作ie网页,注入JavaScript等操作

    之前做过一个录制鼠标键盘并回放的功能,使用的关键技术是钩子程序.在实现针对指定页面进行录制的过程中,发现C#操作网页的功能. https://www.cnblogs.com/wangchuang/ar ...

  2. Mybatis 的一级、二级缓存?

    1)一级缓存: 基于 PerpetualCache 的 HashMap 本地缓存,其存储作用域为 Session,当 Session flush 或 close 之后,该 Session 中的所有 C ...

  3. jQuery--筛选【串联函数】

    串联函数简介 A.add(B) 将A和B组合成一个对象 A.children().andSelf() 将之前的对象添加到操作集合中 A.children().children().end() 回到最近 ...

  4. 什么是 Redis?

    Redis 是完全开源免费的,遵守 BSD 协议,是一个高性能的 key-value 数据库. Redis 与其他 key - value 缓存产品有以下三个特点: Redis 支持数据的持久化,可以 ...

  5. spring-boot 注解集合

    @Configuration 用于定义配置类,可替换XML配置文件,被注解的类内部包含一个或多个@Bean注解方法.可以被AnnotationConfigApplicationContext或者Ann ...

  6. 学习SVN02

    代码发布方案: 1,安装,优化 软件环境,(nginx,lvs)  <-------运维工程师 2,程序代码(不断更新).   <--------开发工程师,(开发,运维都可以发布) 3, ...

  7. C++ - main()和_tmain(int argc, _TCHAR* argv[]) 的详细区别

    一些程序中会发现主函数不是int main(),而是int _tmain(),而且头文件也不是<iostream>而是<stdafx.h>. 首先,这个_tmain()是为了支 ...

  8. Rust 中的数据布局--可选的数据布局

    Rust 允许你指定不同于默认的数据布局策略,并为你提供了不安全代码指南. repr(C) 这是最重要的"repr".它的意图相当简单:做 C 所做的事.字段的顺序.大小和对齐方式 ...

  9. 惯性传感器(IMU)

    近两年来,车联网.自动驾驶.无人驾驶.汽车智能化.网联化等成为了汽车行业的热点话题,未来汽车一定是朝着安全.可靠及舒适的方向发展.而这一切背后的发展都离不开传感器的作用,今天我们就来聊聊用途越来越广的 ...

  10. sudo rosdep init 出现 ERROR: cannot download default sources list from:错误解决方法

    关于安装ROS时出现的rosdep init错误 sudo rosdep init ERROR: cannot download default sources list from: https:// ...