任务要求

统计指定时间内,指定git地址与svn地址上的所有人员的代码行变更情况。

解决方案

最初为根据数据库中存储的所有git与svn地址来统计所有人员的提交代码行。之后由于库中存储的地址不全,改为通过gitlab api,找到上面的所有仓库,之后统计代码行。svn由于数据库中地址存储较全,所以还是从库中获取地址。

实际流程

git代码行统计:

任意一个git的ip地址内会包含很多仓库地址,每次调用api最多只能查出100条地址,需要设置起始查询的页数。

所以先调用api查询出来一共有多少页(需要传入每次每页展示多少条数据)

curl --head --header 'PRIVATE-TOKEN:Token秘钥' 'gitlab仓库ip地址/api/v4/projects?per_page=100'

之后for循环每页,查询出该ip地址下所有的仓库地址。

这是查询某一页的地址的命令,返回的是json结果。

curl --header 'PRIVATE-TOKEN:Token秘钥' 'gitlab仓库ip地址/api/v4/projects?page=起始页数&per_page=查询条数'

拿到仓库地址后,需要先将仓库clone下来。然后查询该仓库的所有分支,并循环切换每一个分支。

1、先查询出在指定时间节点上的所有提交人

git log  --format='%cn' --since="${start_time}" --until="${end_time}"

2、对人名去重后遍历每一个提交人,

然后查询出该人员在指定时间段内的所有提交hash码(每一次提交都会生成一个唯一的hash码)

git log --format='%H' --committer="${name}" --since="${start_time}" --until="${end_time}"

3、此时需要注意一点:如果我们以某一个分支为基础重新拉一个分支,那么旧分支的提交历史也被拉到新分支上,统计的时候就会造成重复统计(某一个人只提交了一次,但这次的提交历史会出现在多个分支上),但相同提交的hash值却不会重复。

所以我们在查出“某个git地址的某个分支里的某次提交的hash值”后,需要将这条暂存起来,当统计该git地址的其他分支的时候,如果还出现这个提交hash值时,就不要统计了。

4、在确定该此hash值没有重复后,根据该hash值查询出这次的提交详情

git show ${chash}

根据详情里面的+、-符号可以统计出增减的代码行,更具体的也能编写正则区分有效代码行、空行与注释行。

到此时我们已经有了 在某个时间段内 某个git地址的某个分支的某个人的某次提交的代码变更行数详情。

svn代码行统计:

svn的提交历史的统计与git有所不同。

svn不需要将仓库下载到本地,可以远程查看某一仓库地址的所有log日志。

svn的查看历史代码行详情为两个步骤:

一:可以通过命令

svn log -v -r {"$start_time"}:{"$end_time"} ${now_url}

查询出某个时间段内某个仓库地址的所有变更文件的路径,其中还包括了提交人和“变更的版本号”,但是看不到具体某文件的变更详情。

二:可以通过命令

svn diff -c ${rversion} ${fileurl}

查询出具体某变更文件(包括路径)的某个版本的变更详情。

所以第一步显示查询出所有变更文件路径,然后再对具体文件的具体版本进行变更详情的查询。

此处我采用的统计方法有些不稳,我是遍历每一行,根据每一行的内容,来进行统计。

1、如果当前行为"------------------------------------------------------------------------"

则表示下一行该显示用户名和版本号了,然后下一行遍历是就正则出这两个信息。

2、如果当前行为"Changed paths:"

则表示下一行该正则出文件路径了

此处需要对文件路径进行进一步排查,因为还存在很多:如图片文件等无法或不需要统计代码行的文件被提交的情况,这些文件就不需要进一步查看他们的内容变更详情。

3、如果文件格式正确,则可以通过命令查询出该版本下此文件的变更详情,然后进行统计。

依然可通过每行第一位的+-符号来判断具体行的变更情况。

后续的一些处理操作:

每次统计出结果后,可以将所有的统计参数传给其他脚本文件,最终将这次的统计结果传入数据库。

记-统计svn与git的log日志中的代码行变更的更多相关文章

  1. 删除log日志中包含某个字符的行

    sed -i '/{Str}/d' abc.txt 假如你的log日志中某行有sleep字符,直接输入命令: sed -i '/sleep/d' log.log 如果删除的是一个变量的值,假如是var ...

  2. 数据库 alert.log 日志中出现 "[Oracle][ODBC SQL Server Wire Protocol driver][SQL Server] 'RECOVER'"报错信息

    现象描述: (1).数据库通过调用透明网络实现分布式事务,但透明网关停用后,失败的分布式事务并未清理. (2).数据库 alert 日志 Thu Sep 06 06:53:00 2018 Errors ...

  3. rest-assured 将log()中的信息打印到log日志中去的方法

    rest-assured 将log()中的信息打印到log日志中去的方法: ============方法1============== PrintStream fileOutPutStream = n ...

  4. 使用 Git 来管理 Xcode 中的代码片段

    使用 Git 来管理 Xcode 中的代码片段 代码片段介绍 xcode4 引入了一个新 feature: code snippets,在整个界面的右下角,可以通过快捷键:cmd + ctrl + o ...

  5. git从远程仓库中更新代码到本地仓库

    git从远程仓库中更新代码到本地仓库 有时候在使用git pull的时候,会莫名才报错.查了很多资料,尝试过git的很多命令.包括git fetch命令,都会报同样的错.最后终于发现了一条捷径,由网友 ...

  6. log日志中不打印异常栈的具体信息

    问题与分析 最近在查项目的log时发现报了大量的NPE(NullPointerException),诡异的是只log了Exception的类名,却没有具体的堆栈信息,以致于无法对该NPE异常进行准确定 ...

  7. 使用vs的查找功能,简单大概的统计vs中的代码行数

    VS强大的查找功能,可以使用正则表达式来进行查找,这里统计代码行数的原理就是: 在所有指定文件中进行搜索,统计匹配的文本行数. 但是匹配的行需要满足:非注释.非空等特殊非代码行. 使用Ctrl+Shi ...

  8. mycat的wrapper.log日志中发现主从切换报错

    可能是MySQL在某些情况下重启(密切关注重启现象,关注日志,找出原因),导致mycat切换主从.由于设置了单向主从,mycat将从库切换为主库,原来的主库宕机.后来重新更新dnindex.conf之 ...

  9. Php 中如何将内容写入log日志中

    $Str = '你想要存的内容'; file_put_contents('abc.log', "\r\n\r\n". $Str, FILE_APPEND);     FILE_AP ...

随机推荐

  1. Linux 我的常用命令记录

    Linux下复制粘贴快捷键 1. 在终端下: 复制命令:Ctrl + Shift + C  组合键. 粘贴命令:Ctrl + Shift + V  组合键. 2. 在控制台下: 复制命令:Ctrl + ...

  2. Oracle基础知识点——Oracle服务端和客户端

    Oracle服务端 服务端提供oracle服务的实例,其是数据库的核心,用于数据库的管理,对象的管理与存储.数据的存储.查询.数据库资源的监控.监听等一些服务. 例子:比如一台机子上安装了Oracle ...

  3. Bigger-Mai 养成计划,subprocess模块

    subprocess模块是python从2.4版本开始引入的模块.主要用来取代 一些旧的模块方法,如os.system.os.spawn*.os.popen*.commands.*等.subproce ...

  4. 不错的anroid源码在线浏览网站【学习笔记】

    不错的anroid源码在线浏览网站:http://androidxref.com/

  5. Python游戏编程入门4

    Math和Graphics:Analog Clock示例程序本章介绍Python的math模块,该模块可以执行计算,如常见的三角正弦函数.余弦函数.正切函数等. 使用正弦和余弦函数绘制圆创建Anlog ...

  6. java 随机出题四则运算

    作业要求来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/2186 我的github地址:https://github.com/k ...

  7. Javascript 中的数据类型判断

    (迁移自旧博客2017 09 25) typeof 我们常使用typeof来判断数据类型,在常规场景中足以应付数据类型判断的需要: var obj = { name: 'zhangxiang' }; ...

  8. web前端面试题 -- 2019最新,最全

    最近在找工作,面试了好多家公司,结果都不怎么理想.要么公司环境氛围不行,要么工资达不到理想的薪资.大部分公司对程序员的面试流程几乎都一样,来了先填一份登记表,写一套面试题,然后技术面,人事面.至于有的 ...

  9. 【python3】 函数 装饰器

    第一步 : 了解装饰器 装饰器模式,重点在于装饰,装饰的核心仍是被装饰的对象. 举一个栗子:我今天穿了一件短袖,但是突然一阵风,短袖没办法为我御寒,我想到的办法是将短袖变得更厚更长,但是改造之后,它就 ...

  10. CocoaPods 中删除不需要的第三方

    1...打开Podfile  找到不需要的类库,直接删除 2...打开终端cd到当前项目的根目录下重新执行pod install --verbose --no-repo-update命令(更新一下) ...