前篇:
深入理解Git - 一切皆commit

如何从稍微底层一点的角度,从底层实现理解一切皆commit ?

配合希沃白板课件食用,效果更佳:
【希沃白板5】课件分享 : 《Git 进阶 - 从使用角度深入理解Git》
https://r302.cc/ke8XdO?platform=enpc&channel=copylink
点击链接直接预览课件

git 文件系统

git 本质上是一个基于键值对的文件系统。
文件系统,最重要的两个内容,当然就是 文件 和 文件夹 了。

blob object(数据对象)

git 中的 blob object 就是文件系统中的文件,包含 键:一个 hash 值和校验值的组合,值:文件内容。

比较特殊的是:blob object 只存内容,不存文件名,文件名在 tree object 中保存。

tree object (树对象)

相当于文件系统中的文件夹。

commit object(提交对象)

提交对象可以理解为对树对象的一层封装,里面包含了提交时间,提交作者等信息,更重要的,里面包含了父提交的ID,由此就可以形成 git 提交的有向无环图。


git 的这些对象的数据,保存在 .git/objects 目录下。

这里,我们并没有发现分支这些概念,回顾之前说的『一切皆 commit』的理解,分支这些,不过是某个 commit 的引用。(都是纸老虎)

案例

将 t/bugfix 分支重置到 a1b2c3 提交。

可以使用熟悉的 reset 命令: (@t/bugfix)git reset --hard a1b2c3,也可以用更底层的命令:git update-ref refs/head/t/bugfix a1b2c3

效果是一样的,当然,平时使用,只推荐前者,这里只是作为对“分支是某个commit的引用”这句话理解的一个案例。

标签对象

tag object(标签对象)

标签对象:指向一个特定对象的固定引用对象;
可以给 git 中的任意对象打标签;

标签对象不是引用(与分支名不同),是一种独立的git对象。但在使用上(针对提交的tag),体验一致。所以“一切皆commit”这句话,对标签而言,是不一定正确的,但实际使用中,一般只会给提交打标签。


所有的引用,都记录在 .git\refs 文件夹中。

压缩与增量存储

在没有压缩时,称 git 的存储模式为松散的对象模式,即一个文件的不同版本,都是保存其全部的数据。在 git gc 时,会压缩并实现增量存储。这个命令在执行 pull 等命令时自动触发。

为什么 git 彻底删除大文件要修改整个历史?

因为提交的不可变性,如图,如果 newfile 是个大文件,即使删除,在提交历史中依然存在。要彻底删除,就要重写 second 提交以及之后的每一个提交,因为之后的提交都有 tree 指向这个大文件,即使删除,提交的父提交也需要变化。

  1. 彻底清除 newfile 之后,second 提交将无效,需要生成一个新提交,second' ;
  2. three 提交的 tree 引用中,也需要删除 new.cs 的引用,同时修改父提交为 second' ,生成新提交为 three' ;
  3. 对于 forth 提交,不用清理 tree 对象,但也需要将父提交修改为 three',得到新的提交 forth' ;
  4. 以此类推,后面的每一个提交都需要修改;

勘误:这里的 three,应该是 third 。图片中也写错了,就懒得改了。


原文连接:https://www.cnblogs.com/jasongrass/p/10582465.html

END

深入理解Git - Git底层对象的更多相关文章

  1. [转]深入理解学习GIT工作流

    深入理解学习Git工作流 字数13437 阅读2761 评论3 喜欢70 个人在学习git工作流的过程中,从原有的 SVN 模式很难完全理解git的协作模式,直到有一天我看到了下面的文章,好多遗留在心 ...

  2. 深入理解学习Git工作流(转)

    个人在学习git工作流的过程中,从原有的 SVN 模式很难完全理解git的协作模式,直到有一天我看到了下面的文章,好多遗留在心中的困惑迎刃而解,于是我将这部分资料进行整理放到了github上,欢迎st ...

  3. 深入理解学习Git工作流(git-workflow-tutorial)

    转载:https://segmentfault.com/a/1190000002918123#articleHeader11 人在学习git工作流的过程中,从原有的 SVN 模式很难完全理解git的协 ...

  4. [git] git 的基本认知

    版本管理 ( Version Control ) 版本管理系统是一个记录文件变更的系统,让你在一段时间后可以恢复指定版本的文件.版本管理系统大致可分为三类:独立的本地版本管理系统.中心化版本管理系统. ...

  5. [git] git怎样fork一个repo

    描述 我定制了一下strongswan的工程.然后想把我自己的定制变成一个repo push到远端git.tong.com与大家分享. 这个时候,应该怎么做? 如果你用过github的话.那么你可以理 ...

  6. error setting certificate verify locations: CAfile: E:/git/Git/mingw64/ssl/certs/ca-bundle.crt

    一.问题: 当git clone项目时报 error setting certificate verify locations: CAfile: E:/git/Git/mingw64/ssl/cert ...

  7. [git]git 分支

    什么动作,关键看你想完成什么 1. 添加新的远程分支: git push origin current_local_branch:new_remote_branch 2. 删除远程分支(冒号前必须要有 ...

  8. 正确理解DTO、值对象和POCO

    今天推荐的文章比较技术化也比较简单,但是对于一些初学者而言,可能也是容易搞混的概念:就是如何理解DTO.值对象和POCO之间的区别. 所谓DTO就是数据传输对象(Data Transfer Objec ...

  9. Git -> Can't start Git: git.exe

    问题描述 导入别人的PyCharm项目后提示:Can't start Git:git.exe 解决办法 Git就是个类似插件,在Git的官网上注册个账号然后每次编译就会自动把程序上传到网上备份.可以方 ...

随机推荐

  1. Java中的容器类(List,Set,Map,Queue)

    Java中的容器类(List,Set,Map,Queue) 一.基本概念 Java容器类类库的用途是“保存对象”,并将其划分为两个不同的概念: 1)Collection.一个独立元素的序列,这些元素都 ...

  2. 【专题】计数问题(排列组合,容斥原理,Prufer序列)

    [容斥原理] 对于统计指定排列方案数的问题,一个方案是空间中的一个元素. 定义集合x是满足排列中第x个数的限定条件的方案集合,设排列长度为S,则一共S个集合. 容斥原理的本质是考虑[集合交 或 集合交 ...

  3. Java容器Set接口

    Set接口的实现,可以方便地将指定的类型以集合类型保存在一个变量中.Set是一个不包含重复元素的Collection,更确切地讲,Set 不包含满足 e1.equals(e2) 的元素对,并且最多包含 ...

  4. Java容器Map接口

    Map接口容器存放的是key-value对,由于Map是按key索引的,因此 key 是不可重复的,但 value 允许重复. 下面简单介绍一下Map接口的实现,包括HashMap,LinkedHas ...

  5. 一段鬼畜风格的JavaScript解密

    在CSDN上看到有人提问一段JS怎么解密,虽然已经是四年前的问题了,还是解一下. 原问题地址: 这段JS怎样解密? [问题点数:40分,结帖人seo2014] 这是楼主发出的原JS: /*ZlQEIn ...

  6. 正在载入中......loading页面的几种方法

    网页加载过程中提示“载入中…”,特别是使用动画效果,可以一个“等待”的温馨提示,用户体验很不错.下面介绍几种方法. 第一种: 原理就是,在网页载入时在页面最中间打入一个层上面显示,"网页正在 ...

  7. 2016.6.21——Add Binary

    Add Binary 本题收获: 对于相加而言,考虑进位以及进位之后的值为多少,全部进位完毕后进位还为1(11 + 11 = 110)需要添加一位.1.string中默认每个元素为char型 2.从i ...

  8. 一个diff工具,用于判断两个目录下所有的改动(比较新旧版本文件夹)

    需求: 编写一个diff工具,用于判断两个目录下所有的改动 详细介绍: 有A和B两个目录,目录所在位置及层级均不确定 需要以B为基准找出两个目录中所有有改动的文件(文件或内容增加.修改.删除),将有改 ...

  9. PATH变量重复

    命令: export PATH=$(echo $PATH | tr : "\n"| sort | uniq | tr "\n" :) Code: awk -F: ...

  10. JDK 6和JDK 7的intern方法之不同

    首先介绍下intern方法: 如果常量池中存在当前字符串, 就会直接返回当前字符串. 如果常量池中没有此字符串, 会将此字符串放入常量池中后, 再返回. 1 2 在<深入理解Java虚拟机> ...