1. Git三大工作区(工作区、暂存区和版本库)

  

  工作区(WORKING DIRECTORY): 直接编辑文件的地方,肉眼可见直接操作;

  暂存区(STAGIN AREA):数据(快照)暂时存放的地方;

  版本库(GIT DIRECTORT(RESPOSITORY)):存放已经提交的数据,push 的时候,就是把这个区的数据 push 到远程git仓库了。

  git add就是将工作区的修改缓存在暂存区,git commit就是将暂存区的数据快照提交到本地库

  这就是为什么 git commit 之前要先执行 git add 的原因,如果不先执行add,那么直接执行commit时不会把当前的修改内容提交到代码库中的。

2. Git 基本概念(实体、引用和索引)

实体:

  提交到 git 代码仓库中的所有文件,包括每个提交的说明信息,目录结构等都会转换成 git 实体

  所有实体均存在于.git/objects/目录中

  git中每一个实体以一个40字符长度的十六进制字符串来唯一标识

  git中包括4种类型的实体:

    1.blob-存储文件内容

    2.tree-存储目录结构和文件名

    3.commit-存储提交的作者、日期、说明等

    4.tag- 存储指向特定提交对象的引用

引用:

  Git 中,一个分支(branch)、远程分支(remote branch)或一个标签(tag)(也称为轻量标签)仅是指向一个实体的一个指针,这里的实体通常是一个commit实体。这些引用以文本文件的形式存储在目录 .git/refs/ 中符号引用(Symbolic References)Git 有一种特殊的引用,称为符号引用。它并不直接指向一个实体,而是指向另一个引用。举例说,.git/HEAD就是一个符号引用。它指向你正在工作的当前分支。

索引:  

  索引是一个暂存区,以二进制文件的形式存储为文件 .git/index 中当git add 一个文件,git 将该文件的信息添加到索引中当git commit时,git 仅提交索引文件中列出的文件到 git 本地仓库

实体、引用和索引之间的关系:

测试说明:

  1. 新建一个readme,txt并提交到本地库

git add readme.txt
git commit -m 'first commit'

  2. git log查看commit实体,可以看出对于的SHA1值为999976c43b0e684f1bf7af4bed1acd11b3afa636

  

  3. git cat-file目录查看该commit实体的内容, 可以看出该commit实体包含了提交的作者及邮箱等全局信息,除此之外还包括了一个tree实体, 该实体的SHA1值为bb527569763dcd71a5dcd4b9a4ba692f1ebb56c0

  

  4. 使用git ls-tree查看该tree实体, 发现tree实体中包含了一个blob实体, 该实体的的SHA1值为0cce6dff89d87d991136ad27e18c928eb65f5bb3

  

  5. 使用git cat-file -p XXX查看blob实体内容, 可以发现blob实体存储的就是readme.txt文件内容

  

  6. 此时我们查看.git/refs/heads/master文件内容,可以发现其刚好为commit实体的SHA1值,也就说明 master 为一个 引用 ,并且指向最后一个 commit 实体

  

  7. 在刚刚介绍中,我们知道了tag实体存储了指向指定commit实体的引用,下面来创建一个标签"version1.1", 通过git rev-parse tagname来查看tag实体的SHA1值,再通过git cat-file -p XXXX可以发现该tag内部即为commit实体,且该commit实体为最后一次提交的实体

  

  8. 至此我们生成了四个实体,分别为

    999976c43b0e684f1bf7af4bed1acd11b3afa636  ----commit实体

    bb527569763dcd71a5dcd4b9a4ba692f1ebb56c0   ---tree实体

    0cce6dff89d87d991136ad27e18c928eb65f5bb3   ---blob实体 

    50e5866a324c6e2afaf6374c39b4b93d394b504a  --tag实体

  8. 查看各实体、引用、索引的储存位置

    实体(.git/objects/):以SHA1头两位作为文件名

    

    引用(.git/refs): heads下存储历史commit实体, tags下存储每一个标签

    

    索引(.git/index):

    

    通过git ls-files --stage查看.git/index文件内容,可以发现并非存储着最新commit实体的SHA1值而是其commit实体关联的blob实体SHA1值

    

    再次测试.git/index中文件内容, 我们新建一个文件index并提交到本地库

    

    

3. Git SHA1

  git 为每一个实体生成一个160位的散列值,通常使用40个字符长度的16进制字符串表示

散列碰撞:

  几乎不会出现散列碰撞情况(相同SHA1,出现冲突)

  通常情况下你不需要担心该散列值会产生碰撞,对于 160 位数,你有 2160 或者大约 1048 种可能的 SHA1 散列值。这个数有多么巨大,你可以简单感受下,即使你雇一万亿人来每秒产生一万亿个新的唯一 blob 对象,持续一万亿年,你也只有 1043 个 blob 对象,所以你基本不用担心该散列值会产生碰撞,而且只有当不同的内容产生了相同的 SHA1 散列值才能称为碰撞。

git 基于内容的 SHA1:

  对应相同的内容得到的永远是相同的 SHA1

  之前已经提到过 git 会为每个实体生成一个唯一的 SHA1 值来标识该实体,并且 git 会将生成的实体以二进制文件的形式保存在 .git/objets 目录下,但是 git 在生成 SHA1 时并不是简单地基于文件名、文件路径、创建者及创建时间组合起来,相反 git 是基于内容来生成 SHA1,试想一下,如果我们项目中有一个 a.txt 文件,分别存放在 dir1,dir2 目录下,这时候 git 并不会为 dir1/a.txt 和 dir2/a.txt 文件创建两个 blob 实体,因为 a.txt 虽然在两个目录下,但是他们的内容是完全一样的,所以 git 在生成实体时,通过散列算法,git 会发现这两个文件得出的 SHA1 值是完全一样的,所以 git 只会保存一个 blob 实体。这样可以避免当我们再重命名文件,或者移动文件所在目录时,生成重复的 blob 实体,这也得益于 git 基于内容的散列算法可以很好地发现这两个文件其实是同一个文件。

测试:

  

4. git 特殊符号引用介绍

git 自动维护了几个用于特定目的的特殊符号引用。这些引用可以在使用提交的任何地方使用。

  • HEAD 始终指向当前分支最终提交。当切换分支时 HEAD 会更新为指向新分支的最新提交。
  • ORIG_HEAD 某些操作,例如 merage / reset 会把 merge 之前的 HEAD 保存到 ORIG_HEAD 中,以便在 merge 之后可以使用 ORIG_HEAD 来回滚到合并之前的状态(在分支合并的时候,产生了冲突,如果已经修改了冲突,并产生了新的提交,但是冲突解决的有问题,想要还原之前的状态重新合并,这时可以使用 git reset --hard ORIG_HEAD 来还原到合并之前的状态)。
  • FETCH_HEAD 当使用命令 git fetch 抓取远程仓库更新时,FETCH_HEAD 保存着最近抓取的分支的 HEAD。
  • MERGE_HEAD 当一个合并正在进行时,其他分支的头暂时记录在 MERGE_HEAD 中,换言之, MERGE_HEAD 是正在合并进 HEAD 的提交。

Git基本介绍(三大分区及核心内部构造)的更多相关文章

  1. git使用介绍

    Git简单介绍 参考网址: git使用简介 这个教程推荐使用:git教程 git和svn的差异 git和svn的最大差异在于git是分布式的管理方式而svn是集中式的管理方式.如果不习惯用代码管理工具 ...

  2. SourceTree 01 - git 客户端介绍

    SourceTree - git客户端介绍 SourceTree系列第1篇 --->> SourceTree 01 - git 客户端介绍(http://www.cnblogs.com/g ...

  3. 1、git基础介绍及远程/本地仓库、分支

    1. Git基础介绍 基于Git进行开发时,首先需要将远程仓库代码clone到本地,即为本地仓库.后续大部分时间都是基于本地仓库上的分支进行编码,最后将本地仓库的代码合入远程仓库. 1.1. 远程仓库 ...

  4. git基础介绍

    git基础介绍 这是git操作的基础篇,是以前的写的操作文档,就没有进行手打,直接把图片贴进来了,你们担待哈,有不正确的地方可以指正出来,我将在第一时间去修改,多谢哈! 一.文件状态:git系统的文件 ...

  5. GitHub的SSH key配置以及常用的git命令介绍

    一. GitHub的SSH key配置 (以windows为例,Mac iOS系统类似) SSH Key 是一种方法来确定受信任的计算机,从而实现免密码登录.Git是分布式的代码管理工具,远程的代码管 ...

  6. 长连接锁服务优化实践 C10K问题 nodejs的内部构造 limits.conf文件修改 sysctl.conf文件修改

    小结: 1. 当文件句柄数目超过 10 之后,epoll 性能将优于 select 和 poll:当文件句柄数目达到 10K 的时候,epoll 已经超过 select 和 poll 两个数量级. 2 ...

  7. MONGODB的内部构造 FROM 《MONGODB THE DEFINITIVE GUIDE》

    今天下载了<MongoDB The Definitive Guide>电子版,浏览了里面的内容,还是挺丰富的.是官网文档实际应用方面的一个补充.和官方文档类似,介绍MongoDB的内部原理 ...

  8. c# 委托内部构造

    以下纯属个人简介,错误之处,请随意指出. 委托是指向方法的,而事件是委托的触发器,执行事件,就会遍历委托里的方法,并且执行. 委托内部构造第一块是方法指针(methodPtr),用于指向方法的内存地址 ...

  9. C++第三十三篇 -- 研究一下Windows驱动开发(一)内部构造介绍

    因为工作原因,需要做一些与网卡有关的测试,其中涉及到了驱动这一块的知识,虽然程序可以运行,但是不搞清楚,心里总是不安,觉得没理解清楚.因此想看一下驱动开发.查了很多资料,看到有人推荐Windows驱动 ...

随机推荐

  1. k8s与监控--k8s部署grafana6.0

    原文参考:https://segmentfault.com/a/1190000018335241

  2. Java自学-控制流程 for

    Java的for循环 for循环,和while一样,只是表达方式不一样 示例 1 : for 比较for和while public class HelloWorld { public static v ...

  3. Mac android studio真机调试步骤

    Mac android studio真机调试步骤 这些步骤是在百度中查找的,当时记录下来了,过了个把月了,今天写出来,我也重温步骤. 1.找到android的SDK路径,一般是 /user/你的电脑名 ...

  4. php xml解析

    XML处理是开发过程中经常遇到的,PHP对其也有很丰富的支持,本文只是对其中某几种解析技术做简要说明,包括:Xml parser, SimpleXML, XMLReader, DOMDocument. ...

  5. JavaWeb 之 Listener:监听器

    一.概述 1.事件监听机制 事件:        一件事情 事件源:    事件发生的地方 监听器:    一个对象 注册监听: 将事件.事件源.监听器绑定在一起. 2.监听器概念 当事件源上发生某个 ...

  6. C# DataTable 和List之间相互转换的方法(转载)

    来源:https://www.cnblogs.com/shiyh/p/7478241.html 一.List<T>/IEnumerable转换到DataTable/DataView 方法一 ...

  7. day 02 作业 预科

    目录 作业 作业 ==1.什么是编程== 通过使用编程语言做一些事情,表达一些自己的想法. ==2.简述计算机五大组成.== 计算机由cpu ,运算器 ,控制器,存储器(外存,内存) 输入设备 输出设 ...

  8. 【转】高性能网络编程7--tcp连接的内存使用

    当服务器的并发TCP连接数以十万计时,我们就会对一个TCP连接在操作系统内核上消耗的内存多少感兴趣.socket编程方法提供了SO_SNDBUF.SO_RCVBUF这样的接口来设置连接的读写缓存,li ...

  9. 面向切面编程AOP——加锁、cache、logging、trace、同步等这些较通用的操作,如果都写一个类,则每个用到这些功能的类使用多继承非常难看,AOP就是解决这个问题的,python AOP就是装饰器

    面向切面编程(AOP)是一种编程思想,与OOP并不矛盾,只是它们的关注点相同.面向对象的目的在于抽象和管理,而面向切面的目的在于解耦和复用. 举两个大家都接触过的AOP的例子: 1)java中myba ...

  10. python测试开发django-rest-framework-64.序列化(serializers.Serializer)

    前言 REST framework中的serializers与Django的Form和ModelForm类非常像.我们提供了一个Serializer类,它为你提供了强大的通用方法来控制响应的输出, 以 ...