- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我最近发现了工具 git cat-file
并且一直在使用它。我知道 git 使用 blob 来存储实际内容。但是,为什么每次我 git add
对文件进行更改时,它似乎都会创建一个新的 blob,而不是编辑现有的 blob,或者创建一个新的 blob 并删除旧的?
例如
touch hello.txt
// change hello.txt to contains 'hello'
git add hello.txt // creates a blob abc123 containing: 'hello'
// change hello.txt to 'hello world'
git add hello.txt // creates a blob cba321 containing: 'hello world'
git commit // creates a commit with tree pointing at blob cba321
所以包含我的中间阶段更改的 blob 的目的,即包含“hello”的 blob abc123 并不明显。
就提交而言,hello.txt
从“”直接变成了“hello world”,如果不在 git blob 中挖掘,我什至无法取回我的中间更改 abc123。
最佳答案
But why does it seem to create a new blob every time I git add a change to a file, i.e. as opposed to editing the existing blob, or making a new blob and deleting the old one?
任何 blob 都无法更改。这与关于提交的规则相同:任何提交都不能更改。
原因是每个 Git 对象(blob 和提交是四种内部 Git 对象中的两种)的哈希 ID 只是存储为该对象的内容的加密校验和。对于文件(“blob”),实际内容是五个 ASCII 字符 b
、l
、o
、 b
,space,然后是十进制化的 blob 的大小,也存储在 ASCII 中,然后是一个 ASCII NUL 字节,然后是存储的数据。例如,hello
存储为 Python 可能表示为 b"blob 5\0hello"
。
(您可以使用 SHA1 哈希器或使用 git hash-object
计算此哈希值:
$ echo -n hello | git hash-object --stdin
b6fc4c620b67d95f953a5c1c1230aaab5db5a1b0
或:
$ python3
[snip]
>>> import hashlib
>>> hashlib.sha1(b"blob 5\0hello").hexdigest()
'b6fc4c620b67d95f953a5c1c1230aaab5db5a1b0'
因此,任何具有哈希 ID b6fc4c620b67d95f953a5c1c1230aaab5db5a1b0
的 blob 都必然是文件 hello
,否则——如果不是——你不能存储包含 hello
(没有换行符)在此 Git 存储库中。为某个文件找到一个分身(一个阻止存储其他文件的邪恶双胞胎)是不平凡的:参见 How does the newly found SHA-1 collision affect Git?了解详情。
因此,当您
git add
一个文件时,Git 会创建一个新的 blob,或者重新使用现有的 blob,这取决于该文件的数据是否已经作为一个文件存在存储库中的 blob。如果您随后 git commit
,Git 会永久保存内容,并与新的提交对象相关联。如果您从未提交该 blob 并且也没有其他提交或其他实体引用它,Git 最终会通过其垃圾收集过程使该 blob 过期(请参阅 git gc
)。
(请注意,这些 Git 对象也是 zlib 压缩的,并且是所有四种 Git 对象类型的倒数第二个存储形式。但是,一段时间后,现有对象可能会被打包成一个 pack 文件,它们在 zlib-deflated 之前针对其他对象进行增量压缩。pack 文件是最终的存储形式。打包的对象可以在必要时解包,但在正常操作中 Git 只会提取解压缩的对象 扩展增量压缩时从打包文件中即时获取数据。)
(为了完整起见,其他两种 Git 对象类型是树 和带注释的标签。树对象存储文件名称,映射自名称到 blob 哈希 ID,以及文件的可执行位。提交对象通过哈希 ID 引用代表快照的树。带注释的标签对象是一种特殊情况的数据结构,它包含另一个 Git 对象的哈希 ID,加上数据负载;在这个数据负载中,您可以存储 GPG 签名或其他数字签名,以及您喜欢的任何其他内容。然后您可以将轻量级标签指向带注释的标签对象,以获取带注释的标签。)
关于git - 为什么 git 在 'git add' 命令之间生成新的 blob?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55424103/
我时不时地输入“git”,然后想到别的东西,然后输入例如“git checkout master”。当然,这给我留下了 $ git git checkout master git: 'git' is
我做到了 git 克隆 git://foo.git 光盘富 ...编辑文件.. 现在我想重新开始。我不在乎我已经做出的任何改变,但我不想再次克隆整个巨型 foo.git,只是丢失我所有的更改。我怎
我在我的电脑上开发代码,我的计算节点很少。 为了让我的程序保持同步,我决定使用 git。以前,我以一种单向模式使用它来“下推”从 PC 到计算节点的更改。但是时不时遇到计算节点特有的小bug,现场修复
虽然它似乎什么也没做,但它没有给出任何警告或错误消息。有什么想法吗? 最佳答案 来自 Git 源的注释: /* * Read a directory tree. We currently ignor
我知道如何为这样的 HTTPS 请求提供用户名和密码: git clone https://username:password@remote 但我想知道如何像这样向 Remote 提供用户名和密码:
Git GUI、Git Bash 和 Git CMD 之间有什么区别?我是初学者,为了进行安装,我发现自己通常同时使用 git bash 和 git CMD 最佳答案 Git CMD 就像使用 git
有人能告诉我git中文件索引被删除是什么意思吗?这些文件在我的 VS Code 中标记为红色,但我仍然可以修改文件并将更改推送到将反射(reflect)这些更改的远程存储库。我认为这一切都是在我使用命
我通过 git 子树将 GLFV 库添加到项目中,但出现此警告“看起来您的 git 安装或您的 git-subtree 安装已损坏”。还描述了几个原因,为什么这可能是: 如 git --exec-pa
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我一直在阅读一篇文章,作者在其中指示:在现有存储库中创建一个新存储库,并想知道这是否是他忽略的错误。稍后我会与他核实。 这些是我要检查的条件: 将现有目录制作成仓库的条件,并且已经 checkin 主
我确实在不同的计算机上处理相同的项目,我想知道是否有一种方法可以跟踪该 .git 文件夹,这样我就不必在所有本地文件中重新配置配置文件。 我将所有工作推送到 bitbucket。 最佳答案 不,没
这个问题在这里已经有了答案: How does git store files? (3 个答案) 关闭 9 年前。 我为我的许多项目创建了一个远程存储库,所以它是我的push 的目的地。与 git
应该如何在 git 中查看文件内容的完整历史记录? 一个文件在 git 中的历史很短,存储库通过 git-svn 同步,但在 svn 中的历史很长。 git 中的历史记录到达文件移动的位置。要查看历史
我是confused here ... 如何对修改后的文件进行git commit,以及如何对新文件进行git commit? 还有,你如何在git中单独提交文件? 最佳答案 git 提交过程分为两个
正在搜索 throw SO 来寻找答案。遇到这个似乎没有给出任何答案的旧线程。重新触发此线程,希望有人知道! 有人能告诉我 git subtree 和 git filter-branch 的区别吗?为
我想知道是否有一种方法可以避免在每个 Git 命令的开头键入单词 git。 如果有一种方法可以在打开命令提示符进入 “Git 模式” 后只使用一次 git 命令就好了。 例如: git> 之后,我们键
当您修改工作目录中的文件时,git 会告诉您使用“git add”暂存。 当您向工作目录添加新文件时,git 会告诉您使用“git add”开始跟踪。 我对这两个概念有点困惑,因为我假设跟踪文件的更改
为什么 git://有效 $ git clone git://github.com/schacon/grit.git Cloning into 'grit'... ... Checking conne
我在以下沙箱中练习 git:https://learngitbranching.js.org/?NODEMO 我在两个单独的 session 中运行了两组命令。第一组命令顺序如下: git clone
我是一名优秀的程序员,十分优秀!