- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
Git 允许使用如下命令检索提交的哈希值:
git rev-parse HEAD
给出 33b316c
或
git rev-parse --short HEAD
给出 33b316cbeeab3d69e79b9fb659414af4e7829a32
我知道实践中的长哈希永远不会发生冲突。
在实践中,短哈希的使用频率更高。我想知道短的碰撞的概率是多少? git 是否采取任何措施来克服可能的冲突(例如使用 git checkout
时)?
最佳答案
我在 book 中给出了一个公式— 参见第 78-79 页 — 但如果您正在寻找一个简单的,一些 散列冲突的概率在 n 位散列中达到大约 50% 的点是当您进行散列时大约 2n/2 键。 SHA-1 散列本身是 160 位,表示为 40 个十六进制数字,每个代表 160 位中的 4 个。将其截断为 7 个十六进制数字会留下 28 位,因此您将在大约 214 键或 16384 个对象处达到 50% 的碰撞几率。如果您将对象限制为仅提交,那是相当可观的提交数量,但 Git 将所有对象(提交、树、带注释的标记对象和 blob)放在一个散列索引的键值存储中。
任何给定键的散列值发生冲突的概率仅为 2n 中的 1,即 228 中的 1 或2.68 亿中的 1。随着 key 数量的增加,它迅速增加到 50% 的原因被称为生日悖论或 birthday problem。 . 50%当然太可怕了;使用 28 位,如果我们希望整体概率低于 0.1%,我们应该将对象的数量保持在大约 1230 以下。通过使用 32 位(8 个字符的缩写),我们将其加倍到大约 2460,但这仍然不是很多对象。
当你的存储中有 16k 个对象时,你可能应该使用至少 10 个十六进制数字,给出 240 可能的哈希值和大约 .99987794 的 p-bar 值... (大约 0.019% 的碰撞几率)。九个十六进制数字仅给出 236 哈希值,产生 .99804890 的 p-bar...或 0.19% 的碰撞几率,我认为这太高了。
如果您可以将模糊匹配代码限制为仅提交——或仅提交-ish,这在 Git 中意味着提交或带注释的标签——内置默认值有效很不错。 (Git 实际上会在很多情况下这样做。)但是 Git 用于计算“正确”缩写长度的内部代码,至少在我看来,也太无忧无虑了 "loosey-goosey" ,因为它在生成的哈希可能用于识别任何对象的上下文中使用 50% 碰撞概率平方根技巧。
(如评论中所述,内部 Git 始终使用完整的哈希值。它仅在非 Git/Git 界面,例如 git log <hash>
或 git show <hash>
面向用户的命令,你可以输入一个缩写的哈希值,或者要求一个缩写的输出哈希值。这里 Git 将默认使用 50% 的碰撞概率数字来计算要显示的字符数,从数据库中对象的估计数量开始. 如果你提供散列,你选择提供多少。如果你要求 Git 提供它,你仍然可以选择多少,用 --abbrev=<em>number</em>
。注意有一个绝对值最小值 4:git log abc
不会将 abc
视为哈希 ID,但 git log abcd
会将 abcd
视为缩写的哈希 ID。还有一个非常古老的默认值,即 7 个字符,来自 Git 1.7-美好的日子。)
关于Git哈希重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56012233/
我时不时地输入“git”,然后想到别的东西,然后输入例如“git checkout master”。当然,这给我留下了 $ git git checkout master git: 'git' is
我做到了 git 克隆 git://foo.git 光盘富 ...编辑文件.. 现在我想重新开始。我不在乎我已经做出的任何改变,但我不想再次克隆整个巨型 foo.git,只是丢失我所有的更改。我怎
我在我的电脑上开发代码,我的计算节点很少。 为了让我的程序保持同步,我决定使用 git。以前,我以一种单向模式使用它来“下推”从 PC 到计算节点的更改。但是时不时遇到计算节点特有的小bug,现场修复
虽然它似乎什么也没做,但它没有给出任何警告或错误消息。有什么想法吗? 最佳答案 来自 Git 源的注释: /* * Read a directory tree. We currently ignor
我知道如何为这样的 HTTPS 请求提供用户名和密码: git clone https://username:password@remote 但我想知道如何像这样向 Remote 提供用户名和密码:
Git GUI、Git Bash 和 Git CMD 之间有什么区别?我是初学者,为了进行安装,我发现自己通常同时使用 git bash 和 git CMD 最佳答案 Git CMD 就像使用 git
有人能告诉我git中文件索引被删除是什么意思吗?这些文件在我的 VS Code 中标记为红色,但我仍然可以修改文件并将更改推送到将反射(reflect)这些更改的远程存储库。我认为这一切都是在我使用命
我通过 git 子树将 GLFV 库添加到项目中,但出现此警告“看起来您的 git 安装或您的 git-subtree 安装已损坏”。还描述了几个原因,为什么这可能是: 如 git --exec-pa
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我有需要外部 git 项目的 repo,但我不想使用子模块,因为我想在 github 上存档所有文件,所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
我一直在阅读一篇文章,作者在其中指示:在现有存储库中创建一个新存储库,并想知道这是否是他忽略的错误。稍后我会与他核实。 这些是我要检查的条件: 将现有目录制作成仓库的条件,并且已经 checkin 主
我确实在不同的计算机上处理相同的项目,我想知道是否有一种方法可以跟踪该 .git 文件夹,这样我就不必在所有本地文件中重新配置配置文件。 我将所有工作推送到 bitbucket。 最佳答案 不,没
这个问题在这里已经有了答案: How does git store files? (3 个答案) 关闭 9 年前。 我为我的许多项目创建了一个远程存储库,所以它是我的push 的目的地。与 git
应该如何在 git 中查看文件内容的完整历史记录? 一个文件在 git 中的历史很短,存储库通过 git-svn 同步,但在 svn 中的历史很长。 git 中的历史记录到达文件移动的位置。要查看历史
我是confused here ... 如何对修改后的文件进行git commit,以及如何对新文件进行git commit? 还有,你如何在git中单独提交文件? 最佳答案 git 提交过程分为两个
正在搜索 throw SO 来寻找答案。遇到这个似乎没有给出任何答案的旧线程。重新触发此线程,希望有人知道! 有人能告诉我 git subtree 和 git filter-branch 的区别吗?为
我想知道是否有一种方法可以避免在每个 Git 命令的开头键入单词 git。 如果有一种方法可以在打开命令提示符进入 “Git 模式” 后只使用一次 git 命令就好了。 例如: git> 之后,我们键
当您修改工作目录中的文件时,git 会告诉您使用“git add”暂存。 当您向工作目录添加新文件时,git 会告诉您使用“git add”开始跟踪。 我对这两个概念有点困惑,因为我假设跟踪文件的更改
为什么 git://有效 $ git clone git://github.com/schacon/grit.git Cloning into 'grit'... ... Checking conne
我在以下沙箱中练习 git:https://learngitbranching.js.org/?NODEMO 我在两个单独的 session 中运行了两组命令。第一组命令顺序如下: git clone
我是一名优秀的程序员,十分优秀!