Git哈希重复项-6ren

Git哈希重复项

转载作者：太空狗更新时间：2023-10-29 13:52:32

28

4

Git 允许使用如下命令检索提交的哈希值:

git rev-parse HEAD

给出 33b316c或

git rev-parse --short HEAD

给出 33b316cbeeab3d69e79b9fb659414af4e7829a32我知道实践中的长哈希永远不会发生冲突。

在实践中，短哈希的使用频率更高。我想知道短的碰撞的概率是多少？ git 是否采取任何措施来克服可能的冲突(例如使用 git checkout 时)？

最佳答案

我在 book 中给出了一个公式— 参见第 78-79 页 — 但如果您正在寻找一个简单的，一些散列冲突的概率在 n 位散列中达到大约 50% 的点是当您进行散列时大约 2^n/2 键。 SHA-1 散列本身是 160 位，表示为 40 个十六进制数字，每个代表 160 位中的 4 个。将其截断为 7 个十六进制数字会留下 28 位，因此您将在大约 2¹⁴ 键或 16384 个对象处达到 50% 的碰撞几率。如果您将对象限制为仅提交，那是相当可观的提交数量，但 Git 将所有对象(提交、树、带注释的标记对象和 blob)放在一个散列索引的键值存储中。

任何给定键的散列值发生冲突的概率仅为 2ⁿ 中的 1，即 2²⁸ 中的 1 或2.68 亿中的 1。随着 key 数量的增加，它迅速增加到 50% 的原因被称为生日悖论或 birthday problem。 . 50%当然太可怕了；使用 28 位，如果我们希望整体概率低于 0.1%，我们应该将对象的数量保持在大约 1230 以下。通过使用 32 位(8 个字符的缩写)，我们将其加倍到大约 2460，但这仍然不是很多对象。

当你的存储中有 16k 个对象时，你可能应该使用至少 10 个十六进制数字，给出 2⁴⁰ 可能的哈希值和大约 .99987794 的 p-bar 值... (大约 0.019% 的碰撞几率)。九个十六进制数字仅给出 2³⁶ 哈希值，产生 .99804890 的 p-bar...或 0.19% 的碰撞几率，我认为这太高了。

如果您可以将模糊匹配代码限制为仅提交——或仅提交-ish，这在 Git 中意味着提交或带注释的标签——内置默认值有效很不错。 (Git 实际上会在很多情况下这样做。)但是 Git 用于计算“正确”缩写长度的内部代码，至少在我看来，也太无忧无虑了 "loosey-goosey" ，因为它在生成的哈希可能用于识别任何对象的上下文中使用 50% 碰撞概率平方根技巧。

(如评论中所述，内部 Git 始终使用完整的哈希值。它仅在非 Git/Git 界面，例如 git log <hash> 或 git show <hash> 面向用户的命令，你可以输入一个缩写的哈希值，或者要求一个缩写的输出哈希值。这里 Git 将默认使用 50% 的碰撞概率数字来计算要显示的字符数，从数据库中对象的估计数量开始. 如果你提供散列，你选择提供多少。如果你要求 Git 提供它，你仍然可以选择多少，用 --abbrev=<em>number</em> 。注意有一个绝对值最小值 4:git log abc 不会将 abc 视为哈希 ID，但 git log abcd 会将 abcd 视为缩写的哈希 ID。还有一个非常古老的默认值，即 7 个字符，来自 Git 1.7-美好的日子。)

关于Git哈希重复项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56012233/

28

4

0

文章推荐： git - 重复文件会增加 git repo 的大小吗？

文章推荐： git - Git 会记录过去的 merge 冲突吗？

文章推荐： git - : "Sorry, cannot split this hunk"?如何解决

文章推荐： git - 如何将文件从master分支推送到另一个分支？

git - 将 "git git"别名为 "git"？
我时不时地输入“git”，然后想到别的东西，然后输入例如“git checkout master”。当然，这给我留下了 $ git git checkout master git: 'git' is
git - 我怎么能再次 git clone git ://foo. git？
我做到了 git 克隆 git://foo.git 光盘富 ...编辑文件.. 现在我想重新开始。我不在乎我已经做出的任何改变，但我不想再次克隆整个巨型 foo.git，只是丢失我所有的更改。我怎
git - 在 `git format-patch` ,`git am` , `git pull` 之后在 git 历史中双重提交
我在我的电脑上开发代码，我的计算节点很少。为了让我的程序保持同步，我决定使用 git。以前，我以一种单向模式使用它来“下推”从 PC 到计算节点的更改。但是时不时遇到计算节点特有的小bug，现场修复
git - 当您在 Git 存储库中运行 `git add .git` 时会发生什么？
虽然它似乎什么也没做，但它没有给出任何警告或错误消息。有什么想法吗？最佳答案来自 Git 源的注释: /* * Read a directory tree. We currently ignor
git - 运行 "git clone git@remote.git"时如何提供用户名和密码？
我知道如何为这样的 HTTPS 请求提供用户名和密码: git clone https://username:password@remote 但我想知道如何像这样向 Remote 提供用户名和密码:
git - Git GUI、Git Bash、Git CMD 的区别
Git GUI、Git Bash 和 Git CMD 之间有什么区别？我是初学者，为了进行安装，我发现自己通常同时使用 git bash 和 git CMD 最佳答案 Git CMD 就像使用 git
git - git 中的文件索引已在 Git 中删除
有人能告诉我git中文件索引被删除是什么意思吗？这些文件在我的 VS Code 中标记为红色，但我仍然可以修改文件并将更改推送到将反射(reflect)这些更改的远程存储库。我认为这一切都是在我使用命
git - 库不会通过 git 子树添加到 git
我通过 git 子树将 GLFV 库添加到项目中，但出现此警告“看起来您的 git 安装或您的 git-subtree 安装已损坏”。还描述了几个原因，为什么这可能是: 如 git --exec-pa
git - 是否可以将子目录中的 .git 目录添加到 git？
我有需要外部 git 项目的 repo，但我不想使用子模块，因为我想在 github 上存档所有文件，所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
git - 是否可以将子目录中的 .git 目录添加到 git？
我有需要外部 git 项目的 repo，但我不想使用子模块，因为我想在 github 上存档所有文件，所以我认为我只是将具有 git repo 的整个目录添加到 git 但它不t 添加里面的 .git
git - git 如何处理一个 git 存储库在另一个存储库中的放置？
我一直在阅读一篇文章，作者在其中指示:在现有存储库中创建一个新存储库，并想知道这是否是他忽略的错误。稍后我会与他核实。这些是我要检查的条件: 将现有目录制作成仓库的条件，并且已经 checkin 主
git - git 是否可以跟踪 ".git"文件夹？
我确实在不同的计算机上处理相同的项目，我想知道是否有一种方法可以跟踪该 .git 文件夹，这样我就不必在所有本地文件中重新配置配置文件。我将所有工作推送到 bitbucket。最佳答案不，没
git - git 存储库 `.git` 文件夹中存储的项目文件在哪里？
这个问题在这里已经有了答案: How does git store files? (3 个答案) 关闭 9 年前。我为我的许多项目创建了一个远程存储库，所以它是我的push 的目的地。与 git
git - git (git-svn) 中文件的不完整历史记录
应该如何在 git 中查看文件内容的完整历史记录？一个文件在 git 中的历史很短，存储库通过 git-svn 同步，但在 svn 中的历史很长。 git 中的历史记录到达文件移动的位置。要查看历史
git - Git 提交修改和 Git 提交新文件之间的区别
我是confused here ... 如何对修改后的文件进行git commit，以及如何对新文件进行git commit？还有，你如何在git中单独提交文件？最佳答案 git 提交过程分为两个
git - git 过滤器分支和 git 子树之间的区别？
正在搜索 throw SO 来寻找答案。遇到这个似乎没有给出任何答案的旧线程。重新触发此线程，希望有人知道! 有人能告诉我 git subtree 和 git filter-branch 的区别吗？为
git - 如何避免在每个 Git 命令的开头键入 "git"？
我想知道是否有一种方法可以避免在每个 Git 命令的开头键入单词 git。如果有一种方法可以在打开命令提示符进入 “Git 模式” 后只使用一次 git 命令就好了。例如: git> 之后，我们键
git - git 跟踪和 git 暂存的概念
当您修改工作目录中的文件时，git 会告诉您使用“git add”暂存。当您向工作目录添加新文件时，git 会告诉您使用“git add”开始跟踪。我对这两个概念有点困惑，因为我假设跟踪文件的更改
git - 为什么 git ://works but git@ does not
为什么 git://有效 $ git clone git://github.com/schacon/grit.git Cloning into 'grit'... ... Checking conne
git - git pull 真的是 git fetch + git merge 吗？
我在以下沙箱中练习 git:https://learngitbranching.js.org/?NODEMO 我在两个单独的 session 中运行了两组命令。第一组命令顺序如下: git clone

首页

博学

6Ren·AI

商城

Git哈希重复项