- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Chapter 3.1 of the the Git book明确指出,只有暂存文件必须作为blob存储在提交树中。
如果像提交对象一样,blob获得了对其内容唯一的哈希ID,那么Git如何设法跟踪跨提交的blob与文件之间的对应关系?由于提交文件的内容不同,因此它们在不同提交中的哈希ID无法匹配。
一个简单的例子:
假设我只是创建了一个没有提交的空仓库。我创建一个文件README.md,暂存并提交。 Git存储一个树对象,该树对象的Blob由README.md内容的哈希标识。
假设我修改了README.md,进行了阶段提交。 Git存储一个树对象,该树对象的Blob由README.md的已修改内容的哈希标识。自然,我们可以期望第二个哈希与第一个提交树中标识README.md的blob的哈希不同。
Git将如何回答有关README.md历史记录的请求?
git log README.md
最佳答案
这实际上是一个很好的问题。
提交的内部存储形式部分相关,因此让我们考虑一下。实际上,单个提交很小。这是来自Git的Git存储库中的一个,即commit b5101f929789889c2e536d915698f58d5c5c6b7a
:
$ git cat-file -p b5101f929789889c2e536d915698f58d5c5c6b7a | sed 's/@/ /'
tree 3f109f9d1abd310a06dc7409176a4380f16aa5f2
parent a562a119833b7202d5c9b9069d1abb40c1f9b59a
author Junio C Hamano <gitster pobox.com> 1548795295 -0800
committer Junio C Hamano <gitster pobox.com> 1548795295 -0800
Fourth batch after 2.20
Signed-off-by: Junio C Hamano <gitster pobox.com>
sed 's/@/ /'
也许是为了减少Junio Hamano必须获得的电子邮件垃圾邮件的数量:))。如您所见,提交对象通过另一个提交的哈希ID
a562a11983...
引用其父提交对象。它还通过哈希ID引用树对象,并且树对象的哈希ID以
3f109f9d1a
开头。我们也可以使用
git cat-file -p
来查看这个树对象:
$ git cat-file -p 3f109f9d1a | head
100644 blob de1c8b5c77f7566d9e41949e5e397db3cc1b487c .clang-format
100644 blob 42cdc4bbfb05934bb9c3ed2fe0e0d45212c32d7a .editorconfig
100644 blob 9fa72ad4503031528e24e7c69f24ca92bcc99914 .gitattributes
040000 tree 7ba15927519648dbc42b15e61739cbf5aeebf48b .github
100644 blob 0d77ea5894274c43c4b348c8b52b8e665a1a339e .gitignore
100644 blob cbeebdab7a5e2c6afec338c3534930f569c90f63 .gitmodules
100644 blob 247a3deb7e1418f0fdcfd9719cb7f609775d2804 .mailmap
100644 blob 03c8e4c613015476fffe3f1e071c0c9d6609df0e .travis.yml
100644 blob 8c85014a0a936892f6832c68e3db646b6f9d2ea2 .tsan-suppressions
100644 blob 536e55524db72bd2acf175208aef4f3dfc148d42 COPYING
100644
),类型(
blob
,这是模式所隐含的,也记录在内部Git对象中;它实际上没有存储在树对象中),哈希ID(< cc>)和blob的名称(
de1c8b5c77f...
)。您还可以看到
.clang-format
可以引用其他
tree
对象,就像
tree
子树一样。
$ git cat-file -p de1c8b5c77f | head
# This file is an example configuration for clang-format 5.0.
#
# Note that this style definition should only be understood as a hint
# for writing new code. The rules are still work-in-progress and does
# not yet exactly match the style we have in the existing code.
# Use tabs whenever we need to fill whitespace that spans at least from one tab
# stop to the next one.
#
# These settings are mirrored in .editorconfig. Keep them in sync.
.github
子树:
$ git cat-file -p 7ba15927519648dbc42b15e61739cbf5aeebf48b
100644 blob 64e605a02b71c51e9f59c429b28961c3152039b9 CONTRIBUTING.md
100644 blob adba13e5baf4603de72341068532e2c7d7d05f75 PULL_REQUEST_TEMPLATE.md
.github
构建的缓存会说,名称
b5101f929789889c2e536d915698f58d5c5c6b7a
具有模式
.clang-format
和blob哈希
100644
,而名称
de1c8b5c77f7566d9e41949e5e397db3cc1b487c
具有模式
.github/CONTRIBUTING.md
和blob-hash
100644
。
64e605a02b71c51e9f59c429b28961c3152039b9
加
.github
)已加入到内存缓存中。 (以磁盘格式,通过算法欺骗将它们压缩。)
CONTRIBUTING.md
与其他提交进行比较,则Git还将另一个提交读入内存缓存中。该其他高速缓存具有一个名为
b5101f929789889c2e536d915698f58d5c5c6b7a
的条目,或者没有。
.github/CONTRIBUTING.md
的简单事实足以将它们标识为“同一文件”。名称相同,到此完成。
.github/CONTRIBUTING.md
提供额外的服务
git diff
的文件可能会重命名为
a/b.c
或
d/e.f
。
d/e.c
,文件名为
a123456
。然后,我们提交
a/b.c
。第二个提交没有
f789abc
,但是确实有
a/b.c
。 Git会简单地从索引(缓存的磁盘形式)和工作树中删除
d/e.f
,并将新的
a/b.c
填充到我们的索引和工作树中,一切都很好。
d/e.f
与
a123456
进行比较。 Git可以告诉我们:要将
f789abc
更改为
a123456
,请删除
f789abc
并使用这些内容创建一个新的
a/b.c
。这就是
d/e.f
所做的,足够了。但是,如果内容完全匹配怎么办? Git告诉我们的效率更高:要将
git checkout
更改为
a123456
,将
f789abc
重命名为
a/b.c
。实际上,使用正确的选项,
d/e.f
可以做到这一点:
git diff --find-renames a123456 f789abc
git diff
)。进一步假设提交R包含不在提交L中的某个文件(
a/b.c
)。与其立即告诉我们:您应该删除L文件并使用R文件,Git现在可以比较两个文件的内容。
d/e.f
与R中的
a/b.c
100%相同。在这种情况下,它们将具有完全相同的哈希ID!因此,Git做到了:如果某个文件已从L消失,而另一些文件已出现在R中,并且要求Git查找重命名,则Git会检查哈希ID是否匹配。如果找到某些文件,它将对这些文件进行配对(并将它们从不匹配文件的队列中删除-包含L和R中的文件的该队列是“重命名检测队列”)。
d/e.f
获取匹配的结果并调用那些文件重命名。同样,这仅在使用
git diff
(或
--find-renames
)时发生,并且可以根据需要将阈值设置为50%以外的值。
-M
命令提供另一项服务。请注意,我们首先假设,如果提交L和R具有相同名称的文件,则即使内容不同,这些文件也都是相同的文件。但是,如果不是这样呢?如果L中的
git diff
重命名为R中的
file
,并且有人在R中创建了新的
bettername
怎么办?
file
提供了
git diff
(或“中断配对”)选项。启用
-B
时,如果名称不太相似,则以名称开头的文件将失去配对。也就是说,Git将检查两个blob哈希是否匹配,如果不匹配,则Git将计算相似性索引。如果索引低于某个阈值,则Git将破坏配对并将两个文件放入重命名检测队列,然后再运行
-B
样式的重命名检测器。
--find-renames
,您实际上指定了两个相似性阈值:第一个数字是何时暂时断开配对,第二个数字是何时永久断开配对。
-B
使用
git merge
git diff --find-renames
执行三向合并时,有三个输入:
git merge
和
--ours
。
--theirs
命令。一个将基数与L比较,另一个将基数与R比较。
git diff
的情况下运行。如果从base到L的差异找到一个重命名,则Git知道使用该重命名中显示的更改。同样,如果从base到R的差异找到一个重命名,则Git知道使用这些更改。如果两个差异都显示重命名,它将合并两组更改,并尝试(但通常失败)合并两个重命名。
--find-renames
也使用重命名检测器
git log --follow
时,Git遍历提交历史记录,一次提交一对(父级和子级),从父级到子级进行比较。它打开有限形式的重命名检测代码,以查看您正在抄送的一个文件是否在该提交对中被重命名。如果是这样,
git log --follow
移至父级后,它将立即更改其查找的名称。该技术效果很好,但是在合并时会遇到一些问题(因为合并提交有多个父项)。
--follow
与提交R中的文件
git log
是“不是”文件,因此Git可以使用重命名检测来确定。在某些情况下(例如检出提交L或R),这一点无关紧要。在某些情况下,例如将两个提交区分开,这很重要,但仅对我们试图理解所发生情况的人类有用。但是在某些情况下,例如合并,这非常重要。
关于git - git如何将Blob与提交树中的文件匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55616349/
我正在尝试从 Azure 容器中删除 blob。我能够连接到它并列出此问题中代码后面的所有 blob:Upload and Delete Azure Storage Blob using azure-
我正在尝试从 Azure 容器中删除 blob。我能够连接到它并列出此问题中代码后面的所有 blob:Upload and Delete Azure Storage Blob using azure-
运行我的 azure 函数(用于读取 azure blob 存储)后出现错误。 错误是 ID 0dad768d-36d4-4c1a-85ae-2a5122533b3c fail: Func
运行我的 azure 函数(用于读取 azure blob 存储)后出现错误。 错误是 ID 0dad768d-36d4-4c1a-85ae-2a5122533b3c fail: Func
我正在使用 C# 控制台应用程序 (.NET Core 3.1) 从 Azure Blob 存储读取大量图像文件并生成这些图像的缩略图。新图像将保存回 Azure,并将 Blob ID 存储在我们的数
我没有在网上看到任何有关如何获取位于 BlobContainerClient 内特定目录内的所有 blob 的示例。 以前,我使用的是 Microsoft.Azure.Storage 软件包,但这些软
我正在使用 C# 控制台应用程序 (.NET Core 3.1) 从 Azure Blob 存储读取大量图像文件并生成这些图像的缩略图。新图像将保存回 Azure,并将 Blob ID 存储在我们的数
我没有在网上看到任何有关如何获取位于 BlobContainerClient 内特定目录内的所有 blob 的示例。 以前,我使用的是 Microsoft.Azure.Storage 软件包,但这些软
我正在编写一些代码,允许用户使用麦克风录制自己的声音,然后将录音上传到 Azure Blob 存储。 为了录制音频,我使用类似于下面的代码 let recordedBlobs = []; this.m
当前使用:https://github.com/Azure/azure-sdk-for-go 概述:我当前正在从 azure blob 存储中下载一个 blob,解析该 blob,然后将转录的 blo
正在观看 this video about how to design Tinder ,在 06:50 提出了关于文件与 BLOBS 的观点。 我想知道大二进制文件和 BLOB(二进制大对象)之间有什
目前我有 hibernate JPA HSQLDB 来自动创建我的数据库表。 如何告诉 JPA 或 Hibernate 将字符串保存为 clob/blob 字段?即一个很长的字符串。到目前为止我找不
我有一个一维 NumPy 数组,其中包含一些“坏”值。我想剔除它们。 每个坏值的邻居只是“顽皮”,但我也想剔除它们。 对不良值的可靠测试是询问: arr<0.1 但是,(我能想到的)对于顽皮值的唯一可
查看有关获取 Blob 和获取 Blob 属性的 MSDN 文档。两个请求看起来相同 "https://myaccount.blob.core.windows.net/mycontainer/mybl
我有 2 个 Blob 存储,一个在 eastus,一个在 canadaeast,我想将一个 .vhd 从 eastus 复制到 canadaeast。我去了 eastus,在我想要复制的 blob
所以场景如下: 我有多个 Web 服务实例,用于将 blob 数据写入 Azure 存储。我需要能够根据收到的时间将 blob 分组到容器(或虚拟目录)中。偶尔(最坏的情况是每天)旧的 blob 会被
在 Azure Blobstorage 中,我有 100 个 Blob,但我只想列出前 10 个 Blob。我该怎么做? 我写的{maxResults:1}没有任何效果,它仍然列出了我所有的 Blob
我们当前的代码使用 Azure SDK 1.8,为了生成共享访问签名,它将首先调用 CloudBlobContainer.GetBlobReference(),然后调用 CloudBlob.GetSh
我有大量文件存储在公共(public) Azure blob 容器中,所有这些文件都通过我的 ASP.NET MVC Web 应用程序中的 HTML 直接引用。例如,blob 存储中一个图像的路径如下
我有一个 NodeJS 后端,它使用 Microsoft 的官方 Blob 存储库 (@azure/storage-blob) 来管理我的 Blob 存储: https://www.npmjs.com
我是一名优秀的程序员,十分优秀!