- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
不幸的是,我不得不在 git 中存储一些二进制文件,
但是我可以选择数据在磁盘上的存储方式 - 在 Git 中(以我们自己的格式,只有构建系统需要读取)。
我想避免过多地谈论细节,因为我认为它不那么重要 - 但为了提供一些上下文,这些是许多图标文件,但同样的问题也适用于许多小的声音文件或 3d 模型.
将这些文件转换成一个大图像将是一个构建步骤,因此可以在 git 中以我们喜欢的任何方式存储图像。
假设某些文件偶尔会发生变化 - 所以避免为像素的每个小变化存储新的二进制 blob - 会很好。
我很想知道:
如果无法完全避免使用二进制文件,那么考虑到所有事情,避免大型 git 存储库(因为对二进制文件进行了编辑)的最佳选择是什么?
最佳答案
Which options will store a totally new binary blob each time the binary file changes (even a few bytes).
所有这些。所有 blob(实际上,repo 中的所有对象)只要是“松散对象”,就会“完整”(或多或少)存储。对它们所做的唯一一件事就是给它们一个 header 并使用 deflate 压缩对其进行压缩。
与此同时,松散的物体最终会组合成“包”。 Git 对包中的文件进行增量压缩:参见 Is the git binary diff algorithm (delta storage) standardized? .根据那里的答案,最好不要“预压缩”二进制文件,这样包文件增量算法就可以找到匹配二进制数据的长字符串。
Does git diff uncompressed binary data better then compressed data (which may change a lot even with minor edits to the uncompressed data).
我还没有尝试过,但总的来说,答案应该是"is"。
I would assume storing many small binary files is less overhead long term, compared to one large binary file, assuming only some of the files are periodically modified, can git handle small changes to large binary files efficiently?
当然,所有完全未更改的文件都将立即进行大量“去重”存储,因为它们的 SHA-1 校验和在所有提交中都是相同的,因此每棵树在存储库中命名完全相同的 blob。如果 foo.icon
在数千次提交中都是相同的,则只会存储一个 blob(无论 foo.icon
的 SHA-1 结果是什么)。
我建议进行一些试验:使用建议的二进制文件创建一些虚拟测试 repo 协议(protocol),进行建议的更改,并查看在运行 git gc
重新打包松散文件之前和之后 repo 协议(protocol)有多大对象。请注意,有很多可调项;特别是,您可能想要对 window
、depth
和 window-memory
设置大惊小怪(可以在命令行或 git config 中设置项)。
关于Git与二进制数据,最佳存储方式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20690027/
我正在尝试将谷歌地图集成到 Xamarin Android。但是,如标题中所写,收到错误。此错误出现在我的 SetContentView (Resource.Layout.Main); 上,如下所示:
在 Delphi 中如何以非文本模式打开二进制文件?类似于 C 函数 fopen(filename,"rb") 最佳答案 有几个选项。 1。使用文件流 var Stream: TFileStrea
我现在正在处理一个问题,如下所示: 有两个数字 x1 和 x2 并且 x2 > x1。 例如 x1 = 5; x2 = 10; 而且我必须在二进制表示中找到 x1 和 x2 之间的总和。 5 = 10
我有这个“程序集”文件(仅包含 directives ) // declare protected region as somewhere within the stack .equiv prot_s
有没有办法在powershell中确定指定的文件是否包含指定的字节数组(在任何位置)? 就像是: fgrep --binary-files=binary "$data" "$filepath" 当然,
我是一名工程师,而不是软件程序员,所以请原谅我的无知。 我编写了一个 Delphi(7SE) 程序,用于从连接到两个数字温度计的 USB 端口读取“真实”数据类型。 我已经完成了该计划的大部分内容。
我有一些代码,例如: u=(float *)calloc(n, sizeof(float)); for(i=1; i
typedef struct pixel_type { unsigned char r; unsigned char g; unsigned char b;
如何判断二进制数是否为负数? 目前我有下面的代码。它可以很好地转换为二进制文件。转换为十进制时,我需要知道最左边的位是否为 1 以判断它是否为负数,但我似乎无法弄清楚该怎么做。 此外,我如何才能让它返
我有一个带有适当重载的 Vect*float 运算符的 vector 类,我正在尝试创建全局/非成员 float*Vect 运算符,如下所示:(注意这是一个经过大量编辑的示例) class Vect
对于使用 C 编程的项目,我们正在尝试将图像转换为二进制数据,反之亦然。我们在网上找到的所有其他解决方案都是用 C++ 或 Java 编写的。这是我们尝试过的方法: 将图像转换为包含二进制数据的文本文
我需要对列表的元素求和,其中包含所有零或一,如果列表中有 1,则结果为 1,否则为 0。 def binary_search(l, low=0,high=-1): if not l: retu
我到处搜索以找到将 float 转换为八进制或二进制的方法。我知道 float.hex 和 float.fromhex。是否有模块可以对八进制/二进制值执行相同的工作? 例如:我有一个 float 1
当我阅读有关 list.h 文件中的 hlist 的 FreeBSD 源代码时,我对这个宏感到困惑: #define hlist_for_each_entry_safe(tp, p, n, head,
我不知道出了什么问题,也不知道为什么会出现此错误。我四处搜索,但我终究无法弄明白。 void print_arb_base(unsigned int n, unsigned int b) {
在任何语言中都可以轻松地将十进制转换为二进制,反之亦然,但我需要一个稍微复杂一点的函数。 给定一个十进制数和一个二进制位,我需要知道二进制位是开还是关(真或假)。 示例: IsBitTrue(30,1
在下面的代码中,我创建了两个文件,一个是文本格式,另一个是二进制格式。文件的图标显示相同。但是这两个文件的特征完全相同,包括大小、字符集(==二进制)和流(八位字节)。为什么没有文本文件?因为如果我明
我想通读一个二进制文件。谷歌搜索“python binary eof”引导我here . 现在,问题: 为什么容器(SO 答案中的 x)不包含单个(当前)字节而是包含一大堆字节?我做错了什么? 如果应
为什么只允许以 10 为基数使用小数点?为什么以下会引发语法错误? 0b1011101.1101 我输入的数字是否有歧义?除了 93.8125 之外,字符串似乎没有其他可能的数字 同样的问题也适用于其
boost 库中有二进制之类的东西吗?例如我想写: binary a; 我很惭愧地承认我曾尝试找到它(Google、Boost)但没有结果。他们提到了一些关于 binary_int<> 的内容,但我既
我是一名优秀的程序员,十分优秀!