- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找一个工具,它可以帮助我分析存储库中不同文件的磁盘空间需求。
在我的存储库中,有更大的二进制文件和多个修订版。
例如,我感兴趣的是单个二进制文件的所有这些修订在存储库中使用了多少空间。 AFAIK 通过“list”命令不容易获得此信息,因为我不知道 svn 的增量化工作效率如何。
或者哪些文件/文件夹使用最多的磁盘空间(不仅在头部修订版中,而且在所有修订版中)
有什么想法吗?
最佳答案
节点在 Subversion 中使用多少存储空间并不像看起来那么简单。我将讨论 FSFS(并仅提供 FSFS 的答案),因为这几乎肯定是您正在使用的文件系统实现。如果您使用 BDB,情况会有所不同。
节点可以通过 4 种方式耗尽存储空间。节点的实际文本或主体、属性,并且根据现有的性质,它们使用目录节点中的存储来记录它们的存在(目录节点的主体由其子节点的字典和子节点的表示形式组成),以及最后是文件系统的开销(当您提交到文件时,它会冒出目录的新表示直至根目录,因此在我看来,存储的使用应该属于导致需要存储它的文件) .
文件文本和属性占用的空间相对容易计算出来,而目录存储和开销则要困难得多。然而,即使对于相对简单的文件文本问题,由于表示共享,它仍然稍微复杂。当两个文件相同时(文件可以具有相同的名称,或者不重要,唯一重要的是它们的文本相同),就会发生表示共享,我们避免再次存储它。
以下一行应回答单个文件的文件文本问题。
REPO=~/my-repo; FILE=/somebigfile; grep --recursive --no-filename --text --before-context 3 "cpath: $FILE" "$REPO/db/revs/"* | grep 'text:' | cut -d' ' -f 1-7 | sort -u | awk '{ DISK+=$4; if ($5 == 0) { FULL += $4 } else { FULL += $5 } } END { print DISK, FULL, FULL-DISK}'
您需要将 REPO 更改为存储库的路径,将 FILE 更改为存储库内所需文件的绝对路径。这可能无法完美工作,因为我可能忘记了一些细节。但让我来看看它是如何工作的。
它会在每个修订版文件中查找您要查找的文件,询问前 3 行以及匹配行。然后它会删除除带有文本的行之外的所有内容:(详细说明文本表示的行)。然后,我们排除最后一个字段(唯一符;用于区分共享表示)。这允许我们将其限制为我们实际存储的唯一表示。然后,我们将第 5 个和第 4 个字段相加(分别是全文大小和表示大小)。全文大小可以为零,这意味着它与表示大小相同(我们存储全文而不是增量)。最后我们打印出以下字段:实际存储的大小、全文文件的所有版本的大小以及最后的差异(负数意味着我们比存储纯文本效率低,正数意味着我们节省了那么多空间)。
文本数据的字段如下:
revision offset_in_rev_file size_of_rep size_of_full_text md5 sha1 uniquifier
较旧的存储库可能没有所有这些字段,但这没关系。
因为我依赖于 rev 文件中 cpath 字段的 3 行内的文本字段(嘿,这是一个快速破解),它可能无法完美工作。您可能想运行前两个 grep 命令而不运行其余命令,然后查看提供的修订(它们将是左侧的第一组数字)。将其与文件的 svn log
输出进行比较。如果所有转速都在那里,那么它应该是准确的。
如果我有时间,我会尝试编写一个实用程序,以正确的方式(使用 SVN 库)执行此操作,并且更有用。可能会包括属性使用的存储,也可能包括我上面提到的一些其他存储。
TL;DR 这不是一个容易回答的问题。使用上面的shell脚本来回答一个文件文本的存储。它会给你输出,即我们在磁盘上使用的空间、所有修订的全文空间,以及我们节省了多少空间(负数意味着我们由于增量开销而损失了空间)。
关于svn - 分析SVN磁盘空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14961642/
运行 Tomcat 失败并出现 java.lang.OutOfMemoryError - 与缺少 PermGen 空间相关的错误。 我最近将 Tomcat 更改为以自己的用户(而非 root)运行。
我们有一个表,其中包含数百万行,其中包含 PostGIS 几何图形。我们要执行的查询是:落在边界几何内的最新条目是什么?这个查询的问题是我们经常会有大量的项目匹配边界框(半径大约为 5 公里),然后
我有一个Elasticsearch设置,它将允许用户搜索通配符作为索引。 array:3 [ "index" => "users" "type" => "user" "body" => arra
我创建了一个表,其中每行包含两个按钮,并且两个按钮连接在一起,我想将两个按钮分开。我用过 不起作用,css 也是,这是他们的另一种方式。 我有另一个问题,因为我不想在表格边框内显示操作按钮,而是在靠近
我试图在 jQuery Mobile 中的两个按钮之间留出空白。现实中的布局是这样的: Button 1 Button 2 (Hidden w/ display: none)
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
您好,我对图表应用程序还很陌生。现在我为我的应用程序创建了条形图。当我运行 create bar chart as separate project 时,输出如下所示。 然后当我将条形图与我的应用程序
我在使用 H2 和 GeoDB(内存中,junit)时遇到问题。 另外,使用 Hibernate 5(每个包的最新版本,包括 hibernate-spatial)和 Spring 4。 通过 id 实
我想画一张澳大利亚的 map ,并将每个城市表示为一个点。 然后突出显示人口众多(> 1M)的城市 library(sp) library(maps) data(canada.cities) head
关闭。这个问题是opinion-based .它目前不接受答案。 想改进这个问题?更新问题,以便 editing this post 提供事实和引用来回答它. 6年前关闭。 Improve this
如何保持.txt文件中存在的空格?在.txt文件中,它表示: text :text text1 :text1 text23 :text2 text345 :text3 如果我写这段
以下哪个键最大? 选项 1:16 个数字 [0,9] 选项 2:30 个元音 选项 3:字母表中的 16 个字母 选项 4:32 位 有人可以帮助我,告诉我哪一个是正确的答案以及我们如何计算它吗?我知
在 Unity 3d 中使用 Azure 空间 anchor 来实现在 iOS 和 Android 上部署的室内和室外增强现实体验是否有益? 最佳答案 是的,对于 Azure Spatial Anch
我有一个绝对定位的圆形图像。图像只需占据屏幕宽度的 17%,并且距离顶部 5 个像素。 问题是,当我调整图像大小以占据屏幕宽度的 17% 时,它会这样做,但同时容器会变长。图像本身不会拉伸(stret
我在 Ubuntu 14.04 上使用 Cassandra。从文档中,我可以看到运行命令: nodetool snapshot 创建我的 key 空间的快照。 命令的输出是: nodetool sn
Heroku引入了“私有(private)空间”,是否可以将现有应用迁移到私有(private)空间? https://blog.heroku.com/archives/2015/9/10/herok
是否允许在语义记录中使用非绑定(bind)空格 或其他 HTML 编码字符?我遇到的问题是 ; 字符被软件视为记录的结尾。 例如:假设我有一份婚姻记录,其中包含 2 个结婚者的姓氏、结婚年份以及结
我正在研究“智能 parking ”项目,偶然发现了包含我们真正需要的YouTube视频。我们已经实现了第一部分,即从视频源进行实时透视变换,下一步是将其定义为一组矩形 我基本上需要知道他是如何做到的
我有两个类:Engine 和 Trainset(多个单元),这两个类共享其 ID 空间,其中包含名称和系列 id=- . 这是我的Engine类(它是抽象的,因为有引擎的子类型(DieselEngin
如果有人能帮助我,那就太好了。 我正在尝试使用Java的Split命令,使用空格分割字符串,但问题是,字符串可能没有空格,这意味着它将只是一个简单的顺序(而不是“输入2”将是“退出”) Scanner
我是一名优秀的程序员,十分优秀!