- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我刚刚尝试使用 archive/tar 和 compress/gzip 来自动处理我的一些备份。
我的问题是:我周围有各种 .tar 文件和 .tar.gz 文件,因此我想提取 .tar.gz 文件的哈希值 (md5),以及.tar 文件,最好一次运行。
到目前为止,我的示例代码对于 .tar.gz 和 .gz 中文件的哈希值都工作得很好,但是 .tar 的哈希值是错误的,我无法找出是什么问题是。
我查看了 tar/reader.go 文件,发现其中有一些跳过,但我认为一切都应该在 io.Reader 接口(interface)上运行,因此 TeeReader 应该仍然捕获所有字节。
package main
import (
"archive/tar"
"compress/gzip"
"crypto/md5"
"fmt"
"io"
"os"
)
func main() {
tgz, _ := os.Open("tb.tar.gz")
gzMd5 := md5.New()
gz, _ := gzip.NewReader(io.TeeReader(tgz, gzMd5))
tarMd5 := md5.New()
tr := tar.NewReader(io.TeeReader(gz, tarMd5))
for {
fileMd5 := md5.New()
hdr, err := tr.Next()
if err == io.EOF {
break
}
io.Copy(fileMd5, tr)
fmt.Printf("%x %s\n", fileMd5.Sum(nil), hdr.Name)
}
fmt.Printf("%x tb.tar\n", tarMd5.Sum(nil))
fmt.Printf("%x tb.tar.gz\n", gzMd5.Sum(nil))
}
现在来看下面的例子:
$ echo "a" > a.txt
$ echo "b" > b.txt
$ tar cf tb.tar a.txt b.txt
$ gzip -c tb.tar > tb.tar.gz
$ md5sum a.txt b.txt tb.tar tb.tar.gz
60b725f10c9c85c70d97880dfe8191b3 a.txt
3b5d5c3712955042212316173ccf37be b.txt
501352dcd8fbd0b8e3e887f7dafd9392 tb.tar
90d6ba204493d8e54d3b3b155bb7f370 tb.tar.gz
在 Linux Mint 14(基于 Ubuntu 12.04)上,使用 Ubuntu 存储库中的 go 1.02,我的 go 程序的结果是:
$ go run tarmd5.go
60b725f10c9c85c70d97880dfe8191b3 a.txt
3b5d5c3712955042212316173ccf37be b.txt
a26ddab1c324780ccb5199ef4dc38691 tb.tar
90d6ba204493d8e54d3b3b155bb7f370 tb.tar.gz
所以除了 tb.tar 之外的所有哈希值都符合预期。(当然,如果您重试该示例,您的 .tar 和 .tar.gz 将与此不同,因为时间戳不同)
任何关于如何让它工作的提示都将不胜感激,不过我真的更愿意在 1 次运行中使用它(使用 TeeReaders)。
最佳答案
出现此问题是因为 tar 不会从您的阅读器读取每个字节。对每个文件进行哈希处理后,您需要清空读取器以确保每个字节都被读取和哈希处理。我通常这样做的方法是使用 io.Copy()
读取直到 EOF。
package main
import (
"archive/tar"
"compress/gzip"
"crypto/md5"
"fmt"
"io"
"io/ioutil"
"os"
)
func main() {
tgz, _ := os.Open("tb.tar.gz")
gzMd5 := md5.New()
gz, _ := gzip.NewReader(io.TeeReader(tgz, gzMd5))
tarMd5 := md5.New()
tee := io.TeeReader(gz, tarMd5) // need the reader later
tr := tar.NewReader(tee)
for {
fileMd5 := md5.New()
hdr, err := tr.Next()
if err == io.EOF {
break
}
io.Copy(fileMd5, tr)
fmt.Printf("%x %s\n", fileMd5.Sum(nil), hdr.Name)
}
io.Copy(ioutil.Discard, tee) // read unused portions of the tar file
fmt.Printf("%x tb.tar\n", tarMd5.Sum(nil))
fmt.Printf("%x tb.tar.gz\n", gzMd5.Sum(nil))
}
另一种选择是在调用 tarMd5.Sum() 之前添加 io.Copy(tarMd5, gz)
。我认为第一种方法更清晰,即使我需要添加/修改四行而不是一行。
关于go - 为什么通过 TeeReader 的 tar.gz 的 tar 部分的 md5 散列是错误的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15179194/
我正在使用 tf 函数列出 tar.gz 文件的内容。它非常大~1 GB。大约有 1000 个文件以年/月/日文件结构组织。 列表操作需要一些时间。似乎列表应该很快。谁能告诉我内部原理? 谢谢- 最佳
如何将信息通过管道传输到 tar 中并指定文件名? 最佳答案 类似于: tar cfz foo.tgz --files-from=- 但请记住,这不适用于所有可能的文件名;您应该考虑使用 --null
我总是用 tar czf file.tar.gz dirname而不是 tar -czf file.tar.gz dirname (没有 - )因为更快 我知道......从文档中,我所做的是错误的。
我有一个小型的 bash 单行代码,可以从各种来源下载存档列表。以下是包含该列表的文件示例: http://this-is-url1/url1.tar.gz http://www.this-is-ur
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
假设我在服务器 A 上使用 tar -czvf subdir.tgz subdirectory/* 创建了一个 tar 存档。 .如果我在服务器 B 上有一个并行结构,我已将此 tarball 复制到
我看到Linux tar有一个选项--overwrite。但是覆盖似乎是默认设置。而且,指定tar --no-overwrite不会更改此行为,因为信息文件似乎暗示了这一点。 那么,该选项实际上是做什
我需要创建一个任意大的 tarfile 用于测试,但不希望它写入磁盘。 最简单的方法是什么? 最佳答案 您可以轻松地使用 python 生成这样的 tarfile: mktar.py: #!/usr/
[root@c0002242 lfeng]# tar -zxvf/opt/test/ALLscripts.tar.gz -C/opt/test1 tar:这看起来不像 tar 存档 tar:跳到下一个
tar -xvzf $文件名.tar.gz || { 退出 $?; } 这里我的脚本将退出并显示错误代码 141。我使用的是 Fedora Core 6 和 tar 版本 1.15 这种情况不会一直发
我无法运行 docker-compose up 或 docker-compose build --no-cache。两者都以 ERROR: Error processing tar file(arch
我对 linux 平台非常陌生,我想为 ubuntu 提取 gnutls。如果我做, $ls 然后,它将在下面显示这些文件。 gnutls-3.2.1.tar.lz gnutls-3.2.1.tar.
我有一个巨大的 tarbell 存档,其中包含过大或损坏的 error_log,导致存档在尝试解压缩时挂起。有没有办法在解压缩或提取存档之前从存档中删除它,而无需在 Mac OS X 终端上提取该特定
我正在尝试针对特定用例评估 Artifactory,并且正在寻找可以支持将 Artifactory 用于文件存储库的文档。 我找到的只是一个用于部署 Artifactory 的文档,这些文档已存档在
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我想写一个有两个参数的脚本1. 父目录名称(例如 mainFolder)2.要创建的tar名称 父目录将包含子文件夹(文件夹 1、文件夹 2、文件夹 3 等)。我需要一个脚本来创建“mainFolde
假设我在 /tmp 中。我想压缩 /tmp/aaa/123,/tmp/bbb/222。我使用的命令是:tar -vczf/tmp/my.tar.gz/tmp/aaa/123/tmp/bbb/222。这
我有一个bzip2ed tar 文件和一个包含文件列表的文本文件。我想从 tar 中提取文本文件中列出的文件,将它们添加到一个新的 tar 中,然后从第一个 tar 中删除它们。 例如,如果我有这样一
本文实例讲述了Python打包文件夹的方法。分享给大家供大家参考,具体如下: 1、zip ?
我输入这个命令su -c busybox tar -xvf/storage/emulated/0/Download/andrax.r5-build5.tar.xz -C/data/data/com.t
我是一名优秀的程序员,十分优秀!