Python tarfile 大小-6ren

Python tarfile 大小

转载作者：行者123 更新时间：2023-11-28 17:50:54

27

4

我可以用这种方式计算 tarfile 中文件的大小:

import tarfile
tf = tarfile.open(name='my.tgz', mode='r')
reduce(lambda x,y: getattr(x, 'size', x)+getattr(y,'size',y), tf.getmembers())

但返回的总大小是 tarfile 中元素的总和，而不是压缩文件的大小(至少这是我通过尝试相信的)。有没有办法在不通过 os.path.getsize 之类的东西检查的情况下获取整个 tar 文件的压缩大小？

最佳答案

没有。

tar.gz 的工作方式是通过 gzip 管道传输文件以获得普通的 tar 存档。 tar(1) 不知道压缩文件首先被压缩，所以它不知道压缩后的大小[*]。

这与 ZIP 等自行压缩的存档格式不同。

tar 方法的优点是您可以使用任何您喜欢的压缩方式。如果出现更好的压缩器，您可以轻松地重新打包您的文件。此外，由于所有内容都放入一个大数据流中，压缩率稍微好一些，并且文件名等元数据也被压缩。

缺点是您必须在存档文件中查找才能解压单个项目。

[*]:tar(1) 的第一个实现没有 -z 选项；它是后来人们开始大量使用 gzip 时添加的。早期的标准压缩是使用compress 得到tar.Z。

关于Python tarfile 大小，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10028435/

27

4

0

文章推荐： Python robotparser 模块不会加载 'robots.txt'

文章推荐： python - 在 Python 中记录一个堆栈级别更高的模块名称/行

文章推荐： Python rpyc 无法远程运行 psutil 命令

文章推荐： javascript - 为什么我的代码中未定义单元格名称属性

没有完整路径的python tarfile
我制作了一个如下所示的小脚本来读取文件组并将它们压缩，一切正常，接受压缩文件在解压缩时包含文件的完整路径。有没有没有目录结构的方法？ compressor = tarfile.open(PATH_TO
Python tarfile 压缩内存中的一个对象
我正在尝试使用 tarfile 在内存中添加一个文件，然后将其写回磁盘，但我遇到的问题是在我的最终输出中，当我提取新创建的 tar.gz 文件时，我得到一个空文件。我的代码哪里做错了？ import
Python:tarfile 流
我想从压缩包中读取一些文件并将其保存到新的压缩包中。这是我写的代码。 archive = 'dum/2164/archive.tar' # Read input data. input_tar = t
Python tarfile 大小
我可以用这种方式计算 tarfile 中文件的大小: import tarfile tf = tarfile.open(name='my.tgz', mode='r') reduce(lambda x
python - Tarfile 在第一个常规文件后停止
我有 .tar.bz2 文件，里面有很多小的 json 文件。一个存档可能有大约数千个，而且 json 很小(低于 10kB，通常也低于 1 KB)。因此，压缩后的单个存档不会超过 100kB。根据
Python tarfile 不解压
我有以下文件: # ls -lha total 2.4M drwxr-xr-x. 2 root root 4.0K Nov 26 19:47 . drwxrwxr-x. 5 bshus
python tarfile 将tar写入管道
我想创建一个 tar 文件并将其通过管道传输到 http 上传。但是，似乎 python tarfile 模块执行搜索，这使得无法通过管道传输到下一个进程。这是代码 tar = tarfile.o
Python tarfile 进度
在将文件添加到 python 中的 tar 存档时，是否有任何库可以显示进度，或者可以扩展 tarfile 模块的功能来执行此操作？在理想情况下，我想展示 tar 创建的总体进度以及关于何时完成的预
python - 将空目录添加到 tarfile
如何在 python 中将空目录添加到 tarfile，而不先在磁盘上创建它？在我的本地文件系统中创建一个空目录，并将其添加到 tar 文件中很容易，但会产生不必要的开销。直接在 tar 文件中创
Python tarfile 和排除
这是 Python 文档的摘录: If exclude is given it must be a function that takes one filename argument and retu
python - 如何从生成器读取 tarfile？
Create a zip file from a generator in Python?描述了将一堆文件写入 .zip 到磁盘的解决方案。我在相反的方向也有类似的问题。我得到了一个发电机: str
Python tarfile 进度输出？
我正在使用以下代码提取一个 tar 文件: import tarfile tar = tarfile.open("sample.tar.gz") tar.extractall() tar.close(
python - 语句 : with and tarfile
我尝试使用 with 语句和 tarfile 模块... with tarfile.open('/dir/dir/dir.tar.gz', 'w:gz') as fl: fl.add('/di
python - 无法将函数并行映射到 tarfile 成员
我有一个包含 bz2 压缩文件的 tarfile。我想将函数 clean_file 应用于每个 bz2 文件，并整理结果。在系列中，这很容易用一个循环: import pandas as pd imp
python - 添加到 tarfile 的文件返回为空文件
我正在尝试将文件添加到 python 中的 gzipped tarfile import tarfile # create test file with open("testfile.txt", "w
python - 使用单个文件名过滤 tarfile.add
使用 tarfile.add 添加目录时，是否可以访问 filter lambda 中的各个文件名？我正在使用 tarfile 模块来创建项目目录的存档。其中一些文件我不再需要，我想忽略: mypr
python - tarfile.open() 未提取到正确的目录路径
我正在尝试将 tar.gz 文件中的所有内容提取到同一目录中。以下代码可以提取所有文件，但文件存储在工作目录中，而不是我输入的名称路径中。 import tarfile zip_rw_data = r
Python tarfile 模块在提取过程中覆盖现有文件 - 如何禁用它？
是否有办法防止 tarfile.extractall ( API ) 覆盖现有文件？我所说的“防止”是指理想情况下在即将发生覆盖时引发异常。当前的行为是静默覆盖文件。最佳答案您可以查看 tar
python - 在 tarfile 中区分来自不同驱动器的文件
我正在尝试使用 tarfile 库归档和压缩分布在多个驱动器上的多个目录。问题是即使两个文件存储在不同的驱动器中，tarfile 也会合并路径。例如: import tarfile with tarf
Python:为 tarfile 分配压缩级别
我的问题是对这个 one 的跟进.我想知道如何修改以下代码以便分配压缩级别: import os import tarfile home = '//global//scratch//chamar//p

首页

博学

6Ren·AI

商城

Python tarfile 大小