- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
您好,我目前正在开发一个必须提取一些 .tar 文件的工具。
它在大多数情况下都工作得很好,但我有一个问题:
某些 .tar 和 .zip 文件的名称包含“非法”字符(f.ex“:”)。这个程序必须在 Windows 机器上运行,所以我必须处理这个问题。
如果提取的输出中包含“:”或其他非法 Windows 字符,我是否可以更改某些文件的名称。
我当前的实现:
def read_zip(filepath, extractpath):
with zipfile.ZipFile(filepath, 'r') as zfile:
contains_bad_char = False
for finfo in zfile.infolist():
if ":" in finfo.filename:
contains_bad_char = True
if not contains_bad_char:
zfile.extractall(path=extractpath)
def read_tar(filepath, extractpath):
with tarfile.open(filepath, "r:gz") as tar:
contains_bad_char = False
for member in tar.getmembers():
if ":" in member.name:
contains_bad_char = True
if not contains_bad_char:
tar.extractall(path=extractpath)
所以目前我只是忽略这些输出,这并不理想。
为了更好地描述我的要求,我可以提供一个小例子:
file_with_files.tar -> small_file_1.txt
-> small_file_2.txt
-> annoying:file_1.txt
-> annoying:file_1.txt
应该提取到
file_with_files -> small_file_1.txt
-> small_file_2.txt
-> annoying_file_1.txt
-> annoying_file_1.txt
迭代压缩文件中的每个文件对象并一一提取是唯一的解决方案还是有更优雅的解决方案?
最佳答案
根据[Python.Docs]: ZipFile.extract(member, path=None, pwd=None) :
On Windows illegal characters (
:
,<
,>
,|
,"
,?
, and*
) replaced by underscore (_
).
所以,事情已经解决了:
>>> import os
>>> import zipfile
>>>
>>> os.getcwd()
'e:\\Work\\Dev\\StackOverflow\\q055340013'
>>> os.listdir()
['arch.zip']
>>>
>>> zf = zipfile.ZipFile("arch.zip")
>>> zf.namelist()
['file0.txt', 'file:1.txt']
>>> zf.extractall()
>>> zf.close()
>>>
>>> os.listdir()
['arch.zip', 'file0.txt', 'file_1.txt']
快速浏览TarFile(源代码和doc)并没有发现任何类似的东西(如果没有的话我也不会感到非常惊讶,因为< em>.tar 格式主要用于 Nix),因此您必须手动执行此操作。事情并不像我想象的那么简单,因为 TarFile 不提供以不同名称提取成员的可能性,就像 ZipFile 那样。
无论如何,这是一段代码(我有ZipFile和TarFile作为缪斯或灵感来源):
code00.py:
#!/usr/bin/env python
import sys
import os
import tarfile
def unpack_tar(filepath, extractpath=".", compression_flag="*"):
win_illegal = ':<>|"?*'
table = str.maketrans(win_illegal, '_' * len(win_illegal))
with tarfile.open(filepath, "r:" + compression_flag) as tar:
for member in tar.getmembers():
#print(member, member.isdir(), member.name, member.path)
#print(type(member))
if member.isdir():
os.makedirs(member.path.translate(table), exist_ok=True)
else:
with open(os.path.join(extractpath, member.path.translate(table)), "wb") as fout:
fout.write(tarfile.ExFileObject(tar, member).read())
def main(*argv):
unpack_tar("arch00.tar")
if __name__ == "__main__":
print("Python {:s} {:03d}bit on {:s}\n".format(" ".join(elem.strip() for elem in sys.version.split("\n")),
64 if sys.maxsize > 0x100000000 else 32, sys.platform))
rc = main(*sys.argv[1:])
print("\nDone.")
sys.exit(rc)
请注意,上述代码适用于简单的 .tar 文件(具有简单的成员,包括目录)。
已提交[Python.Bugs]: tarfile: handling Windows (path) illegal characters in archive member names 。
我不知道它的结果会是什么,因为我提交了几个更严重的问题(以及对它们的修复)(根据我的PoV),但是对于种种原因,都被拒绝了。
关于python - Tarfile/Zipfile extractall() 更改某些文件的文件名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55340013/
我在 ZipFile zipfile = new ZipFile("X"); 中设置 zip 文件 X 的路径时遇到问题。 我不想对路径进行硬编码,使其成为 ZipFile zipfile = new
有文件夹路径: P:\\2018\\Archive\\ 我想以编程方式创建许多 zip 文件,但我从测试开始。我将把这个测试 zip 文件命名为“CO_007_II.zip”并尝试在上面的位置创建:
我有一个 zip 文件,里面可以包含任意数量的 zip 文件(也是递归的)。我需要遍历所有这些。 现在,我有一个将 zipInputStream 和 zipFile 作为参数的函数。问题是;如果我在另
这个问题在这里已经有了答案: Unzip nested zip files in python (7 个答案) 关闭 6 年前。 我一直在互联网上寻找类似的主题,但没有找到任何东西。 我有一个 zi
我正在尝试解压缩发送给我的一些压缩的彩信。问题是有时它有效,而其他时候则无效。当它不起作用时,python zipfile 模块会提示说它是一个错误的 zip 文件。但是使用 unix unzip 命
我想从压缩文件中删除文件的唯一方法是创建一个临时压缩文件而不删除要删除的文件,然后将其重命名为原始文件名。 在 python 2.4 中,ZipInfo 类有一个属性 file_offset,因此可以
我知道,我知道,谁会想在java中压缩或解压缩大文件。完全不合理。暂时不要怀疑,假设我有充分的理由解压缩一个大的 zip 文件。 问题 1:ZipFile有一个bug (bug # 6280693)
目前,我的应用程序将对磁盘上的文件列表执行压缩过程,并允许用户作为备份目的的电子邮件附件发送。 为了具有数据损坏检测能力,我使用以下方法生成校验和 public static long getChec
似乎 zipfile.ZipFile 需要随机访问,而 urllib2 返回的“类似文件”对象不支持该随机访问。 我尝试用 io.BufferedRandom 包装它,但得到: AttributeEr
我试图从 zip 文件获取输入流,然后将其添加到另一个 zip 文件,但它抛出空指针异常。这是我的代码。 ZipParameters parameters = new ZipParame
我正在解压缩 Zip 文件。由于有两种类型的存档 - Zip 和 GZip。 我正在使用以下内容 ZipFile zipFile = new ZipFile(file, ZipFile.OPEN_RE
我很难理解 zipfile 模块的 zipfile.ZIP_DEFLATED 和 zipfile.ZIP_STORED 压缩模式之间的区别。 最佳答案 ZIP_DEFLATED 对应于压缩(或缩小)的
我有一个 1.4GB 的 zip 文件,正在尝试连续生成每个成员。 zipfile 模块不断抛出 BadZipfile 异常,指出 "zipfile.BadZipfile: zipfiles that
我正在尝试将消息(字符串)压缩到 zip 文件中,然后将其设置为 Apache Camel 中交换对象的主体,以便下游服务之一(也使用 Apache Camel)能够使用 exchange.getIn
我正在尝试获取一个 python Zip 模块来压缩数据。 但它所做的只是抛出一个错误: with ZipFile(O_file7,mode='w',compression=ZipFile.ZIP_D
我想获取压缩文件夹内文件的创建日期。 我知道如果没有 zip,这可以通过使用 os.path.getctime() 来实现可以使用 ZipInfo.date_time 提取压缩文件夹内文件的函数和上次
如何在 C# 中提取 ZipFile?(ZipFile 是包含文件和目录) 最佳答案 为此使用工具。类似于 SharpZip .据我所知 - .NET 不支持开箱即用的 ZIP 文件。 来自 here
我有这个 Java 方法来上传文件。我试图通过将该文件夹压缩成一个 zip 文件并上传它来迎合尝试上传文件夹的用户。出于某种原因,就我而言 file.isDirectory()和 file.isFil
我有一个 Path 可以在虚拟文件系统 (jimfs) 上压缩文件,我需要使用 ZipFile 打开这个 zip 文件。 但是 ZipFile 中没有构造函数来获取 Path 作为参数,只有 File
我是一名新手,正在尝试了解如何使用 uuencode 方法。我们有一个表单,只允许上传一个文本文件。现在看起来只有 zip 文件会被上传。我试图包含 uuencode 方法以将字节转换为字符串,这样我
我是一名优秀的程序员,十分优秀!