- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
新手错误似乎让我大吃一惊,我不是新手。我有一个 1.2G 的已知良好压缩文件 'train.zip',其中包含一个 3.5G 的文件 'train.csv'。我打开 zip 文件并自行归档,没有任何异常(没有 LargeZipFile),但生成的文件流似乎是空的。 (UNIX 'unzip -c ...' 确认它是好的)Python ZipFile.open()
返回的文件对象不可搜索或可辨别,因此我无法检查。
Python 发行版是 2.7.3 EPD-free 7.3-1(32 位);但对于大 zipper 应该没问题。操作系统为 MacOS 10.6.6
import csv
import zipfile as zf
zip_pathname = os.path.join('/my/data/path/.../', 'train.zip')
#with zf.ZipFile(zip_pathname).open('train.csv') as z:
z = zf.ZipFile(zip_pathname, 'r', zf.ZIP_DEFLATED, allowZip64=True) # I tried all permutations
z.debug = 1
z.testzip() # zipfile integrity is ok
z1 = z.open('train.csv', 'r') # our file keeps coming up empty?
# Check the info to confirm z1 is indeed a valid 3.5Gb file...
z1i = z.getinfo(file_name)
for att in ('filename', 'file_size', 'compress_size', 'compress_type', 'date_time', 'CRC', 'comment'):
print '%s:\t' % att, getattr(z1i,att)
# ... and it looks ok. compress_type = 9 ok?
#filename: train.csv
#file_size: 3729150126
#compress_size: 1284613649
#compress_type: 9
#date_time: (2012, 8, 20, 15, 30, 4)
#CRC: 1679210291
# All attempts to read z1 come up empty?!
# z1.readline() gives ''
# z1.readlines() gives []
# z1.read() takes ~60sec but also returns '' ?
# code I would want to run is:
reader = csv.reader(z1)
header = reader.next()
return reader
最佳答案
原因是以下因素的结合:
命令行解决方法是解压缩,然后重新压缩,以获得普通的type 8: Deflated。
zipfile will throw an exception in 2.7 , 3.2+出于法律原因,我猜 zipfile 永远无法真正处理类型 9。Python 文档没有提及 zipfile 不能 handle other compression types :(
关于python - 打开不受支持的压缩类型的 zipfile 静默返回空文件流,而不是抛出异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12809651/
我在 ZipFile zipfile = new ZipFile("X"); 中设置 zip 文件 X 的路径时遇到问题。 我不想对路径进行硬编码,使其成为 ZipFile zipfile = new
有文件夹路径: P:\\2018\\Archive\\ 我想以编程方式创建许多 zip 文件,但我从测试开始。我将把这个测试 zip 文件命名为“CO_007_II.zip”并尝试在上面的位置创建:
我有一个 zip 文件,里面可以包含任意数量的 zip 文件(也是递归的)。我需要遍历所有这些。 现在,我有一个将 zipInputStream 和 zipFile 作为参数的函数。问题是;如果我在另
这个问题在这里已经有了答案: Unzip nested zip files in python (7 个答案) 关闭 6 年前。 我一直在互联网上寻找类似的主题,但没有找到任何东西。 我有一个 zi
我正在尝试解压缩发送给我的一些压缩的彩信。问题是有时它有效,而其他时候则无效。当它不起作用时,python zipfile 模块会提示说它是一个错误的 zip 文件。但是使用 unix unzip 命
我想从压缩文件中删除文件的唯一方法是创建一个临时压缩文件而不删除要删除的文件,然后将其重命名为原始文件名。 在 python 2.4 中,ZipInfo 类有一个属性 file_offset,因此可以
我知道,我知道,谁会想在java中压缩或解压缩大文件。完全不合理。暂时不要怀疑,假设我有充分的理由解压缩一个大的 zip 文件。 问题 1:ZipFile有一个bug (bug # 6280693)
目前,我的应用程序将对磁盘上的文件列表执行压缩过程,并允许用户作为备份目的的电子邮件附件发送。 为了具有数据损坏检测能力,我使用以下方法生成校验和 public static long getChec
似乎 zipfile.ZipFile 需要随机访问,而 urllib2 返回的“类似文件”对象不支持该随机访问。 我尝试用 io.BufferedRandom 包装它,但得到: AttributeEr
我试图从 zip 文件获取输入流,然后将其添加到另一个 zip 文件,但它抛出空指针异常。这是我的代码。 ZipParameters parameters = new ZipParame
我正在解压缩 Zip 文件。由于有两种类型的存档 - Zip 和 GZip。 我正在使用以下内容 ZipFile zipFile = new ZipFile(file, ZipFile.OPEN_RE
我很难理解 zipfile 模块的 zipfile.ZIP_DEFLATED 和 zipfile.ZIP_STORED 压缩模式之间的区别。 最佳答案 ZIP_DEFLATED 对应于压缩(或缩小)的
我有一个 1.4GB 的 zip 文件,正在尝试连续生成每个成员。 zipfile 模块不断抛出 BadZipfile 异常,指出 "zipfile.BadZipfile: zipfiles that
我正在尝试将消息(字符串)压缩到 zip 文件中,然后将其设置为 Apache Camel 中交换对象的主体,以便下游服务之一(也使用 Apache Camel)能够使用 exchange.getIn
我正在尝试获取一个 python Zip 模块来压缩数据。 但它所做的只是抛出一个错误: with ZipFile(O_file7,mode='w',compression=ZipFile.ZIP_D
我想获取压缩文件夹内文件的创建日期。 我知道如果没有 zip,这可以通过使用 os.path.getctime() 来实现可以使用 ZipInfo.date_time 提取压缩文件夹内文件的函数和上次
如何在 C# 中提取 ZipFile?(ZipFile 是包含文件和目录) 最佳答案 为此使用工具。类似于 SharpZip .据我所知 - .NET 不支持开箱即用的 ZIP 文件。 来自 here
我有这个 Java 方法来上传文件。我试图通过将该文件夹压缩成一个 zip 文件并上传它来迎合尝试上传文件夹的用户。出于某种原因,就我而言 file.isDirectory()和 file.isFil
我有一个 Path 可以在虚拟文件系统 (jimfs) 上压缩文件,我需要使用 ZipFile 打开这个 zip 文件。 但是 ZipFile 中没有构造函数来获取 Path 作为参数,只有 File
我是一名新手,正在尝试了解如何使用 uuencode 方法。我们有一个表单,只允许上传一个文本文件。现在看起来只有 zip 文件会被上传。我试图包含 uuencode 方法以将字节转换为字符串,这样我
我是一名优秀的程序员,十分优秀!