gpt4 book ai didi

python - Pandas:如何加载包含多个 txt 文件的 zip 文件?

转载 作者:太空狗 更新时间:2023-10-30 02:08:24 24 4
gpt4 key购买 nike

我的路径中存储了很多 zip 文件

  • mypath/data1.zip
  • mypath/data2.zip
  • 等等

每个 zip 文件包含三个不同的 txt 文件。例如,在 data1.zip 中有:

  • data1_a.txt
  • data1_b.txt
  • data1_c.txt

我需要从每个压缩文件加载datai_c.txt(即data1_c.txtdata2_c.txt data3_c.txt 等)并将它们连接成一个数据框。

不幸的是,我无法使用 read_csv 这样做,因为它只适用于单个压缩文件。

有什么办法吗?谢谢!

最佳答案

因此您需要一些其他代码才能进入 zip 文件。以下是 O'Reilly 的 Python Cookbook

修改后的代码
import zipfile
import pandas as pd
## make up some data for example
x = pd.DataFrame({"A": [1, 2], "B": [3, 4]})
x.to_csv('a.txt', sep="|", index=False)
(x * 2).to_csv('b.txt', sep="|", index=False)

with zipfile.ZipFile('zipfile.zip', 'w') as myzip:
myzip.write('a.txt')
myzip.write('b.txt')
for filename in z.namelist( ): print 'File:', filename,
insideDF = pd.read_csv(StringIO(z.read(filename)))
df = pd.concat([df, insideDF])
print df

关于python - Pandas:如何加载包含多个 txt 文件的 zip 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43496195/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com