gpt4 book ai didi

python - 无法从使用 Pandas 存储存档文件名称的 gzip 压缩文件中读取 csv 数据

转载 作者:太空宇宙 更新时间:2023-11-04 03:25:40 26 4
gpt4 key购买 nike

我正在尝试从 gzip 存档文件中读取 csv 数据,该文件还存储存档数据文件的名称。问题是 pandas.read_csv() 选择存档文件的名称并将其作为返回的 DataFrame 中的第一个数据条目返回。如何跳过存档文件的名称?我查看了 pandas.read_csv() 的所有可用选项,但找不到允许我这样做的选项。

以下是我在 python 中创建 gzip 存档文件的方法:

import pandas as pn
import numpy as np
import tarfile

a = np.ones((10, 8))
np.savetxt('ones.dat', a)
fh = tarfile.open('ones.tar.gz', 'w:gz')
fh.add('ones.dat', arcname='numpy_ones.dat')
fh.close()

f = pn.read_csv('ones.tar.gz', compression='gzip', sep='\s+', header=None)
In [32]: f
Out[32]:
0 1 2 3 4 5 6 7 8
0 numpy_ones.dat 1 1 1 1 1 1 1 1
1 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
2 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
3 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
4 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
5 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
6 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
7 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
8 1.000000000000000000e+00 1 1 1 1 1 1 1 NaN
9 NaN NaN NaN NaN NaN NaN NaN NaN NaN

我正在使用 Python 3.4.3(v3.4.3:9b73f1c3e601,2015 年 2 月 23 日,02:52:03)。 NumPy 的:'1.9.2' Pandas :'0.16.2'

非常感谢,玛莎

最佳答案

再次使用tarfile:

fh = tarfile.open('ones.tar.gz', 'r:gz')
f = fh.extractfile('numpy_ones.dat')
df = pd.read_csv(f, delim_whitespace=True, header=None)

关于python - 无法从使用 Pandas 存储存档文件名称的 gzip 压缩文件中读取 csv 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33113600/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com