gpt4 book ai didi

python - 如何使用 Windows 从 tar 文件中读取特定文件?

转载 作者:行者123 更新时间:2023-12-04 08:51:13 26 4
gpt4 key购买 nike

我有一个 tar 文件,其中压缩了几个文件。我需要使用 pandas 读取一个特定文件(它是 csv 格式)。我尝试使用以下代码:

import tarfile
tar = tarfile.open('my_files.tar', 'r:gz')
f = tar.extractfile('some_files/need_to_be_read.csv')

import pandas as pd
df = pd.read_csv(f.read())
但它会引发以下错误:
OSError: Expected file path name or file-like object, got <class 'bytes'> type
在代码的最后一行。我该如何去阅读这个文件?

最佳答案

当您调用 pandas.read_csv() ,你需要给它一个文件名或类似文件的对象。 tar.extractfile()返回一个类似文件的对象。不要将文件读入内存,而是将文件传递给 Pandas。
所以删除 .read()部分:

import tarfile
tar = tarfile.open('my_files.tar', 'r:gz')
f = tar.extractfile('some_files/need_to_be_read.csv')

import pandas as pd
df = pd.read_csv(f)

关于python - 如何使用 Windows 从 tar 文件中读取特定文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64094705/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com