gpt4 book ai didi

python - 在 python 脚本中读取 tar 文件内容而不解压缩它

转载 作者:IT老高 更新时间:2023-10-28 21:37:01 25 4
gpt4 key购买 nike

我有一个 tar 文件,里面有很多文件。我需要编写一个 python 脚本,它将读取文件的内容并给出总字符数,包括字母总数、空格、换行符等所有内容,而无需解压缩 tar 文件。

最佳答案

你可以使用 getmembers()

>>> import  tarfile
>>> tar = tarfile.open("test.tar")
>>> tar.getmembers()

之后,您可以使用 extractfile() 将成员提取为文件对象。只是一个例子

import tarfile,os
import sys
os.chdir("/tmp/foo")
tar = tarfile.open("test.tar")
for member in tar.getmembers():
f=tar.extractfile(member)
content=f.read()
print "%s has %d newlines" %(member, content.count("\n"))
print "%s has %d spaces" % (member,content.count(" "))
print "%s has %d characters" % (member, len(content))
sys.exit()
tar.close()

通过上例中的文件对象f,可以使用read()readlines()

关于python - 在 python 脚本中读取 tar 文件内容而不解压缩它,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2018512/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com