gpt4 book ai didi

python - 在不加载的情况下计算 gzipped tsv 的列

转载 作者:行者123 更新时间:2023-11-28 22:24:29 25 4
gpt4 key购买 nike

我有一个很大的制表符分隔的文件,该文件已被 gzip 压缩,我想知道它有多少列。对于小文件,我可以解压缩并读入 python,对于大文件,这很慢。有没有一种方法可以在不将文件加载到 python 的情况下快速计算列数?

Effeciently counting number of columns of text file几乎相同,但由于我的文件是压缩的,所以只阅读第一行是行不通的。有没有办法让 python 有效地解压缩到足以阅读第一行?

最佳答案

... but since my files are gzipped just reading the first line won't work.

是的。

import csv
import gzip

with gzip.open('file.tsv.gz', 'rt') as gzf:
reader = csv.reader(gzf, dialect=csv.excel_tab)
print(len(next(reader)))

关于python - 在不加载的情况下计算 gzipped tsv 的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46356071/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com