gpt4 book ai didi

python - QVD 文件到 pandas DataFrame

转载 作者:行者123 更新时间:2023-12-03 08:22:03 25 4
gpt4 key购买 nike

我尝试使用此 tool 将 QVD 文件加载到 pandas 数据帧中如下面的脚本所示。问题是它工作得很好,但没有优化,而且它只提供了一种通过索引获取行的方法,这就是为什么我被迫使用 for 循环。

因此,随着行数的增加,复杂性也会增加。我发现 qvd.getRow() 函数会导致复杂性,但我找不到任何其他方法来解析 QVD 文件。我正在寻找这样的工具,但效率更高,尤其是在我处理一些大约 1M 记录的文件时。


import qvdfile.qvdfile
import pandas as pd

qvd = qvdfile.QvdFile ("file.qvd")

df = pd.DataFrame(columns=qvd.getRow(0).keys())
cols = list(qvd.getRow(0).keys())

for r in range(int(qvd.attribs["NoOfRecords"])):
df = pd.concat([df, pd.DataFrame([qvd.getRow(r)], columns=cols)], ignore_index=True)

最佳答案

我认为这个项目应该可以解决您的性能问题:https://pypi.org/project/qvd/

我能够在大约 15 秒内读取 75 万行、55 列。

pip install qvd

from qvd import qvd_reader

df = qvd_reader.read('test.qvd')
print(df)

关于python - QVD 文件到 pandas DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67543025/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com