gpt4 book ai didi

python - Blaza 和 Pandas 的大数据

转载 作者:行者123 更新时间:2023-11-30 23:05:11 26 4
gpt4 key购买 nike

我想知道这种方法对于项目来说是否太过杀伤力。我有一个 4GB 的文件,显然我的电脑无法处理。使用 Blaze 将文件分割成更易于管理的文件大小并使用 pandas 打开并使用 Bokeh 进行可视化会不会太过分?

我知道 Pandas 有一个“ block ”功能,但我想拆分它们的原因是因为有与我需要分析的特定名称相关的特定行。

您是否会采取不同的方法,既不会使我的笔记本电脑崩溃,又不需要设置 Hadoop 或任何 AWS 服务?

最佳答案

Pandas 分块使用 pd.read_csv(..., chunksize=...) 效果很好。

或者dask.dataframe模仿 Pandas 界面并为您处理分块。

关于python - Blaza 和 Pandas 的大数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33294734/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com