gpt4 book ai didi

pandas - Python中的大型枢纽分析表

转载 作者:行者123 更新时间:2023-12-01 15:49:32 27 4
gpt4 key购买 nike

我有csv格式(数字+ Unicode文本)下的100-300Go数据,需要对此进行常规数据透视表作业。谷歌搜索/ StackOverflow-ing后,找不到满意的答案(仅部分)。
想知道哪种解决方案对于单机(64Go RAM)最快?

1)转换并插入到PostGres中,然后通过SQL在PostGres DB中进行处理?
(或MySQL...。)

2)将csv加载到Pandas中的块中并手动进行一个接一个的处理?

3)加载csv +转换为HDF并按块处理HDF?

4)其他解决方案。

最佳答案

对于在单台计算机上工作,PostgreSQL可能是您列出的3个选项中最合适的。

为了检查内存使用情况,您可以使用partitioning并按块处理数据。

关于pandas - Python中的大型枢纽分析表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41540340/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com