gpt4 book ai didi

python - 何时使用 pandas 系列、numpy ndarrays 或简单的 python 字典?

转载 作者:太空狗 更新时间:2023-10-29 17:11:17 24 4
gpt4 key购买 nike

我刚开始学习 Python 及其一些库(numpy、pandas)。

我找到了很多关于 如何 numpy ndarrays、pandas 系列和 python 字典工作的文档。

但由于我对 Python 缺乏经验,我很难确定何时使用它们中的每一个。而且我还没有找到任何可以帮助我理解和决定何时最好使用每种数据结构的最佳实践。

一般来说,是否有任何最佳实践来决定应将特定数据集加载到这三种数据结构中的哪一种(如果有)?

最佳答案

我通常采用的经验法则:使用仍能满足您需求的最简单的数据结构。如果我们将数据结构从最简单到最不简单进行排序,结果通常是这样的:

  1. 字典/列表
  2. Numpy 数组
  3. Pandas 系列/数据框

所以首先考虑字典/列表。如果这些允许您执行所需的所有数据操作,那么一切都很好。如果没有,开始考虑 numpy 数组。转向 numpy 数组的一些典型原因是:

  • 您的数据是二维的(或更高维的)。虽然嵌套字典/列表可以用来表示多维数据,但在大多数情况下,numpy 数组会更有效。
  • 你必须进行大量的数值计算。正如 zhqiat 已经指出的那样,在这种情况下,numpy 将提供显着的加速。此外,numpy 数组与大量 mathematical functions 捆绑在一起。 .

还有一些超越 numpy 数组并转向更复杂但也更强大的 pandas 系列/数据帧的典型原因:

  • 您必须将多个数据集相互合并,或者对数据进行 reshape /重新排序。 This diagram很好地概述了 pandas 允许您执行的所有“数据整理”操作。
  • 您必须从特定文件格式(如 Excel、HDF5 或 SQL)导入或导出数据。 Pandas自带方便import/export functions为此。

关于python - 何时使用 pandas 系列、numpy ndarrays 或简单的 python 字典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45285743/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com