gpt4 book ai didi

python - 构造由不同 block 组成的 pandas.DataFrame 的最佳方法

转载 作者:太空宇宙 更新时间:2023-11-03 19:20:53 25 4
gpt4 key购买 nike

我正在批量运行日常模拟:我进行 365 次模拟以获得全年的结果。每次运行后,我想从结果中提取一些数组并将它们添加到 pandas.DataFrame 中以供稍后分析。

我有一个粗略的模型(正在进行优化)和一个用于后模拟的更精确的模型,因此我可以从两个来源获得相同的变量。如果完成后仿真,结果可能会覆盖优化结果。
为了使其更复杂,优化模型具有较小的输出间隔,具体取决于离散化设置,但最终分析将在后模拟的较大间隔上进行)。

构建此 DataFrame 的最佳方法是什么?

这是我的第一个方法:

  1. 为全年创建一个空的 DataFrame df,其中 DateRange 索引具有较大的模拟后间隔(=15 分钟)
  2. 优化1天==>创建临时df_temp,以DateRange作为索引,间隔较小
  3. 按照描述将此 DataFrame 采样至 15 分钟 here :
  4. df_temp 更新 df (df 中的行仍然是空的,除了上次运行的最后一行,所以我必须取df_temp[1:])
  5. 在同一天进行模拟 ==> 创建临时 df_temp2,间隔 = 15 分钟
  6. df_temp2 覆盖 df 中的相应行

在步骤 4) 和 6) 中我应该使用哪些方法?或者从一开始就有更好的方法吗?谢谢,罗尔

最佳答案

我认为使用DataFrame.combine_first可能是一种可行的方法,但根据数据的规模,使用像“update”这样仅修改特定内容的方法可能更有用现有 DataFrame 中的行。 combine_first 更为通用,可能导致结果的大小与任一输入的大小不同(因为索引将合并在一起)。

https://github.com/pydata/pandas/issues/961

关于python - 构造由不同 block 组成的 pandas.DataFrame 的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9794697/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com