gpt4 book ai didi

python - 从 Python Panda 到交叉过滤器的列平均值计算不正确

转载 作者:太空宇宙 更新时间:2023-11-03 18:17:32 25 4
gpt4 key购买 nike

我希望你能原谅我...我的标题可能有点误导。这些列计算正确...但不是我希望的方式。

我拥有的是一个城市 10 年前每小时的天气测量数据(温度、降水等)。然后,我创建了一个数据框,将每个指标的平均值添加为每个小时的自己的列。

然后将该数据集输入到 dc.js 中,我在其中根据不同图表的需要进行聚合。

除了 precipitation 之外,一切都很好(以英寸来算)。简单地取每小时平均值是没有意义的...我需要总和,然后是平均值...但是我需要在每次汇总时处理这种情况吗? (月、年等)

我对如何做到这一点有点困惑。下面是我的 ipython 笔记本的链接,其中包含我的简短注释代码。非常感谢任何帮助

http://nbviewer.ipython.org/gist/Luiz-N/96477b1e327169d010c6

最佳答案

啊,你评论中的最新图片现在有意义了。

enter image description here如果此图表是独立的(意味着它不需要反射(reflect)其他过滤器),您可以尝试预处理每月平均值,然后将该平均值添加到您的组总和中。

    function reduceAdd(p, v) {
p.average = monthlyPrecip(v.month);
p.actual += v.precip;
return p;
}

function reduceRemove(p, v) {
p.actual -= v.precip;
return p;

}

function reduceInitial() {
return {actual: 0, average: 0};
}

从那里,您可以使用两个数据点构建复合图表。

这听起来像您正在寻找的吗?

关于python - 从 Python Panda 到交叉过滤器的列平均值计算不正确,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24771620/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com