gpt4 book ai didi

python - 通过 Rpy 排序分位数平均值

转载 作者:行者123 更新时间:2023-11-28 21:30:12 26 4
gpt4 key购买 nike

这里的真正目标是在Python中找到分位数平均值(或总和,或中位数等)。由于我不是 Python 的高级用户,但已经使用 R 一段时间了,所以我选择的路线是通过 Rpy。但是,我遇到了以下问题:返回的均值列表与分位数的顺序不对应。特别是,我在 R 中有以下内容:

> a = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
> b = c(2, 4, 20, 40, 200, 400, 2000, 4000, 20000, 40000)
> prob = seq(0,5)/5
> br = quantile(a,prob)
> rcut = cut(a, br, include.lowest = TRUE)
> quintile_means = tapply(b, rcut, mean)
> quintile_means
[1,2.8] (2.8,4.6] (4.6,6.4] (6.4,8.2] (8.2,10]
3 30 300 3000 30000

这一切都非常好。但是,如果我将代码翻译成 Rpy,我得到

>>> import rpy
>>> from rpy import r
>>> a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> b = [2, 4, 20, 40, 200, 400, 2000, 4000, 20000, 40000]
>>> prob = [ x / 5.0 for x in range(6)]
>>> br = r.quantile(a, prob)
>>> rcut = r.cut(a, br, include_lowest=r.TRUE)
>>> quintile_means = r.tapply(b, rcut, r.mean)
>>> print quintile_means
[30.0, 300.0, 3000.0, 30000.0, 3.0]

请注意,最终列表的顺序是错误的(我们知道这一点是因为 ab 在这种情况下都是有序的)。一般来说,我无法恢复 Rpy 中从最低分位数到最高分位数的正确顺序。有什么建议吗?

此外(不是替代,因为我想知道上述问题的答案),如果您能建议一种直接在 python 中执行分析的方法,那就太好了。 (我没有安装 numpy 或 scipy。)谢谢!

编辑:澄清一下,ab 成对但不一定有序。例如,a是眼睛的大小,b是 Nose 的大小。我试图找出 a 的各个分位数,记者有什么手段b s。谢谢。

最佳答案

尝试 rpy2。

对于 rpy2 >= 2.1.0,这可能是:

from rpy2.robjects.vectors import IntVector
from rpy2.robjects.packages import importr
base = importr('base')
stats = importr('stats')

a = IntVector((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))
b = IntVector((2, 4, 20, 40, 200, 400, 2000, 4000, 20000, 40000))
prob = base.seq(0,5).ro / 5
br = stats.quantile(a,prob)
rcut = base.cut(a, br, include_lowest = True)
quintile_means = base.tapply(b, rcut, stats.mean)
print(quintile_means)

关于python - 通过 Rpy 排序分位数平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3530896/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com