- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 csv 文件,其中包含每年和每个气象站的降水数据。它看起来像这样:
station_id year Sum
210018 1916 65.024
210018 1917 35.941
210018 1918 28.448
210018 1919 68.58
210018 1920 31.115
215400 1916 44.958
215400 1917 31.496
215400 1918 38.989
215400 1919 74.93
215400 1920 53.5432
我想根据唯一的站点 ID 返回 Kendall 的 tau 相关性和 p 值。因此,对于上面的内容,我想要站点 ID 210018 和 215400 的总和与年份之间的相关性。
station_id 210018 的相关性将为 -.20,p 值为 .62,而 station_id 215400 的相关性将为 .40,p 值为 .33。
我正在尝试使用这个:
grouped=df.groupby(['station_id'])
grouped.aggregate([tau, p_value=sp.stats.kendalltau(df.year, df.Sum)])
返回的错误是p_value后面等号的语法错误。
如有任何帮助,我们将不胜感激。
最佳答案
一种计算方法是在 groupby
对象上使用 apply
:
>>> import scipy.stats as st
>>> df.groupby(['station_id']).apply(lambda x: st.kendalltau(x['year'], x['Sum']))
station_id
210018 (-0.2, 0.62420612399)
215400 (0.4, 0.327186890661)
dtype: object
关于python - 使用 scipy 和 groupby 计算 Kendall 的 tau,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28974425/
我现在正尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名集。 我被要求遵循特定文档的说明。在文档中指出: “Kendall 距离将来自两个排名的项目之间的成对差异计算为: 在哪里
我刚开始使用 R,想使用 modifiedmk 包对月度地下水位数据进行测试。我的数据框 (GL) 看起来像这样 GL well year month value 684 19
这个问题在这里已经有了答案: Kendall tau distance (a.k.a bubble-sort distance) between permutations in base R (3
我正在尝试根据我的数据计算 Kendall 一致性系数 (W)。有没有人知道在 Python 包中实现的函数,如在 R 的“纯素”包中(http://cc.oulu.fi/~jarioksa/soft
我有一组 46 年的降雨数据。它采用 46 个 numpy 数组的形式,每个数组的形状为 145, 192,因此每年在给定模型的每个纬度和经度坐标处都是不同的最大降雨量数据数组。 我需要通过对 46
如何在不加载额外库的情况下在 R 中计算两个排列之间的 Kendall tau 距离(又名冒泡排序距离)? 最佳答案 这是一个 O(n.log(n)) 的实现,在阅读后拼凑而成,但我怀疑可能有更好的
我有一个 csv 文件,其中包含每年和每个气象站的降水数据。它看起来像这样: station_id year Sum 210018 1916 65.024 2
是否有任何 R 包用于计算 Kendall 的 tau-b 和 tau-c 及其相关的标准误差?我在 Google 和 Rseek 上的搜索一无所获,但肯定有人在 R 中实现了这些。 最佳答案 今天偶
我是一名优秀的程序员,十分优秀!