gpt4 book ai didi

matlab - 为什么 Matlab signrank 函数在翻转数据点的符号时返回相同的符号秩统计值?

转载 作者:太空宇宙 更新时间:2023-11-03 20:30:36 25 4
gpt4 key购买 nike

为什么翻转数据点的符号时,Matlab signrank 函数返回相同的带符号秩统计值?

我有一个数据点序列存储在向量 x 中。我使用 signrank(x) 进行符号等级测试。

Matlab 说

When you use the test for one sample, then W is the sum of the ranks of positive differences between the observations and the hypothesized median value M0 (which is 0 when you use signrank(x) and m when you use signrank(x,m)).

所以我认为结果signrank(x)signrank(-x) 应该是不同的。但是我经历过一些例子,对于x-x我得到了相同的符号秩统计值。Matlab signrank 函数中的符号秩统计是如何定义的?

谢谢!

最佳答案

谢谢!实际上统计量是正差异等级之和与负差异等级之和之间的最小值。我不明白为什么它需要最低限度。你呢?

有趣的问题,感谢您提供指向 matlab 代码的链接。是的,这也让我挠头了几分钟,他们肯定是 curl 的方式,大概是为了提高计算效率。然而,令人惊讶的是,它实际上确实按照之前发布的那样进行签名排序。

这是它的工作原理(我已经在下面粘贴了相关的几行代码以供引用)。

让我将 P 表示为所有正排名的总和(对应于正分数的排名),N 表示所有负排名的总和,最后 A 作为所有等级的绝对总和。显然 A = P + N(顺便说一句。请注意,我在实际代码中表示为“N”的是变量“w”。)

通过算术级数,A = n*(n+1)/2。所以正如你所说, min(w,(n+1)*n/2-w) 这行实际上返回的是 NP (=A-N),以最小者为准。

但现在看看我粘贴在下面的代码的最后一行。因此,分子为 min(N,P) - A/2

现在,如果 N 是最小值,则返回 N-(P+N)/2,等于 -(P - N)/2 .

但是,如果 P 是最小值,则返回 P-(P+N)/2,等于 -(N - P)/2 .

因此,无论哪种情况,它实际上都返回正负秩和的绝对差值(负数),正如之前以简化形式发布的那样,

| Sum{ sign(Xi) rank(|Xi|) } |

顺便说一句。他们使用绝对差的负数的原因很简单,这样他们就不必在以后寻找互补差价合约。

signrank 代码片段供引用。

w = sum(tierank(neg));
w = min(w, n*(n+1)/2-w);
...
z = (w-n*(n+1)/4) / sqrt((n*(n+1)*(2*n+1) - tieadj)/24);

编辑:

为什么取绝对值? z要有渐近正态性,不是应该不取绝对值吗?

我对它的理解是它实际上不是正常的,它是“折叠正常”。即折叠成正半平面。这就是为什么 p 值被计算为,

p = 2*(1 - normcdf(z,0,1));

(旁白)。我知道在实际代码中他们使用“z”的负数以避免在那里需要 cdf-complement,但这是一回事。

p 值乘以 2 以解释折叠分布。方便的是,这也与称其为“双尾”p 值的结果完全相同。

想一想如果我们在这里不使用绝对值会发生什么。假设我们采用了 P-N 并且 N 大于 P。在这种情况下,p 值 2*(1-normcdf(z,0,1)) 的计算结果为大于,所以这不是一个好主意。 :)

关于matlab - 为什么 Matlab signrank 函数在翻转数据点的符号时返回相同的符号秩统计值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16089523/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com