gpt4 book ai didi

r - R中的多元K-S检验

转载 作者:行者123 更新时间:2023-12-03 20:20:21 25 4
gpt4 key购买 nike

因此,我们可以运行 K-S 测试来评估我们在 dtwo 数据集的分布上是否存在差异,如 here 所述。 .

所以让我们获取以下数据

set.seed(123)
N <- 1000
var1 <- runif(N, min=0, max=0.5)
var2 <- runif(N, min=0.3, max=0.7)
var3 <- rbinom(n=N, size=1, prob = 0.45)

df <- data.frame(var1, var2, var3)

然后我们可以根据 var3 结果分开
df.1 <- subset(df, var3 == 1)
df.2 <- subset(df, var3 == 0)

现在我们可以运行 Kolmogorov-Smirnov 检验来检验每个单独变量的分布差异。
ks.test(jitter(df.1$var1), jitter(df.2$var1))
ks.test(jitter(df.1$var2), jitter(df.2$var2))

不出所料,我们没有发现差异,可以假设不同的数据集来自相同的分布。这可以通过以下方式可视化:
plot(ecdf(df.1$var1), col=2)
lines(ecdf(df.2$var1))

plot(ecdf(df.1$var2), col=3)
lines(ecdf(df.2$var2), col=4)

但是现在我们要考虑是否 var3==0之间的分布和 var3==1当我们同时考虑 var1 时会有所不同& var2一起。
当我们有多个预测变量时,是否有 R 包来运行这样的测试

提出了类似的问题 here ,但尚未收到任何答复

似乎有一些文献:
Example 1
Example 2

但似乎没有任何与 R 相关的内容

最佳答案

Peacock, J. A. (1983) 中讨论了二维 KS 检验。天文学中的二维拟合优度测试。皇家天文学会月刊,202(3),615-627。 https://doi.org/10.1093/mnras/202.3.615
有一个实现,https://cran.r-project.org/web/packages/Peacock.test/

关于r - R中的多元K-S检验,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31563369/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com