r - 对多个变量执行卡方检验并提取 R 中的相关 p 值-6ren

r - 对多个变量执行卡方检验并提取 R 中的相关 p 值

转载作者：行者123 更新时间：2023-12-04 02:22:57

25

4

好的，直接回答问题。我有一个包含大量分类变量的数据库。

具有以下几个变量的示例数据库

gender <- as.factor(sample( letters[6:7], 100, replace=TRUE, prob=c(0.2, 0.8) ))    
smoking <- as.factor(sample(c(0,1),size=100,replace=T,prob=c(0.6,0.4)))    
alcohol <- as.factor(sample(c(0,1),size=100,replace=T,prob=c(0.3,0.7)))    
htn <- as.factor(sample(c(0,1),size=100,replace=T,prob=c(0.2,0.8)))    
tertile <- as.factor(sample(c(1,2,3),size=100,replace=T,prob=c(0.3,0.3,0.4)))    
df <- as.data.frame(cbind(gender,smoking,alcohol,htn,tertile))

我想使用卡方检验来检验这个假设，即吸烟者、酒精使用、高血压 (htn) 等的比例存在差异(3 个因素)。然后我想提取每个变量的 p 值。

现在我知道我可以使用 2 x 3 交叉表来测试每个单独的变量，但是有没有更有效的代码可以一次性导出所有变量的测试统计量和 p 值，并提取每个变量的 p 值

提前致谢

阿诺普

最佳答案

如果你想在一个语句中进行所有的比较，你可以这样做

mapply(function(x, y) chisq.test(x, y)$p.value, df[, -5], MoreArgs=list(df[,5]))
#    gender   smoking   alcohol       htn 
# 0.4967724 0.8251178 0.5008898 0.3775083

当然，以这种方式进行测试在统计上有些低效，因为您在这里进行了多次测试，因此需要进行一些校正以保持适当的 1 类错误率。

关于r - 对多个变量执行卡方检验并提取 R 中的相关 p 值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26107287/

25

4

0

文章推荐： web-services - 服务可以在其代码中调用另一个服务吗？

文章推荐： gruntjs - Grunt 将每个目录中的所有 .less 编译为 .css

文章推荐： c# - 从 app.config 中的值创建 map

文章推荐： jekyll - 包含文件并将它们复制到输出

稳健的独立 T 检验
这是我第一次提问，对于任何格式问题或任何让我难以回答的问题，我深表歉意。请让我知道我需要添加什么才能回答问题。我正在尝试比较 2 个不相等的组大小(一个 ~ 97，另一个 ~ 714)之间的差异。差
r - 对由变量分隔的数据框的所有列应用 t 检验
这个问题在这里已经有了答案: dplyr summarize across ttest (1 个回答) 关闭 5 个月前。我有这样的数据框 X1 X2 X3 X4 X5 class 1 1
r - 有没有办法对不同长度的变量进行 wilcoxon 检验？
我正在尝试对数据框中的两个数据子集运行 wilcox.test()。它们的长度不相等(48 对 260)。我想看看活橡树和水橡树的 dbh(胸高直径)是否存在差异。 Pine_stand 并收到该错
r - 对按因子拆分的数据帧中的许多列应用 t 检验
我有一个带有两个级别的因子列和许多数字列的数据框。我想按因子列拆分数据帧并对列对进行 t 检验。使用示例数据集 Puromycin 我希望结果看起来像这样: Variable Treated
R:对所有列进行 t 检验
我尝试对数据框的所有列(一次两列)进行 t 检验，并仅提取 p 值。这是我想出的: for (i in c(5:525) ) { t_test_p.value =sapply( Data[5:525]
python - 用于比较多个数据列的循环 T 检验
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列，而无需为每个列对组合手动编写代码？ from scipy.stats
r - 映射嵌套列并计算两组之间的 t 检验
我有一些数据，如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
r - 同一数据集中定义行之间的 T 检验
这就是我的数据的样子: > dput(data) structure(list(Name = c("Mark", "Tere", "Marcus", "Heidi", "Georg", "Tieme"
python - 用于比较多个数据列的循环 T 检验
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列，而无需为每个列对组合手动编写代码？ from scipy.stats
r - 映射嵌套列并计算两组之间的 t 检验
我有一些数据，如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
python - 实现对数正态拟合的 KS 检验
所以我有一些股票价格数据，我想测试价格是否遵循对数正态分布。我的代码如下: import scipy.stats as stats print(stats.kstest(df['DJIA'], "lo
r - 如何针对某些特定值对面板数据回归系数执行联合 Wald 检验？
我想对我的固定效应回归系数进行简单的联合 Wald 检验，但我想将限制设置为非零值。更具体地说，我想测试:H0: ai=0 and b=1 for every i或者基本上，是否从固定效应模型 (ai
python - Python 中每一行的两个样本 t 检验
我正在尝试进行双样本 t 检验，以检查两个数据集之间的均值是否存在显着差异。我有两个数据集，每个数据集有 5 个试验，每个试验有 3 个特征。每个 Trial 都有不同的唯一标签，但 3 个特征(X
r - R 中的折刀配对 t 检验
考虑以下虚拟数据: x <- rnorm(15,mean = 3,sd = 1) y <- rnorm(15,mean = 3,sd = 1) xy <- c(x,y) factor <- c(rep
algorithm - 卡迈克尔数的 Rabin-Miller 检验
我是一名计算机科学专业的学生，我正在自学算法类(class)。在类(class)中我看到了这个问题: Show an efficient randomized algorithm to fact
r - R 中两个模型的 f 检验
我想使用拟合我的数据的 f 检验来比较两个模型。对于每个模型，我都执行了蒙特卡洛模拟，为每个模型参数和均方根拟合误差提供了统计估计。我想在 R 中使用 f-test 来确定哪个模型更可取。最佳答案
r - 使用卡方数据的 Kolmogorov-Smirnov 检验
我很难让 ks.test 使用卡方分布式数据: > chi10 ks.test(chi10, dchisq, df=10) One-sample Kolmogorov-Smirnov tes
R Box 的同方差性 M 检验
我试图在 R 中复制 SPSS 的线性判别分析输出，但我很难找到执行 m-box 测试的方法。我唯一找到的是一些发布在论坛上的代码，用于手动实现该过程，但我想知道语言本身是否已经包含用于此目的的任何
R:在所有可能的变量组合之间执行 Cohen's Kappa 检验
我有以下数据框: structure(list(test1 = c(0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1), test2 = c(0, 0, 1, 1, 0,
r - Kruskal-Wallis 检验，包含成对比较的详细信息
标准 stats::kruskal.test 模块允许计算数据集上的 kruskal-wallis 测试: >>> data(diamonds) >>> kruskal.test(price~cara

首页

博学

6Ren·AI

商城

r - 对多个变量执行卡方检验并提取 R 中的相关 p 值