gpt4 book ai didi

r - 如何在R中的巨大数据集中计算两个变量的相关性?

转载 作者:行者123 更新时间:2023-12-04 09:22:50 27 4
gpt4 key购买 nike

我有一个巨大的数据集,其中有六列(分别称为A,B,C,D,E,F),大约有450,000行。我只是试图找到AB列之间的相关性:

cor(A, B)

我得到了

[1] NA



因此。我该怎么做才能解决此问题?

最佳答案

尝试cor(A,B, use = "pairwise.complete.obs")。这将忽略您的观察结果中的NA。

为了严格统计,您还应该查看数据中缺失条目的数量,并查看随机假设的缺失是否成立。

编辑1:看一看?cor以查看use参数的其他选项。

关于r - 如何在R中的巨大数据集中计算两个变量的相关性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7551142/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com