gpt4 book ai didi

r - 在 R 中寻找相关性的问题

转载 作者:行者123 更新时间:2023-12-04 11:31:04 27 4
gpt4 key购买 nike

我试图在 R 中的两个独立数据集之间找到相关性。我的第一个数据集的结构是(当在 R 中使用 print(matr1) 时):

        year  month  income  
[1,] "2000" "01" "30000"
[2,] "2000" "02" "12364"
[3,] "2000" "03" "37485"
[4,] "2000" "04" "2000"
[5,] "2000" "05" "7573"

我的第二个数据集的结构是(当在 R 中使用 print(matr2) 时):

     month_year     value     
[1,] "Jan 2000" "84737476"
[2,] "Feb 2000" "39450334"
[3,] "Mar 2000" "48384943"
[4,] "Apr 2000" "12345678"
[5,] "May 2000" "49595340"

现在我想找出这两个数据集之间的相关性,但我遇到的问题是两个数据集中月份和年份的格式不同。另外,当我使用 R 命令时 cor(matr1[,"income"],matr2[,"value"]) 我得到的错误是

Error in cor(matr1[,"income"],matr2[,"value"]) : 
'x' must be numeric

所以,我的问题是:

  1. 如何消除错误?
  2. 当月份和年份的格式不同时,如何找到相关性?

任何指导都会对我有所帮助,因为我是新手。

最佳答案

在我看来,处理日期有点痛苦。但是,如果您已经知道您的行对应(即 matr1 的第 i 行中的 income 与/与 value 的月份和年份相同matr2 的同一行中),您可以非常简单地获得相关性:

cor(as.numeric(matr1[,"income"]), as.numeric(matr2[,"value"]))

关于r - 在 R 中寻找相关性的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25214740/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com