gpt4 book ai didi

r - 如何在具有不同名称的列上使用连接?

转载 作者:行者123 更新时间:2023-12-04 12:29:34 26 4
gpt4 key购买 nike

我正在尝试使用 plyr 库中的连接,但我的列有不同的名称。我按国家加入。一个国家/地区和另一个国家/地区(大小写不同)。

命令

foo <- join(ie, geo, by="Country")

给我这个错误:

Error in [.data.frame(x, by) : undefined columns selected

如何修改 by 参数来连接两个不同的列名?

最佳答案

根据文档,这似乎是不可能的。正如评论中指出的那样,基本函数 merge 将使用 by.x = "Country"by.y = "country" 来处理这个问题,但合并速度很慢。我认为最好的选择是重命名其中一列(如果需要,可以在连接后改回名称)。

还可以考虑使用 dplyr 中的连接函数,它比 plyr 中的连接函数更快,例如

> system.time(x<-inner_join(baseball, baseball, by = "id"))
user system elapsed
0.037 0.000 0.037
> system.time(x<-join(baseball, baseball, by = "id"))
user system elapsed
0.943 0.002 0.945
>

关于r - 如何在具有不同名称的列上使用连接?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24296375/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com