gpt4 book ai didi

r - 合并 R 保留数据集的所有行

转载 作者:行者123 更新时间:2023-12-04 12:20:39 25 4
gpt4 key购买 nike

我有两个数据框

distinct_paper_year_data:

author_id      distinct_paper_year_count
1 3
2 1
4 1
5 4

作者数据:
author_id    paper_id  confirmed
1 25733 1
2 47276 1
3 79468 1
4 12856 0

现在我想合并,以便所需的输出看起来像:
author_id  paper_id     confirmed    distinct_paper_year_count
1 25733 1 3
2 47276 1 1
3 79468 1 0
4 12856 0 4

在这我需要 author_id s 出现在表中 author_data进入最终输出。因为没有 author_id==3 的数据在distinct_paper_year_count 中, distinct_paper_year_count 的值最终结果中的列应为零(对于 author_id==3 )。

通过使用合并我得到
   merge(distinct_paper_year_data,author_data,by="author_id") 

author_id distinct_paper_year_count paper_id confirmed
1 3 25733 1
2 1 47276 1
4 1 12856 0

怎样才能达到预期的输出?

最佳答案

你需要一个外连接:

merge(distinct_paper_year_data,author_data,by="author_id", all=T)

注意:您将获得 NA对于表不匹配的那些行,例如 {3,5} 中的 author_id。也就是说,如果需要,您可以简单地修改 NA。您也可以使用 all.xall.y做一个左或右外连接。

最后退房 data.table更快的连接(和更多的功能)

关于r - 合并 R 保留数据集的所有行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22754760/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com