gpt4 book ai didi

r - R和Stata的合并命令比较

转载 作者:行者123 更新时间:2023-12-01 16:28:23 24 4
gpt4 key购买 nike

作为 R 用户,我现在正在使用 this 学习 Stata资源,并且对 merge 命令感到困惑。

在 R 中,我不必担心错误地合并数据,因为它无论如何都会合并所有内容。我不需要担心公共(public)列是否包含任何重复项,因为 Y 数据帧将合并到 X 数据帧中的每个重复行。 (在合并中使用all=FALSE)

但对于 Stata,我需要在继续合并之前从 X 中删除重复的行。

Stata 中是否假设,为了进行合并,主表中的公共(public)列必须是唯一的?

最佳答案

您的问题的答案是否定的。我会尽力解释原因。

您提到的链接仅涵盖 Stata 可能的一种合并类型,即一对多合并。

使用文件名合并 1:m varlist

其他类型的合并也是可能的:

对指定关键变量进行一对一合并

使用文件名合并 1:1 varlist

指定关键变量的多对一合并

使用文件名合并 m:1 varlist

指定关键变量的多对多合并

使用文件名合并 m:m varlist

通过观察进行一对一合并

使用文件名 1:1 _n 合并

详细信息、解释和示例可以在帮助合并中找到。

如果您不知道数据集中的观测值是否唯一,可以执行以下检查:

bysort idvar: gen N = _N

taN

如果您发现 N 的值大于 1,您就知道观测值相对于 idvar 并不唯一。

这实际上是 Stata 11 中引入的 merge 命令的新语法。在 Stata 11 之前,merge 命令稍微简单一些。您只需对数据进行排序,然后您可以执行以下操作:

使用文件名合并变量列表

顺便说一句,您仍然可以在 Stata 11 或更高版本中使用这种旧语法。

关于r - R和Stata的合并命令比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7330615/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com