gpt4 book ai didi

sas - 使用 nodupkey 保留缺失值

转载 作者:行者123 更新时间:2023-12-04 02:22:39 32 4
gpt4 key购买 nike

我有一个数据库,其中一些观测值具有标识符 ident,而另一些则没有。我想创建一个新数据库,在其中删除了与我的 ident 变量重复的观察结果,但要保留缺少 ident 的观察结果。

如果我简单地做一个 proc sort nodupkey

proc sort nodupkey data=have;
by ident;
run;

然后它也消除了缺失值。有没有一种简单的方法可以做到这一点(即不破坏数据集,proc sort nodupkey one partn,然后再次组装)

最佳答案

删除重复项时您有几个选择。

首先,dupout=<dataset>proc sort 上会将所有重复项发送到另一个数据集,如果你想对它们做一些事情,你可以。但这是“破坏数据集”的后端版本,可能更快,因为它只破坏了较小的部分。

更简单的方法是自己进行重复数据删除。

proc sort data=have;
by ident;
run;

data want;
set have;
by ident;
if (first.ident) or missing(ident);
run;

这会保留每个身份的第一条记录,以及缺少身份的任何记录。

关于sas - 使用 nodupkey 保留缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26508429/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com