gpt4 book ai didi

r - 从数据集中删除重复项后无法保留所有变量

转载 作者:行者123 更新时间:2023-12-04 00:58:36 26 4
gpt4 key购买 nike

因此,我导入了一个包含 178 个观测值和 8 个变量的数据集。最终目标是消除三个变量(2、5 和 6)中相同的所有观察结果。事实证明,使用独特的命令这非常容易。

mav2 <- unique(mav[,c(2,5,6)])

生成的 mav2 数据框产生了 55 个观察结果,消除了所有重复项!不幸的是,它还删除了我在 unique 命令中未使用的其他五个变量(1、3、4、7 和 8)。我最初尝试添加两个数据框,当然这不起作用,因为它们的大小不相等。我也尝试过将两者合并,但这失败了,只给出了第一个数据集的输出以及所有 178 个观察值。

第二个数据集 (mav2) 确实生成了一个新列 (row.names),它是初始数据集中每个观测值的行号。

如果有人可以帮助我将所有 8 个初始变量放入只有 55 个独特观察值的数据集中,我将非常感激。提前致谢。

最佳答案

我认为您想要的是duplicated,一个类似于unique的函数,它返回重复元素的索引。

所以

mav2 <- mav[!duplicated(mav[,c(2,5,6)]),]

编辑:重复的倒置意义

关于r - 从数据集中删除重复项后无法保留所有变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31148152/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com