r - 如何删除所有重复项，以便 NONE 留在数据框中？-6ren

r - 如何删除所有重复项，以便 NONE 留在数据框中？

转载作者：行者123 更新时间：2023-12-03 11:45:16

有一个similar question用于 PHP，但我正在使用 R 并且无法将解决方案转化为我的问题。

我有这个包含 10 行和 50 列的数据框，其中一些行完全相同。如果我在它上面使用 unique ，我会得到一行 - 比方说 - “type”，但我真正想要的是只获取那些只出现一次的行。有谁知道我如何实现这一目标？

我可以查看集群和热图以手动对其进行排序，但我有比上面提到的更大的数据框(最多 100 行)，这有点棘手。

最佳答案

这将提取仅出现一次的行(假设您的数据框名为 df ):

df[!(duplicated(df) | duplicated(df, fromLast = TRUE)), ]

工作原理:函数 duplicated测试一行是否至少从第一行开始第二次出现。如果参数 fromLast = TRUE使用时，函数从最后一行开始。

这两个 bool 结果与 | 结合在一起(逻辑“或”)转换为一个新向量，该向量指示所有行出现多次。使用 ! 否定此结果从而创建一个 bool 向量，指示只出现一次的行。

关于r - 如何删除所有重复项，以便 NONE 留在数据框中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13763216/