gpt4 book ai didi

r - 如何删除所有重复项,以便 NONE 留在数据框中?

转载 作者:行者123 更新时间:2023-12-03 11:45:16 25 4
gpt4 key购买 nike

有一个similar question用于 PHP,但我正在使用 R 并且无法将解决方案转化为我的问题。

我有这个包含 10 行和 50 列的数据框,其中一些行完全相同。如果我在它上面使用 unique ,我会得到一行 - 比方说 - “type”,但我真正想要的是只获取那些只出现一次的行。有谁知道我如何实现这一目标?

我可以查看集群和热图以手动对其进行排序,但我有比上面提到的更大的数据框(最多 100 行),这有点棘手。

最佳答案

这将提取仅出现一次的行(假设您的数据框名为 df ):

df[!(duplicated(df) | duplicated(df, fromLast = TRUE)), ]

工作原理:函数 duplicated测试一行是否至少从第一行开始第二次出现。如果参数 fromLast = TRUE使用时,函数从最后一行开始。

这两个 bool 结果与 | 结合在一起(逻辑“或”)转换为一个新向量,该向量指示所有行出现多次。使用 ! 否定此结果从而创建一个 bool 向量,指示只出现一次的行。

关于r - 如何删除所有重复项,以便 NONE 留在数据框中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13763216/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com