gpt4 book ai didi

R,查找重复的行,无论顺序如何

转载 作者:行者123 更新时间:2023-12-05 08:43:49 25 4
gpt4 key购买 nike

这个问题我想了一个晚上:这是我的矩阵:

'a' '#' 3
'#' 'a' 3
0 'I am' 2
'I am' 0 2

.....

我想像前两行一样对待这些行,因为它只是 'a' 和 '#' 的不同顺序。就我而言,我想删除此类行。玩具示例很简单,前两个相同,第三个和第四个相同。但在我的数据集中,我不知道“相同”行在哪里。

我正在用 R 编写。谢谢。

最佳答案

也许这样的事情对你有用。虽然不清楚您想要的输出是什么。

x <- structure(c("a", "#", "0", "I am", "#", "a", "I am", "0", "3", 
"3", "2", "2"), .Dim = c(4L, 3L))
x
# [,1] [,2] [,3]
# [1,] "a" "#" "3"
# [2,] "#" "a" "3"
# [3,] "0" "I am" "2"
# [4,] "I am" "0" "2"


duplicated(
lapply(1:nrow(x), function(y){
A <- x[y, ]
A[order(A)]
}))
# [1] FALSE TRUE FALSE TRUE

这基本上是按行拆分矩阵,然后对每一行进行排序。 duplicated 也适用于 list,因此您只需将整个内容用 `duplicated 包装起来,以查找哪些项目(行)是重复的。

关于R,查找重复的行,无论顺序如何,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22980423/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com