gpt4 book ai didi

删除重复行

转载 作者:行者123 更新时间:2023-12-03 04:26:23 25 4
gpt4 key购买 nike

我已将 CSV 文件读入 R data.frame。某些行的其中一列具有相同的元素。我想删除该列中重复的行。例如:

platform_external_dbus          202           16                     google        1
platform_external_dbus 202 16 space-ghost.verbum 1
platform_external_dbus 202 16 localhost 1
platform_external_dbus 202 16 users.sourceforge 8
platform_external_dbus 202 16 hughsie 1

我只想要其中一行,因为其他行在第一列中具有相同的数据。

最佳答案

对于来这里寻找重复行删除一般答案的人,请使用 !duplicated():

a <- c(rep("A", 3), rep("B", 3), rep("C",2))
b <- c(1,1,2,4,1,1,2,2)
df <-data.frame(a,b)

duplicated(df)
[1] FALSE TRUE FALSE FALSE FALSE TRUE FALSE TRUE

> df[duplicated(df), ]
a b
2 A 1
6 B 1
8 C 2

> df[!duplicated(df), ]
a b
1 A 1
3 A 2
4 B 4
5 B 1
7 C 2

回复:Removing duplicated rows from R data frame

默认情况下,此方法将保留每个重复项的第一次出现。您可以使用参数 fromLast = TRUE 来保留每个重复项的最后一次出现。您可以在此步骤之前对数据进行排序,以便保留您想要的行。

关于删除重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13967063/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com