gpt4 book ai didi

根据 R 列中的重复项删除行

转载 作者:行者123 更新时间:2023-12-04 00:08:02 24 4
gpt4 key购买 nike

我有一个数据框,其中包含由应用程序编号“Apno”标识的条目。数据框中有许多重复项,其中大部分信息是相同的,但有一两部分略有不同,因此直接的 unique() 命令不适用于我的目的。好消息是具有相同 Apno 值的行指的是相同的东西,保留哪个条目并不重要。我只需要唯一的 apno,同时保留其他数据。示例:

Apno  Name   Location

123 Gary New York
124 Larry Boston
123 Garry NYC
155 Jerry San Francisco
122 Mary Chicago
123 Gari NY
124 Lary Bos.

在 Apno 上过滤后:

Apno  Name   Location

123 Gary New York
124 Larry Boston
155 Jerry San Francisco
122 Mary Chicago

最佳答案

试试

library(dplyr)
df1 %>%
group_by(Apno) %>%
slice(1L)

或者一个 base R 选项将是

df1[!duplicated(df1$Apno),]

数据

df1 <- structure(list(Apno = c(123L, 124L, 123L, 155L, 122L, 123L, 124L
), Name = c("Gary", "Larry", "Garry", "Jerry", "Mary", "Gari",
"Lary"), Location = c("New York", "Boston", "NYC", "San Francisco",
"Chicago", "NY", "Bos.")), .Names = c("Apno", "Name", "Location"
), class = "data.frame", row.names = c(NA, -7L))

关于根据 R 列中的重复项删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29349466/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com