gpt4 book ai didi

r - 如何从 R 中的数据框中删除重复和相同的行?

转载 作者:行者123 更新时间:2023-12-04 07:18:29 40 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





Unique on a dataframe with only selected columns

(4 个回答)


25 天前关闭。




为了我的目的,我有一个包含两行多行的大型数据集,我正试图弄清楚如何使其简单易用。我已经删除了我不需要的所有列(现在)并删除了所有 NA 行。
数据如下所示:

   SampleID   Score   Habitat  
001-1 0 MCSHRU
001-2 1 MCSHRU
001-2 1 MCSHRU
001-2 1 MCSHRU
001-3 0 MCRU
001-4 3 MCSHRU
001-4 3 MCSHRU
样本 001-2 有三个条目,它们都是相同的。这是因为原始数据集对每个样本中发现的每个物种都有一行。我对物种数据不感兴趣,我只想比较每个栖息地的分数。
我希望每个 SampleID 只有一行。我可以对 Score 数据取平均值或最小值,但我不确定如何处理 Habitat 数据,因为它是分类数据。
如何清除重复的数据行,以便每个 SampleID 只有一行数据?
最后应该是这样的:
  SampleID   Score   Habitat  
001-1 0 MCSHRU
001-2 1 MCSHRU
001-3 0 MCRU
001-4 3 MCSHRU

最佳答案

使用 unique(df)来自 basedistinct(df)来自 dplyr

关于r - 如何从 R 中的数据框中删除重复和相同的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68651209/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com