gpt4 book ai didi

重命名 R 中的重复字符串

转载 作者:行者123 更新时间:2023-12-04 10:09:58 26 4
gpt4 key购买 nike

我有一个包含两列字符串的 R 数据框。在其中一列(例如,Column1)中存在重复值。我需要重新标记该列,以便使用有序后缀重命名重复的字符串,例如 Column1.new

 Column1   Column2   Column1.new
1 A 1_1
1 B 1_2
2 C 2_1
2 D 2_2
3 E 3
4 F 4

任何有关如何执行此操作的想法将不胜感激。

干杯,

安蒂

最佳答案

假设您的数据(按 Column1 排序)位于名为 tab 的对象中.首先创建一个游程对象

c1.rle <- rle(tab$Column1)
c1.rle
##lengths: int [1:4] 2 2 1 1
##values : int [1:4] 1 2 3 4

这为您提供了 Column1 的值以及每个元素的相应出现次数。然后使用该信息创建具有唯一标识符的新列:
tab$Column1.new <- paste0(rep(c1.rle$values, times = c1.rle$lengths), "_",
unlist(lapply(c1.rle$lengths, seq_len)))

不确定,如果这适合您的情况,但您也可以将其粘贴在一起 Column1Column2 , 创建唯一标识符...

关于重命名 R 中的重复字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16646446/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com