gpt4 book ai didi

r - 使用 dplyr 向列值添加抖动

转载 作者:行者123 更新时间:2023-12-01 12:36:36 25 4
gpt4 key购买 nike

我有以下格式的数据框。

   author year stages
1 A 1150 1
2 B 1200 1
3 C 1200 1
4 D 1300 1
5 D 1300 1
6 E 1390 3
7 F 1392 3
8 G 1400 3
9 G 1400 3
...

我想每年和作者组合稍微抖动一下。我希望同一年不同作者的文档被独特的值所扰乱。例如,作者 B 和 C 的 token 出现在同一年,但应该抖动不同的数量。来自同一作者的所有 token ,例如来自作者 G 在 1400 处的两个 token 应抖动相同的数量。

我尝试了以下方法,但为每一行都获得了唯一的抖动量。
data %>% group_by(author) %>% mutate(year = jitter(year, amount=.5))

此代码的输出如下。
   author     year stages
1 A 1150.400 1
2 B 1200.189 1
3 C 1200.222 1
4 D 1300.263 1
5 D 1299.788 1
6 E 1390.045 3
7 F 1391.964 3
8 G 1399.982 3
9 G 1399.783 3

但是,我想要以下内容,其中作者 G 的两个 token 都应移动相同的数量。关键的区别在于作者 G 的所有 token 都移动了相同的数量。
   author     year stages
1 A 1150.400 1
2 B 1200.189 1
3 C 1200.222 1
4 D 1300.263 1
5 D 1299.788 1
6 E 1390.045 3
7 F 1391.964 3
8 G 1399.982 3
9 G 1399.982 3

最佳答案

计算一种情况的抖动并将差异添加到所有情况:

dat %>% 
group_by(author) %>%
mutate(year = year + (year[1] - jitter(year[1], amount=.5)))

# author year stages
#1 A 1149.720 1
#2 B 1200.385 1
#3 C 1199.888 1
#4 D 1299.589 1
#5 D 1299.589 1
#6 E 1389.866 3
#7 F 1392.225 3
#8 G 1400.147 3
#9 G 1400.147 3

关于r - 使用 dplyr 向列值添加抖动,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29090286/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com