gpt4 book ai didi

R - 为列值的随机样本选择行?

转载 作者:行者123 更新时间:2023-12-04 17:40:10 27 4
gpt4 key购买 nike

如何为列值的随机样本选择所有行?

我有一个看起来像这样的数据框:

tag  weight

R007 10
R007 11
R007 9
J102 11
J102 9
J102 13
J102 10
M942 3
M054 9
M054 12
V671 12
V671 13
V671 9
V671 12
Z990 10
Z990 11

您可以使用...
weights_df <- structure(list(tag = structure(c(4L, 4L, 4L, 1L, 1L, 1L, 1L, 
3L, 2L, 2L, 5L, 5L, 5L, 5L, 6L, 6L), .Label = c("J102", "M054",
"M942", "R007", "V671", "Z990"), class = "factor"), value = c(10L,
11L, 9L, 11L, 9L, 13L, 10L, 3L, 9L, 12L, 12L, 14L, 5L, 12L, 11L,
15L)), .Names = c("tag", "value"), class = "data.frame", row.names = c(NA,
-16L))

我需要为两个随机采样的标签创建一个包含上述数据帧中所有行的数据帧。假设标签 R007 和 M942 被随机选择,我的新数据框需要如下所示:
tag  weight

R007 10
R007 11
R007 9
M942 3

我该怎么做呢?

我知道我可以创建一个包含两个随机标签的列表,如下所示:
library(plyr)
tags <- ddply(weights_df, .(tag), summarise, count = length(tag))
set.seed(5464)
tag_sample <- tags[sample(nrow(tags),2),]
tag_sample

导致...
   tag count
4 R007 3
3 M942 1

但我只是不知道如何使用它来对我的原始数据帧进行子集化。

最佳答案

这是你想要的吗?

subset(weights_df, tag%in%sample(levels(tag),2))

关于R - 为列值的随机样本选择行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5943751/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com