gpt4 book ai didi

从 R 中的整个数据集中随机选择 10% 的数据

转载 作者:行者123 更新时间:2023-12-02 01:26:09 29 4
gpt4 key购买 nike

对于我的项目,我获取了一个数据集,其中包含 23 列的 1296765 个观测值,我只想随机获取该数据的 10%。我怎样才能在 R 中做到这一点。

我尝试了下面的代码,但它只采样了 10 行。但是,我想随机选择 10% 的数据。我是初学者,请帮忙。

library(dplyr)  
x <- sample_n(train, 10)

最佳答案

以下是 dplyr 中的一个函数,它按特定比例随机选择行:

dplyr::slice_sample(train,prop = .1) 

关于从 R 中的整个数据集中随机选择 10% 的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74621815/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com