gpt4 book ai didi

R中均匀分布的随机子样本

转载 作者:行者123 更新时间:2023-12-04 11:00:16 25 4
gpt4 key购买 nike

我有一个大型数据集,其中包含植被指数 (VI) 的观测值。我正在使用 R 随机对数据进行子采样,同时保持分布(相对频率)均匀(在整个 VI 范围内的观察量相等)。我一直无法获得相当均匀的分布。

例子:

norm<-rnorm(1000, mean = .5, sd = .25) # I have this 

hist(norm) #that is distributed like this

hist(unif<-runif(1000, min=0, max=1)) # but I want to resample the data to look like this

最佳答案

这个怎么样:把VI的范围分成等宽的bins,把数据放到这些bins里。分布中间的 bin 中的数据将多于末端的 bin。随机选择 at bin(等概率),然后从 bin 中选择一项。

该想法的一个变体是随机选择 VI 范围内的一个点(以等概率),然后找到落在从 (x - dx/2) 到 (x + dx/2) 区间内的数据) 其中 dx 足够大以捕获至少一些数据。然后从该区间中选择一个数据(概率相等)。可能还有更多变化。

像这样的非均匀采样的一个后果是您可能会一遍又一遍地从尾部中选择相同的项目。我没有办法解决这个问题;这似乎是一个不可避免的结果。但我可能错了。

关于R中均匀分布的随机子样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38155183/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com