gpt4 book ai didi

arrays - 如何从 Scala 列表或数组中随机采样?

转载 作者:行者123 更新时间:2023-12-01 22:05:51 26 4
gpt4 key购买 nike

我想从 Scala 列表或数组(不是 RDD)中随机采样,样本大小可能比列表或数组的长度长得多,如何高效做到这一点?因为样本量可能非常大,并且需要进行多次采样(在不同的列表/数组上)。

我知道对于 Spark RDD,我们可以使用 takeSample() 来完成此操作,Scala 列表/数组是否有等效的方法?

非常感谢。

最佳答案

一个易于理解的版本如下所示:

import scala.util.Random

Random.shuffle(list).take(n)
Random.shuffle(array.toList).take(n)

// Seeded version
val r = new Random(seed)
r.shuffle(...)

关于arrays - 如何从 Scala 列表或数组中随机采样?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32932229/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com