algorithm - 不属于集合的等概率样本数-6ren

algorithm - 不属于集合的等概率样本数

转载作者：塔克拉玛干更新时间：2023-11-03 02:51:18

24

4

我有一个数 n 和一组数 S ∈ [1..n]*，大小为 s(基本上是小于 n)。我想以等概率采样一个数 k ∈ [1..n]，但该数不允许在集合 S 中。

我试图在最坏的情况下解决问题 O(log n + s)。我不确定这是否可能。

一种天真的方法是创建一个从 1 到 n 的数字数组，不包括 S 中的所有数字，然后选择一个数组元素。这将在 O(n) 中运行并且不是一个选项。

另一种方法可能只是生成随机数 ∈[1..n] 并在它们包含在 S 中时拒绝它们。这没有理论上的限制，因为任何数字都可以被多次采样，即使它在集合中也是如此。但平均而言，如果 s 远小于 n，这可能是一个实用的解决方案。

最佳答案

假设 s 已排序。生成一个介于 1 和 n-s 之间的随机数，称之为 k。我们选择了 {1,...,n} - s 的第 k 个元素。现在我们需要找到它。

对 s 使用二进制搜索来查找 s <= k 的元素数。这需要 O(log |s|)。将此添加到 k。这样做时，我们可能已经通过或到达 s 的其他元素。我们可以通过为我们传递的每个这样的元素增加我们的答案来对此进行调整，我们通过从我们在二分搜索中找到的点检查 s 的下一个更大的元素来找到它。

例如，n = 100，s = {1,4,5,22}，我们的随机数是 3。所以我们的方法应该返回 [2,3,6,7,..., 21,23,24,...,100] 是 6。二分查找发现 1 个元素最多为 3，所以我们递增到 4。现在我们比较 s 的下一个更大的元素，即 4，所以递增到 5 。重复此操作会发现 5 in，所以我们递增到 6。我们再次检查 s，发现 6 不在其中，所以我们停止。

例如，n = 100，s = {1,4,5,22}，我们的随机数是 4。所以我们的方法应该返回 [2,3,6,7,..., 21,23,24,...,100] 是 7。二分查找发现 2 个元素最多为 4，所以我们递增到 6。现在我们比较 s 的下一个更大的元素，即 5，所以递增到 7 . 我们再次检查 s，看到下一个数字 > 7，所以我们停止。

如果我们假设“s 远小于 n”意味着 |s| <= log(n)，那么我们将最多递增 log(n) 次，并且在任何情况下最多递增 s 次。

如果 s 未排序，那么我们可以执行以下操作。创建一个大小为 s 的位数组。生成 k。解析 s 并做两件事:1) 计算元素 < k 的数量，称此为 r。同时，如果 k+i 在 s 中，则将第 i 位设置为 1(索引为 0，因此如果 k 在 s 中，则设置第一个位)。

现在，递增 k 的次数等于 r 加上设置的位数是索引 <= 递增次数的数组。

例如，n = 100，s = {1,4,5,22}，我们的随机数是 4。所以我们的方法应该返回 [2,3,6,7,..., 21,23,24,...,100] 即 7。我们解析 s 和 1) 注意 1 个元素低于 4 (r=1)，并且 2) 将我们的数组设置为 [1, 1, 0, 0 ].我们对 r=1 增加一次，对两个设置位增加两次，最终为 7。

这是 O(s) 时间，O(s) 空间。

关于algorithm - 不属于集合的等概率样本数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50546728/

24

4

0

文章推荐： algorithm - 为什么这个算法是O(nlogn)？

文章推荐： java HttpURLConnection.setRequestMethod() 不起作用

文章推荐： algorithm - 具有相同输出的伪随机生成器

mysql - WHERE(集合)IN(集合)
编辑:我似乎问错了这个问题。我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
jquery - $.each([集合]) 与 $([集合]).each()
这两种方法似乎 produce the same results ，但我一直很难真正说服人们第二种方法有效，因为它显然并不为人所知。 // Create some data var foo = { '
kotlin - 为什么我们在Kotlin中仅使用[列表， map ，集合]集合？
我一直在学习Kotlin，并且遇到过Collections API。在Kotlin之前，我一直在学习Java，并且我知道Java中有很多不同类型的Collections API。例如，我们使用List
Java addAll(集合)与 new ArrayList(集合)
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
javascript: 集合[id][prop] = 集合[id][prop] || []//将空数组分配给对象时出现问题
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。我得到了指示，粗体部分，
java - 我需要哪种 Java 对象类型(集合/列表/集合/其他)？
我想存储一个对象集合，这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
collections - ArrayList(集合 c)VS HashSet(集合 c)
在检查 ArrayList API 时，我注意到一些看起来很奇怪的东西。确实，这里是 ArrayList 构造函数实现，其中 Collection 作为参数传递: public ArrayList(
collections - 如何在我的 YAML Swagger 定义中将属性类型定义为字符串列表(列表、集合、数组、集合)
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
java - 如何将 Scala 集合 Seq[(Int, Seq[String])] 转换为 Java 集合 List[(int, List[String])]？
我知道scala.collection包中有两个非常有用的对象，可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
Automapper 集合
我已经阅读了无数其他帖子，但似乎无法弄清楚发生了什么，所以是时候寻求帮助了。我正在尝试将包含集合的域实体映射到也包含集合的 dtos。这是一个原始示例； (我提前为代码墙道歉，我尽量保持简短):
Java:集合
我正在创建一个具有 ArrayList 的类，因此当我调用构造函数时，它会初始化该数组: public class ElementsList { private ArrayList list;
polymer this.$ 集合
我正在阅读事件指南和指南的开头，它说: You can also add an event listener to any element in the this.$ collection using
Python - 集合
我是 Python 新手，想知道如何使用键在字典中存储不同数据类型的列表例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
C# 集合
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
Java 集合
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
Java - 集合
我正在开发我的第一个 Java 项目，我有一个问题。问题应该很简单(虽然代码不是那么短，但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏，并且有一个定义每个角色的抽象类“Character”。在
MongoDB 集合
我正在开发一款应用程序，可以为用户收集推文、Facebook 状态和 Facebook 照片。目前，用户确切地设定了他们希望这种收获发生的时间和时间，并且蜘蛛会在此期间拉取数据。 when 和 to
C# 集合？
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法？我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合，但这不是一种非常优雅的方式
oracle 集合
EXISTS 该函数返回集合中第一个元素的索引，如果集合为空，返回NULLNULLNULL Collecti
07、RDF 集合
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属

首页

博学

6Ren·AI

商城

algorithm - 不属于集合的等概率样本数