- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想做一件相对简单的事情:
Q
,查询距离d
, 和一组数字 S
,判断是否S
包含 任何 汉明距离小于或等于 d
的数字. S
一个列表并对其进行迭代,计算距离。如果计算出的距离小于或等于 d,则退出返回
TRUE
.
M-tree
.引用有关 stackoverflow 的其他一些问题、维基百科文章 (
https://en.wikipedia.org/wiki/M-tree ) 和两个预先存在的实现,我昨天花了几个小时来实现自定义解决方案。这个问题的一个好处是,通过两个数字的异或(使用 SSE 指令)计算 popcount 实际上比存储允许避免计算度量的数字更便宜,因此解决方案的几个方面可以简化和优化速度。
<= d
的集合成员的数量,更不用说列举它们了。我只是想检查是否存在。这让我想到了布隆过滤器和哈希之类的东西。
d
和字号
N
,我可以将多少个具有最小汉明距离 d 的代码放入一个 N 位数字中?这允许创建可以检测
d/2
错误的代码。位纠正错误高达
d/2-1
位。我们知道像 LDPC 这样的香农极限码,但这是针对具有模糊最小汉明距离的长码,它们需要很长时间才能解码。还有像 OLSC 这样的多位错误代码可以快速解码,但它们的空间效率远非如此。另一方面,对于
d = 4
, 扩展汉明 (SECDED) 码是最佳紧凑的。我见过基于 BCH 的方法来制作 DECTED 代码,但我不知道它们是否是最佳的。为了探索最佳编码,我想做的是生成
N
的替代代码集。位与一些任意 d 并生成电路来对它们进行编码和解码,选择最紧凑的。我还希望找到一些我们可以利用的更长代码的模式。
最佳答案
我认为这个问题可以通过将每个数字从 S 拆分为子字符串来解决,这样查询结果必须至少有 1 个分区,其汉明距离不超过 1 与查询的相应分区。
这个算法在文章中有描述:Alex X. Liu, Ke Shen, Eric Torng. Large scale Hamming distance query processing, 2011 .作者将该算法称为 HEngine。我试图解释一些直觉。
让 N - 数字的位数(它的维数)
k - 查询汉明距离
r-cut(α) - 将数字 α 分成 r 个子串 {α1, α2, ..., αr} 的函数,其中前 r − (m mod r) 个子串的长度为 ⌊m/r⌋,最后一个 m mod r子串的长度为 ⌈m/r⌉
该算法基于以下定理:
对于任何两个二进制串 β 和 γ 使得 HD(β, γ) ≤ k,考虑 r-cut(β) 和 r-cut(γ),其中 r ≥ ⌊k/2⌋ + 1。一定是这样的HD(βi, γi) ≤ 1 对于至少 q = r − ⌊k/2⌋ 不同的 i 值。
例如,我们有长度为 N = 8 位的二进制字符串。我们想找到 k = 2 的子串。
α = 10001110
β = 10100110
HD(α, β) = 2
α1 = 1000 α2 = 1110
β1 = 1010 β2 = 0110
HD(α1, β1) = 1, HD(α2, β2) = 1
关于测试针对集合的最小汉明距离的算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38900004/
编辑:我似乎问错了这个问题。 我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
这两种方法似乎 produce the same results ,但我一直很难真正说服人们第二种方法有效,因为它显然并不为人所知。 // Create some data var foo = { '
我一直在学习Kotlin,并且遇到过Collections API。在Kotlin之前,我一直在学习Java,并且我知道Java中有很多不同类型的Collections API。例如,我们使用List
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。 我得到了指示,粗体部分,
我想存储一个对象集合,这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
在检查 ArrayList API 时,我注意到一些看起来很奇怪的东西。 确实,这里是 ArrayList 构造函数实现,其中 Collection 作为参数传递: public ArrayList(
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
我知道scala.collection包中有两个非常有用的对象,可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
我已经阅读了无数其他帖子,但似乎无法弄清楚发生了什么,所以是时候寻求帮助了。 我正在尝试将包含集合的域实体映射到也包含集合的 dtos。 这是一个原始示例; (我提前为代码墙道歉,我尽量保持简短):
我正在创建一个具有 ArrayList 的类,因此当我调用构造函数时,它会初始化该数组: public class ElementsList { private ArrayList list;
我正在阅读事件指南和指南的开头,它说: You can also add an event listener to any element in the this.$ collection using
我是 Python 新手,想知道如何使用键在字典中存储不同数据类型的列表 例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中 声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
我正在开发我的第一个 Java 项目,我有一个问题。问题应该很简单(虽然代码不是那么短,但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏,并且有一个定义每个角色的抽象类“Character”。在
我正在开发一款应用程序,可以为用户收集推文、Facebook 状态和 Facebook 照片。目前,用户确切地设定了他们希望这种收获发生的时间和时间,并且蜘蛛会在此期间拉取数据。 when 和 to
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法?我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合,但这不是一种非常优雅的方式
EXISTS 该函数返回 集合中第一个元素的索引,如果集合为空,返回NULLNULLNULL Collecti
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属
我是一名优秀的程序员,十分优秀!