- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
为了加速测试字谜字符串的快速输出行为,我 came up with基于质数的哈希方案——尽管它看起来像 I wasn't the first .
基本思想是将字母映射到素数,并计算这些素数的乘积。字母的任何重新排列都会产生相同的结果,如果结果可以任意大,那么其他字母的组合都不会产生相同的结果。
我最初将其设想为只是一个哈希值。最终该产品会溢出并开始为其他字母组合起别名。然而,通过将最常见的字母映射到最小的素数,乘积增长缓慢,并且通常可以完全避免溢出。在这种情况下,我们得到了一个完美的哈希值,无需额外测试即可给出明确的正面和负面结果。
值得注意的是,它在溢出之前并没有非常有效地填充编码空间。结果中不会有任何大于 103 的素数因子,并且小素数的分布是固定的,不一定与字母频率非常匹配。
现在我想知道是否有比这更好的东西。用完美的哈希值覆盖更多结果并且在其余情况下具有很强的分布性的东西。
我能想到的最密集的编码方案是对字母进行排序,然后用熵编码器将它们打包成一个单词。在这个方案中,由于每个位置都受到范围限制,字母频率显然会有很大偏差(例如,以 z 开头的排序数组的可能性大大低于以 z 结尾的排序数组的可能性)。
不过,这听起来像是一项繁重的工作——而且我看不出它能保证在溢出情况下提供良好的分配。
也许有一组更好的因素可以将字母映射到,以及更好的方法来检测锯齿风险何时开始。或者不依赖乘法的哈希方案?有什么容易计算的吗?
所以这就是:
英语语言限制(26 个字母,具有典型的英语单词结构)就可以了。多字节编码方案是另一个问题。
首选 C 代码,因为我理解它。
最佳答案
如果您使用大小为 m 的字母表的 n 位哈希,则可以使用我描述的方法 here 获得长达 (n-m) 个字符的字谜的唯一哈希。 。这使得冲突检测变得不必要,但它确实限制了您的单词大小,具体取决于字母表的大小和可用空间。
为了允许任意长度的单词,我将使用 n-1 位对长度最多 (n-m-1) 个字符的单词进行哈希处理,并保存最后一位以表明该单词是 m 个字符或更长。在这些情况下,您将使用剩余的 n-1 位作为素数或其他哈希算法,但当然,只要您在这些存储桶中有多个单词,您就必须进行冲突检测。由于在现实世界的应用程序中,大多数单词将占据较短的单词长度,因此您将大大减少较长单词所需的冲突检测。
关于c - 完美/理想的哈希来隔离字谜,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18162204/
我的公司有一个 Web 应用程序,其中包含纯 JavaScript,它以自己的方式使用 $ -“美元符号”,如下所示: function $(e) { return document.getE
doc说“这意味着对单个节点上单个分区内的行的写入仅对执行操作的客户端可见”。 如果有另一个 client2 在同一个分区和同一个节点上执行操作,那么文档中提到的“THE CLIENT”执行的写入是否
只是一个想法,但在 DIV 上使用 IFRAME 本质上会使该元素与窗口隔离,从而降低 IFRAME 中运行的脚本速度 不会影响其他框架/窗口吗? 最佳答案 是的,对于第一部分,iframe 会“某种
我有以下模型 Inventory [product_name, quantity, reserved_quantity] 有数据 [Shirt, 1, 0] [Shorts, 10, 0] 如果以下代
我面临的情况如下。因为ThreadPool是每个进程1个实例,所以我的问题是是否会在 3秒后取消方法2排队的任务? http request comes in *method 1 gets execu
我希望在 Dart 中创建一个 Isolate,我可以通过编程方式暂停和恢复。这是我使用的代码。 import 'dart:io'; import 'dart:isolate'; void main(
我想编写一个具有隔离作用域的指令,但也希望使该作用域可用于父作用域的 Controller 。我找到了这个解决方案: app.directive('popupbutton', [functi
我有一个像这样的 JSON 对象: [ {"Subject": "Physics", "Active": 48, "Date": "2020-01-22T00:00:00Z"}, {"Su
我正在使用 Elixir 自动执行用 Gherkin 编写的规范中定义的验收测试。一种方法是使用名为 Cabbage 的 ExUnit 插件。 . 现在,ExUnit 似乎提供了一个在任何单个测试之前
我被要求为多个用户配置一个带有 docker 的 ubuntu 18.04 服务器。 目的: 我们有多个编写测试用例的测试人员。但是我们的笔记本电脑速度不够快,无法在 docker 环境中构建项目和运
我一直在网上寻找完整的解决方案,但到目前为止,我只能找到不合适的部分。 我正在寻找一个可以查看图像文件、循环遍历文件并隔离 Sprite 然后保存它们的程序。之后,我需要一种方法来重新访问该 Spri
我想知道如何隔离 JavaScript 函数的执行以避免浏览器崩溃。 示例:如果我想在控制台中输出一个包含大约 10k 元素的关联数组,浏览器将停止响应。我怎样才能避免这种情况? 最佳答案 解决方案是
我必须向我的数据库添加大量信息。添加此信息大约需要 5-7 分钟。我需要添加交易。 我试过这个: try { db.Connection.Open(); db.Transaction
我有 6 个 iframe,它们来自同一个域,但具有不同的 url 和子目录。他们都使用 html header “set-cookie”设置了一个名称相同但值不同的 cookie。我需要将它们的 c
我正在编写一个代码,它基本上读取一个文本文件(表格格式)并检查该文件是否包含预期的数据类型。为此我写了下面的课。 示例文件应该是这样的。 name age abc 20 xyz
我有一个表,线程。我有一个表,thread_participants。我正在尝试隔离与特定 thread_id 和特定 thread_participants.user_id 标识的行。 例如,如果
我有一个非常实际的问题。我的数据库中有大约 400 篇文章,在这些文章中我有其他文章的链接。在转换过程中,链接被破坏。我们在 CMS 中手动插入新的菜单链接项。我想制作一个脚本来查找(文章)id 并将
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
我在想是否可以在 postgres 数据库(高于 8.3 的版本)上创建一个只能访问特定指定模式的用户。问题是,在我的数据库中我有一些模式。如果我撤销某个用户对除一个模式之外的所有模式的所有特权,他仍
我有两组点,一组来自分析,另一组用于分析数据的后处理结果。 黑色的分析数据是散乱的。 用于结果的点是红色的。 这是同一地 block 上的两组: 我遇到的问题是:我将插值到红点上,但如您所见,有些红点
我是一名优秀的程序员,十分优秀!