- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要在 Google AppEngine(或者您可以想到任何其他哈希表)中将一堆实体存储在我需要根据顺序输入自行创建的键下。
举个例子,假设我只处理长度为一位十进制数字的键。然后我需要为键“0”存储一个实体,为键“1”存储一个实体,为键“2”存储一个实体,依此类推。
问题是,如果我直接使用这个递增序列作为键,将会导致所有实体在物理上存储得非常接近,这可能会导致严重的性能问题。 Details here 。对于一般的哈希表,您可以认为所有条目并不是均匀分布在所有存储桶中,而是聚集在几个存储桶中,这也会导致查找等性能下降。
因此,我正在寻找一些函数来在可用值的空间中更均匀地“重新分配”我的值。
为了继续使用单位数字键的示例,我可以创建一个包含所有可能值的随机排列的表,例如 [5,9,2,4,1,8,0,6,3 ,7] 并对其进行索引。然后,当我存储彼此相邻的条目 0、1 和 2 时,我会分配更分散在服务器或哈希桶中的键 5、9 和 2。
但我需要找到一种方法来对 156 位数字执行此操作,在这种情况下,使用所有值随机排列的表是不可行的。
我有两个要求:
我找到了一种方法:简单地用 SHACAL-1 “加密”我的值或其他一些 160 位密码。但这对于我想要实现的目标来说似乎需要太多的计算工作。是否有一些伪随机函数可以使用我的值作为种子?它们能保证无碰撞吗?
最佳答案
您可以使用离散对数,它可以为您的所有数组位置提供完美的确定性排列。但是,排列是单向的:如果不诉诸暴力(或在允许的方向上重新进行排列),则无法检索新的第 i 个数组位置的原始位置
或者
如果您不关心额外的空间,您可以存储对 <value-originalindex>
并完全随机放置它们(使用一些 PRNG 函数),在发生碰撞时重申(或记下已使用的位置)。现在这些对均匀分布。检索第 i 个元素需要 O(N),其中 N 是位置数。这就是该算法的代价。
或者
仅获取 156 位值中的几个随机位,并使用它们来形成一个 12 位无符号索引。使用此索引从您的最终空间中选择第 k 个存储桶(您的空间被划分为 2^12 个存储桶)。仅当值共享相同的 12 位随机位时,值才会倾向于聚合,如果您仔细挑选它们,则不太可能...使用剩余的 156-12=143 位来偏移桶内。
或者
创建 156 位的固定随机排列。
关于hash - "evenly distributing"跨可能值空间的连续数字的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25982948/
我正在尝试使用 Rust 的 std::hash 函数: use std::hash::{hash, Hash, SipHasher}; #[test] fn hash_test() { pr
我有以下内容 friends = [{ name: "Jack", attr1:"def", attr2:"def" }, { name: "Jill", attr1:"def", attr2:"de
我有以下数组: names = [ {"Adriana"=>{:gender=>"female", :nationality=>"danish"}}, {"Adriane"=>{:gender=>"f
我有一个哈希的 Perl 哈希......大约 11 或 12 个元素深。请原谅我没有重复下面的结构! 一些级别有固定的标签,例如'NAMES' , 'AGES'或类似的,因此访问这些级别很好,因为我
我试图派生一个描述结构化值的Graphviz文件。这是出于诊断目的,因此我希望我的图形尽可能接近地反射(reflect)内存中的实际结构。我正在使用下面的方法将值映射到Graphviz顶点,以便当一个
我正在尝试获取在 xlm 中传递的事件日志条目,将它们转换为散列,然后存储到数据库中。 我目前正在使用 XmlSimple gem 将 xml 输入转换为散列。 测试样本输入: require 'xm
对于 Ruby 中的 Hash,reject! 和 reject 与 delete_if 有何不同?谁能用简单的代码片段解释它们之间的区别? 最佳答案 由于其他答案指的是 Array#delete_i
我正在尝试处理我使用 Data::Dumper 输出的 perl 数据结构 $VAR1 = 'GAHD'; $VAR2 = [ { 'COUNTRY' => 'US',
无法使用来自辅助进程的现有 rte Hash: h = rte_hash_find_existing("some_hash"); if (h) { // this will w
我有一个散列的散列,其中第一个键是一个字符串,第二个键是一个整数。我试图在散列的散列中获得最低的第二个键。这是我的哈希。 %HoH = ( flintstones => { 8
如何从一系列数组中生成哈希中的哈希?我需要从这里开始: my @data = /one two three/; my $value = 13: 为此: $hoh = { 'one' => { 'two
我有这个配置文件 dbUser=customer dbPass=passwrd dbSid=customer.shadow passwdFile=/production/etc-user tmpUse
我想实现一种thing,可以唯一标识,除此之外,它不包含其他字段。它有点像 ruby 中的 BasicObject 或 java 中的 Object。 我添加了一个 PartialEq 特征。 s
我正在尝试使用以下键存储二维哈希: 维度 1 = 数字但不连续 维度 2 = 字符串(如 :id 和 :value) 当元素未初始化时会出现问题。 memory = Hash.new(Hash.new
我目前正在学习 Michael Hartl 的 Ruby on Rails 教程 不理解在 section 4.4.1 中找到的此语句的含义: Hashes, in contrast, are dif
我很乐意通过更短的表达式访问多维哈希数组的任何元素 h = {a: {b: 'c'}} # default way p h[:a][:b] # => "c" # a nicer way p h[:a,
我想在编写 flutter channel beta 后运行 flutter web 它回复:Can't load kernel binary:Invalid SDK hash,你知道如何解决这个问题
我最近正在研究 Amazon 提供的新 NoSQL 服务,更具体地说是 DynamoDB。 亚马逊说你应该避免使用不均匀分布的键作为主键,即主键应该越独特越好。我可以认为这是最好的情况下每个项目都有唯
我的游戏中有很多哈希值,例如 HMSET('hash1', 'level', 25, 'connected', 2) HMSET('hash2', 'level', 50, 'connected',
我必须翻译这句话:'Susspected overpass-the-hash attack (Kerberos)' 我发现了这篇关于立交桥哈希的文章:https://blog.stealthbits.
我是一名优秀的程序员,十分优秀!