- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个包含唯一 id 的字符串对象。(例如“ocx7gf”或“67hfs8”)我需要为它提供一个 int hascode() 的实现,这显然是独一无二的。
如何以最简单/最快的方式将字符串转换为唯一的 int?
10 倍。
编辑 - 确定。我已经知道 String.hashcode 是可能的。但不建议在任何地方使用。实际上'如果不推荐任何其他方法 - 如果我的对象在集合中并且我需要哈希码,我是否应该使用它。我应该将它连接到另一个字符串以使其更成功吗?
最佳答案
不,您不需要“显然”需要一个返回唯一值的实现,因为显然大多数实现都会被破坏。
你想要做的是在位之间有一个很好的分布,特别是对于公共(public)值(如果任何值比其他值更常见)。除非对格式有特殊了解,否则最好只使用字符串本身的哈希码。
通过对您的 id 格式限制的特殊了解,可以进行自定义并获得更好的性能,但错误的假设更有可能使事情变得更糟而不是更好。
编辑:关于位的良好传播。
如此处和其他答案所述,完全唯一是不可能的,哈希冲突是可能的。使用哈希的方法知道这一点并可以处理它,但它确实会影响性能,因此我们希望冲突很少见。
此外,散列通常会重新散列,因此我们的 32 位数字最终可能会减少为例如一个在 0 到 22 范围内,我们希望在这个范围内尽可能好地分布。
我们还希望在不花太长时间计算散列的情况下取得平衡,以免散列本身成为瓶颈。不完美的平衡行为。
糟糕的散列方法的一个典型示例是 X、Y 整数坐标对:
return X ^ Y;
虽然这可以很好地从 4^32 个可能的输入中返回 2^32 个可能的值,但在现实世界中使用 X 和 Y 相等的坐标集是很常见的 ({0, 0} , {1, 1}, {2, 2} 等等)全部散列为零,或匹配对({2,3} 和 {3, 2})散列为相同的数字。我们可能会更好地服务于:
return ((X << 16) | (x >> 16)) ^ Y;
现在,与前者相比, 有很多可能的值是可怕的,但它往往在现实世界的案例中服务得更好。
当然,如果您正在编写一个通用类(不知道有哪些可能的输入)或者对手头的目的有更好的了解,那就有不同的工作了。例如,如果我使用 Date 对象但知道它们都只是日期(时间部分总是午夜)并且彼此之间的间隔只有几年,那么我可能更喜欢只使用日、月和年份的低位数,超过标准年份。 Date
的作者虽然无法在这些知识上工作,但必须努力迎合所有人。
因此,例如,如果我知道给定的字符串总是由 [a-z] 或 [0-9] 范围内的 6 个不区分大小写的字符组成(你的似乎是这样,但从你的问题是这样的)然后我可能会使用一种算法为每个字符分配一个从 0 到 35 的值(每个字符的 36 个可能的值),然后遍历字符串,每次将当前值乘以 36 并添加下一个字符的值。
假设在 id 中分布良好,这将是可行的方法,特别是如果我进行排序以使哈希中的低位有效数字与 id 中变化最频繁的字符相匹配(如果这样的调用可以被制作),因此可以很好地重新散列到更小的范围。
但是,由于缺乏对格式的了解,我无法确定地进行调用,而且我很可能会使事情变得更糟(较慢的算法对哈希质量的增益很小甚至是负增益)。
您拥有的一个优势是,由于它本身就是一个 ID,因此可能没有其他不相等的对象具有相同的 ID,因此不需要检查其他属性。这并不总是成立。
关于java - 我怎样才能从一个唯一的字符串生成一个唯一的整数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5459436/
我正在尝试使用以下 keytool 命令为我的应用程序生成 keystore : keytool -genkey -alias tomcat -keystore tomcat.keystore -ke
编辑:在西里尔正确解决问题后,我注意到只需将生成轴的函数放在用于生成标签的函数下面就可以解决问题。 我几乎读完了 O'Reilly 书中关于 D3.js 的教程,并在倒数第二页上制作了散点图,但是当添
虽然使用 GraphiQL 效果很好,但我的老板要求我实现一个用户界面,用户可以在其中通过 UI 元素(例如复选框、映射关系)检查呈现给他们的元素并获取数据,这样做将为该人生成 graphql 输入,
我尝试在 Netbean 6.8 中使用 ws-import 生成 Java 类。我想重新生成 jax-ws,因为在 ebay.api.paypalapi 包中发现了一个错误(我认为该错误是由于 Pa
我有一个 perl 脚本,它获取系统日期并将该日期写入文件名。 系统日期被分配给 TRH1 变量,然后它被设置为一个文件名。 $TRH1 =`date + %Y%m%d%H%M`; print "TR
我是 Haskell 的新手,需要帮助。我正在尝试构建一种必须具有某种唯一性的新数据类型,因此我决定使用 UUID 作为唯一标识符: data MyType = MyType { uuid ::
我制作了一个脚本,它可以根据 Mysql 数据库中的一些表生成 XML。 该脚本在 PHP 中运行。 public function getRawMaterials($apiKey, $format
所以这是我的项目中的一个问题。 In this task, we will use OpenSSL to generate digital signatures. Please prepare a f
我在 SAS LIFEREG 中有一个加速故障时间模型,我想绘制它。因为 SAS 在绘图方面非常糟糕,我想实际重新生成 R 中曲线的数据并将它们绘制在那里。 SAS 提出了一个尺度(在指数分布固定为
我正在为 Django 后端制作一个样板,并且我需要能够使它到达下一个下载它的人显然无法访问我的 secret key 的地方,或者拥有不同的 key 。我一直在研究一些选项,并在这个过程中进行了实验
我正在创建一个生成采购订单的应用程序。我可以根据用户输入的详细信息创建文本文件。我想生成一个看起来比普通文本文件好得多的 Excel。有没有可以在我的应用程序中使用的开源库? 最佳答案 目前还没有任何
我正在尝试使用 ScalaCheck 为 BST 创建一个 Gen,但是当我调用 .sample 方法时,它给了我 java.lang.NullPointerException。我哪里错了? seal
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我尝试编写一些代码,例如(在verilog中): parameter N = 128; if (encoder_in[0] == 1) begin 23 binary_out = 1;
我正忙于在 Grails 项目中进行从 MySQL 到 Postgres 的相当复杂的数据迁移。 我正在使用 GORM 在 PostGres 中生成模式,然后执行 MySQL -> mysqldump
如何使用纯 XSLT 生成 UUID?基本上是寻找一种使用 XSLT 创建独特序列的方法。该序列可以是任意长度。 我正在使用 XSLT 2.0。 最佳答案 这是一个good example 。基本上,
我尝试安装.app文件,但是当我安装并单击“同步”(在iTunes中)时,我开始在设备上开始安装,然后停止,这是一个问题,我不知道在哪里,但我看到了我无法解决的奇怪的事情: 最佳答案 似乎您没有在Xc
自从我生成 JavaDocs 以来已经有一段时间了,我确信这些选项在过去 10 年左右的时间里已经得到了改进。 我能否得到一些有关生成器的建议,该生成器将输出类似于 .Net 文档结构的 JavaDo
我想学习如何生成 PDF,我不想使用任何第三方工具,我想自己用代码创建它。到目前为止,我所看到的唯一示例是我通过在第 3 方 dll 上打开反射器查看的代码,以查看发生了什么。不幸的是,到目前为止我看
我正在从 Epplus 库生成 excel 条形图。 这是我成功生成的。 我的 table 是这样的 Mumbai Delhi Financial D
我是一名优秀的程序员,十分优秀!