java - 为什么 String hashCode 没有大小限制？-6ren

java - 为什么 String hashCode 没有大小限制？

转载作者：行者123 更新时间：2023-11-29 04:09:19

24

4

它困扰了我一段时间，但我还没有找到任何令人信服的答案，那么为什么 Java String 中的 hashCode 函数没有任何大小限制？下面是我发现的实现 here :

public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

首先，我了解临时变量 h 的用法，这在多线程中使用 String 时很有意义。其次我们都知道上面的实现不能避免散列冲突(没有hashCode实现可以)，所以基本上我们应该把这个功能当作“性能改进”而已，这对哈希表或类似结构很有用.

如果是这样，那为什么允许我们有例如100 MB 字符串，我们根据所有字符计算哈希？增加一些限制不是更有意义吗？ 32/128 甚至可能是 1024 个字符但不是整个 value.length？是的，如果我们有两个不同的字符串，它们的前缀与我们的限制一样长，那么我们就会发生哈希冲突，但是无论如何我们都无法避免冲突，所以从性能的角度来看，我个人会将 for 循环更改为类似以下内容:

int limit = value.length > 32 ? 32 : value.length;
for (int i = 0; i < limit; i++) {
    h = 31 * h + val[i];
}

你怎么看？

最佳答案

我想到了几个可能的原因:

字符串仅在开头或结尾处变化是很常见的，例如所有 StackOverflow 问题 URL 都以“https://stackoverflow.com/questions/”开头。因此，将 hashCode 限制为仅字符子集会导致不必要的冲突，并且对于某些字符串集会导致许多冲突。您提出的算法会导致每个 stackoverflow 问题 URL 都具有相同的 hashCode!
hashCode 速度快且可内存，目前尚不清楚将 hashCode 限制为某个常量长度是否会带来显着的性能改进，尤其是因为它总是先于创建字符串(O(n) 操作)，并且通常随后调用 equals(也为 O(n))。
遗留原因。 String.hashcode指定使用特定算法。现有应用程序依赖于此规范。即使现在认为有必要进行这种优化，也无法在不破坏向后兼容性的情况下进行。

关于java - 为什么 String hashCode 没有大小限制？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56040029/

24

4

0

文章推荐： ios - 在越狱的 iDevice 上以编程方式卸载应用程序

文章推荐： java - 按下键后如何控制edittext中的文本？

文章推荐： java - 如何在循环中设置数组的 3 个连续位置和 RGB 值

文章推荐： ios - 将 Delegate 设置为自身 PaperFoldMenuController

java - 重写 hashcode 方法以返回类中变量的 hashcode
class UserScoring implements Comparable { User user; int score; UserScoring(
java - 重写 hashCode，为什么不使用 this.hashCode() ？
当重写 Java 中的 equals() 和 hashcode() 方法时，为什么不经常使用它: public int hashCode() { return (int) this.hashC
java - hashCode() 和 == 可以在不覆盖 hashCode 的情况下发散吗
给定java Object#hashCode文档快照: As much as is reasonably practical, the hashCode method defined by class
android - Signature.hashCode 是指正确的 hashCode 吗？
下面的代码(sign.hashCode())是给我签名的hashCode还是内存中对象的hash？ try { PackageInfo packageInfo = getPackageMana
java - 给定一组字符串段，有没有办法计算 hashCode 使其等于连接字符串的 hashcode？
考虑: String[] segments = {"asdf", "qwerty", "blahblah", "alongerstring", "w349fe3434"}; String fullSt
java - 您可以只在 hashCode() 方法中返回字段的 hashCode() 值吗？
在审查大型代码库时，我经常遇到这样的情况: @Override public int hashCode() { return someFieldValue.hashCode(); } 程序员不
c# - 与此 hashcode 函数发生 HashCode 冲突的可能性有多大？
在以下情况下，与下面的函数发生 HashCode 冲突的可能性有多大。 key[0]、key[1]、key[2]、key[3] 的随机整数值使用具有以下约束的随机键值键[0] <1,000,000
hashcode - Objects.hash() 与 Objects.hashCode()，需要澄清
从 Java 7 开始，我们有了 o.hashCode(); Objects.hashCode(o); Objects.hash(o); 前两个与空检查大致相同，但最后一个是什么？ When a si
Java:object.hashCode() 和 Objects.hashCode(object)
这个问题已经有答案了: Objects.hash() vs Objects.hashCode(), clarification needed (3 个回答) 已关闭 6 年前。一个简单、简短的问题:
java - 用父类(super class) hashCode 和对象覆盖 hashCode
我是否需要使用super.hashcode()来计算this.hashcode()？ IDE(例如 IntelliJ Idea)可以生成 equals 和 hashcode。它可以使用 java.ut
java - 为什么 this.hashCode() 和 super.hashCode() 在子类中返回相同的值？
class A { } class B extends A { void m1(){ System.out.println(this.hashCode());
java - Java Arrays.hashcode() 的 hashcode 实现是否均匀分布
我查看了Arrays.hashCode(char[] c)的源代码我不太确定它适用的算法是否在所有情况下都能正常工作。 public static int hashCode(int a[])
hashcode - Lombok.hashCode 问题为 "java.lang.StackOverflowError: null"
我有两个表具有一对一的关系，如下所示: @Entity @Data @NoArgsConstructor @AllArgsConstructor public class Book { @Id
java - 为什么 String 对象的 hashCode() 与自定义类对象的 hashCode() 不同？
为什么stringObject的hashcode是我提供的字符串？ String s = new String(); // here the hascode is 0. 但是当我获得我创建的某个对象的
java - 我应该如何使用 google guava hashCode() 调用 super.hashcode
public abstract class HolidayPackageVariant { private HolidayPackage holidayPackage; private String
java - Objects.hashCode() 和 new Object().hashCode() 的区别？
这两个代码片段有什么区别？片段 1: Object o = new Object(); int i = Objects.hashCode(o); 片段 2: Object o = new Objec
java - Guava.Objects.hashCode 与 Java.Objects.hashCode
在 Java 8 中有一个类 java.util.Objects，其中包含 hashCode() 方法。同时 Google Guava 19 包含 com.google.common.base.Obj
java - HashMap.get() 与继承的 hashCode() 方法一起正常工作，不能识别用户定义的 hashCode() 方法的键
我的一个类(class)中有以下方法。它只是 HashMap 的公共(public)包装器(名为 teamOfPlayer，具有 Player 对象的键和 Integer 对象的值)，仅此而已。 pu
java - 为什么我使用 hashcode builder 为 2 个相同的对象获得不同的 hashcode 值？
我在这里做错了什么？ @Override public int hashCode() { HashCodeBuilder has
java - employee.hashCode() 与 employee.getClass().hashcode() 在 Java 中的对比
我有以下程序。 Employee employee1 = new Employee("Raghav1", 101); Employee employee2 = new Employee("Raghav

首页

博学

6Ren·AI

商城

java - 为什么 String hashCode 没有大小限制？