java - Rabin-Karp 哈希码太大-6ren

java - Rabin-Karp 哈希码太大

转载作者：塔克拉玛干更新时间：2023-11-03 04:19:33

25

4

rolling hash Rabin-Karp算法中hashcode值过大如何处理？我使用模运算来避免负数，但是当哈希码超过我的模数(N = 83559671)时会出现问题。我将我的基数设置为素数(计算哈希码的数字)以及模数(非常大)，但它不适用于长字符串。任何人都可以看到问题吗？

这是我的代码。

   public static void main(String [] args){

       int P = 13;         // base
       long M = 83559671;
       long iHash = 0;    
       String word = "abcbadccaaaabbbb";
       int WINDOW = 9;

       for(int i = 0; i < WINDOW; i++){
            iHash = int_mod(int_mod(iHash*P, M) + word[i], M);
       }

       for(int i = WINDOW; i < word.length; i++){
            iHash = int_mod(iHash - word[i-WINDOW] * get_pow(P, WINDOW-1, M), M);
            iHash = int_mod(iHash * P, M);
            iHash = int_mod(iHash + word[i], M);
       }

   }
   public static long get_pow(int p, int t, long M){
        long a = 1;
        for(int i = 0 ; i < t; i++){
              a = int_mod(a * p, M);
        }
        return a;
   }

   public static long int_mod(long a, long b){
        return (a % b+ b) % b;
   }

问题是当我有任何长度超过 8 的字符串时，字符串的哈希码超过模数 83559671，这导致我在进行比较时得到错误的答案。任何较短的字符串都可以正常工作。

最佳答案

您根本不需要计算模数。这是一个演示:

public class Foo {
  private static int hash(String s) {
    int hash = 0;
    for (int i = 0; i < s.length(); i++) {
      hash *= 31;
      hash += s.charAt(i);
    }
    return hash;
  }

  public static void main(String[] args) {
    String s1 = "abcdefghij";
    String s2 = s1.substring(1) + "k";
    int pow = 1;
    for (int i = 0; i < s1.length(); i++) {
      pow *= 31;
    }
    System.out.printf("hash(%s) = %d%n", s1, hash(s1));
    System.out.printf("hash(%s) = %d%n31 * hash(%s) - (31^%d * %s) + %s = %s%n",
        s2,
        hash(s2),
        s1,
        s1.length(),
        s1.charAt(0),
        s2.charAt(s2.length() - 1),
        31 * hash(s1) - (pow * s1.charAt(0)) + s2.charAt(s2.length() - 1));
  }
}

这(正确地)打印出:

hash(abcdefghij) = -634317659
hash(bcdefghijk) = 21611845
31 * hash(abcdefghij) - (31^10 * a) + k = 21611845

关于java - Rabin-Karp 哈希码太大，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12452527/

25

4

0

文章推荐： java - 在 Azure 应用服务上部署 Spring Boot jar

文章推荐： algorithm - 逆时针排列凹多边形顶点

文章推荐： Java 流 API : Looking for elegant way for filterAndMap

algorithm - Rabin Karp算法的一点修改版本的可行性
我正在尝试实现 Rabin Karp 算法的一些修改版本。我的想法是，如果我根据与每个字母相关的权重得到给定模式的哈希值，那么我就不必担心字谜，这样我就可以只选择字符串的一部分，计算它的哈希值并进行比
string - Rabin karp字符串匹配算法复杂度
在 rabin 算法中取模如何帮助降低本地 horners 规则字符串匹配的复杂性。请任何人解释最佳答案我猜按照 Horners 规则，你的意思是将字符串视为某个基数中的数字 ("abcd"= '
java - Rabin-Karp算法Java的滚动哈希算法
我一直在尝试理解算法类的 Rabin-Karp 算法。我在理解它时遇到了很多麻烦，所以我尝试实现它(我实际上不必实现它)。我想我正确地理解了滚动哈希函数以外的所有内容。我的算法目前只适用于模式 cha
algorithm - Rabin-Karp算法中如何选择模值？
我有一个关于选择 q 和 d 的问题 in Rabin-Karp algorithm用于搜索字符串。该算法使用值 q 作为模数，使用 d 作为哈希函数。如果我选择 q 作为 2 的幂并且 d=q-1
c# - Rabin Karp字符串匹配算法
我在网站的论坛上看到过这个 Rabin Karp 字符串匹配算法，我有兴趣尝试实现它，但我想知道是否有人能告诉我为什么变量 ulong Q 和 ulong D 是 100007 和 256分别:S？这
Python:Rabin-Karp算法散列
我实现 Rabin-Karp 算法只是为了好玩。我遇到了这个伪代码: RABIN -KARP -MATCHER (T, P, d, q) 1 n = T.length 2 m
c - Miller-Rabin 实现中的错误
我正在实现 Wikipedia's Miller-Rabin algorithm但似乎没有得到甚至模糊恰当的结果。 7, 11, 19, 23 等被报道为复合 Material 。事实上，当 k>12
c++ - Rabin-Karp 算法代码中的负哈希值
我从这个网站理解了 Rabin-Karp 算法:https://www.geeksforgeeks.org/rabin-karp-algorithm-for-pattern-searching/ 他们
primes - Miller-Rabin 素性测试的典型运行时间是什么？
我很清楚单个 Miller-Rabin 测试以三次对数时间运行。我知道蒙哥马利模幂和 GNFS 并且我不会问任何那些奇特的理论。我想知道的是，在特征硬件(例如，2.2 GHz Opteron 或某某显
c++ - Miller-Rabin 素性测试给出了错误的答案
我正在尝试制作 RSA 算法。为此，我需要 rabin-miller+witness+modular exponentiation(至少我需要使用它)。当我生成随机数以检查 rabin miller
java - Rabin-Karp 滚动哈希
在 Coursera 视频之一中，Rabin-Karp 滚动哈希 (http://en.wikipedia.org/wiki/Rolling_hash) 显示为: public static long
c - Rabin-Karp 字符串搜索算法
我的 previous question属于通用字符串搜索算法。我正在研究 Rabin-Karp 算法，我有一个函数模板，例如: RabinKarpMatch(char *Text, char *Se
python - (Miller-Rabin)如何处理大指数的数字？
我有 Miller-Rabin 实现 def MillerRabin(n,a): e = 0 q = n-1 while q % 2 == 0: e +=
python - Karp-Rabin 模式匹配算法的简单实现
我在实现 Karp-Rabin 的简单版本时遇到问题模式行进者；我没有得到预期的结果。这是我的例子； string='today is a good day' sub='good' 我想在上面的字符串
字符串 Rabin-Karp 基本数字符号
我正在阅读 Cormen 等人的《算法导论》中有关字符串算法的内容以下是关于一些初等数论符号的文本。注意:在下文中将 == 称为模等价。给定一个整数除以另一个整数的余数的定义明确的概念，提供特殊
java - Rabin-Karp 哈希码太大
rolling hash Rabin-Karp算法中hashcode值过大如何处理？我使用模运算来避免负数，但是当哈希码超过我的模数(N = 83559671)时会出现问题。我将我的基数设置为素数(计
c++ - Rabin-Karp 算法的最佳哈希函数是什么？
我正在为 Rabin-Karp 算法寻找高效的哈希函数。这是我的实际代码(C 编程语言)。 static bool f2(char const *const s1, size_t const n1,
c++ - Rabin-Karp 字符串匹配不匹配
我一直在使用 C++ 编写 Rabin-Karp 字符串匹配函数，但没有得到任何结果。我感觉我没有正确计算某些值，但我不知道是哪一个。原型(prototype) void rabinKarp(str
c++ - Rabin-Karp 算法
我有兴趣实现 Rabin-Karp 算法来搜索 wiki 上所述的子字符串:http://en.wikipedia.org/wiki/Rabin-Karp_string_search_algorith
c# - Rabin-Karp 字符串搜索算法中使用的滚动哈希函数是否有任何有效的实现？
我希望使用滚动哈希函数，这样我就可以对非常大的字符串的 n-gram 进行哈希处理。例如: “stackoverflow”，分成 5 克将是: "stack", "tacko", "ackov",

首页

博学

6Ren·AI

商城

java - Rabin-Karp 哈希码太大