- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的标题被编辑了,所以我想确保每个人都知道这是作业。问题只是优化程序,散列是我的想法。
--
我正在优化一个 C 程序,该程序将彼此是变位词的单词组合在一起,然后将它们打印出来。
目前程序基本上是链表的链表。外部列表中的每个链接都是一组单词,它们是彼此的变位词。
该程序的配置文件显示,到目前为止,执行时间的最大部分是函数 wordLookup
。这是因为它必须搜索每个节点,并且可能从文件中读入 10 万个单词,这可能需要很长时间。例如,这是用于读取 40k 单词的 gprof
输出:
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls us/call us/call name
100.31 1.48 1.48 40000 37.12 37.12 wordLookup
0.00 1.48 0.00 78235 0.00 0.00 newnode
0.00 1.48 0.00 40000 0.00 0.00 sort_string
0.00 1.48 0.00 38235 0.00 0.00 wordInsert
0.00 1.48 0.00 1996 0.00 0.00 swap_words
0.00 1.48 0.00 1765 0.00 0.00 wordAppend
为了加快速度,我的想法是将数据结构更改为一个哈希表,该哈希表将所有彼此的字谜链接在同一个槽中。
根据我的教授所说的内容和我在这里阅读的内容,我正在为我的哈希函数考虑类似的东西。 (注意:素数的分布是使用次数最多的字母是低数,最少使用的字母是高数。)
sort(string)
array alpha_primes = 5,71,37,29,2,53,59,19,11,83,79,31,43,13,7,67,97,23,17,3,41,73,47,89,61,101
hash(String) {
hash = 1
for (char in String) {
hash *= alpha_primes[char-'a'];
}
return hash % tablesize
}
是否有针对此问题的哈希表大小可以适本地分配值,以便每组变位词在表中都有一个不同的索引?
如果那不可能,那么我应该:
最佳答案
无法保证哈希值是唯一的。碰撞的概率可以通过生日问题来计算,最好的办法是将它最小化。
2 个组散列为相同值的概率可以近似为 1-e^((-k(k-1))/2n),其中 k 是您拥有的组的总数(大致相同作为你的字数),n 是你的散列的搜索空间(2^(散列的长度))。
我的词典大约有 100000 个单词,32b 哈希非常好(2% 的冲突)。但是,那么大的哈希表将使用 4GB 的 RAM。使用较小的表意味着更多的冲突。链接或探测不会在时间上产生巨大差异。
正如在对您的问题的评论中所建议的那样,一个 trie 将以一个整体较小的数据结构结束。
关于c - Anagrams - 在 C 中使用链接和探测进行散列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15993928/
我正在寻找一种有效的解决方案来检查两个字符串是否是字谜词,但字符表/字典检查对于 unicode 可能不是一个好的解决方案。我已经提出了一个解决方案,但我不知道如何在数学上证明它是正确的。公式表达为“
这是我的代码,用于判断两个字符串是否是字谜 static boolean isAnagram(String a, String b) { if (a.length() != b.length(
为什么代码向我显示缺少 return 语句的错误? 我想做的是检查字符串的长度及其内容并比较它们。 import java.util.Scanner; public class Solution {
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
我正在尝试解决古老的字谜问题。感谢那里的许多教程,我能够遍历一组字符串,递归地找到所有排列,然后将它们与英语单词列表进行比较。我发现的问题是,在大约三个词之后(通常是“变形”之类的词),我得到了 Ou
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题吗? 通过 editing this post 添加细节并澄清问题. 关闭 7 个月前。 Improve
完全披露我是一名正在做家庭作业的大学生。我不一定是在寻找我的问题的直接答案,而是在寻找正确方向的插入力。所以这是我的问题。我必须编写一个接受 2 个命令行参数的 C 程序,一个是包含单词列表的文件,另
我试图执行变位词排序,直到这里我才这样做: 我对数组中的每个string进行了排序,并将其存储到hashmap中。 现在我有一个映射,键是字符串,值是该字符串的变位词。 代码如下: public st
我在 Java 中有一个 Strings 数组。我需要从数组中找到字谜并将它们打印到屏幕上。 我在比较数组元素以检查它们是否是字谜的部分遇到了困难。我该怎么做?显然,我必须创建一个循环才能遍历数组。
我可以弄清楚如何创建字符串的变位词,但我不知道如何将它们与真实单词词典进行比较以检查变位词是否是真实单词。 Java API 中是否有包含整个英语词典的类? 最佳答案 没有,但是你可以从 variou
题目地址:https://leetcode.com/problems/anagrams/#/descriptionopen in new window 题目描述 Given an array of
题目地址:https://leetcode.com/problems/valid-anagram/open in new window Total Accepted: 78186 Total Sub
我有一个分配给一个函数,该函数将接受 2 个字符串并返回需要删除的字符数,以便使 2 个字符串彼此变位。我的问题是这个函数的时间复杂度是多少以及是否有更快的方法来达到相同的结果。这是我的解决方案: f
问题如下: 通过将 CARE 一词中的每个字母分别替换为 1、2、9 和 6,我们形成一个平方数:1296 = 36^(2)。值得注意的是,通过使用相同的数字替换,字谜词 RACE 也形成了一个平方数
我在 Cracking The Coding Interview 书中遇到了这个主题。挑战在于找到给定的较小字符串 s 在较大字符串 b 中的排列。我可以提出以下算法,其时间复杂度为 O(B x S)
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
正如您在标题中看到的,我正在尝试编写一个程序,该程序可以为我解决“晚间标准管测验”。它的一部分。它必须能够在地铁站名称中找到字谜。我在网上找到了很多代码来检查两个单词是否是字谜。但我需要一些不同的东西
我决定为我的父亲制作一个字谜解算器。我对编程很陌生,但我认为我仍然可以做到。我的成品可以用,但是速度确实很慢,例如找到8个字符的所有组合花了大约15分钟以上。我正在寻找对其进行优化/使其更快的方法。
这是一个解决以下问题的程序:“给定两个字符串 和 ,其长度可能相同也可能不同,确定制作 和 字谜所需的最小字符删除数。可以从其中删除任何字符任一字符串”。最后,两个字符串应该具有相同的字母,并且每个字
这是一个 Java 程序,可以在不使用数组的情况下生成和打印四位数字的所有可能的“Anagrams”。到目前为止,这是我能够做的: import java.util.*; class Anag {
我是一名优秀的程序员,十分优秀!