python - 减少 Anagram 词搜索的计算时间-6ren

python - 减少 Anagram 词搜索的计算时间

转载作者：太空宇宙更新时间：2023-11-04 07:29:21

24

4

下面的代码是一种搜索单词列表并创建任何 Anagrams 子列表的蛮力方法。

搜索整个英语词典非常耗时，所以我很好奇有人有降低代码计算复杂性的技巧吗？

def anogramtastic(anagrms):
    d = []
    e = []
    for j in range(len(anagrms)):
        if anagrms[j] in e:
            pass
        else:
            templist = []
            tester = anagrms[j]        
            tester = list(tester)
            tester.sort()
            tester = ''.join(tester)
            for k in range(len(anagrms)):
                if k == j:
                    pass
                else:
                    testers = anagrms[k]        
                    testers = list(testers)
                    testers.sort()
                    testers = ''.join(testers)
                    if testers == tester:
                        templist.append(anagrms[k])
                        e.append(anagrms[k])
            if len(templist) > 0:
                templist.append(anagrms[j])
                d.append(templist)
    d.sort(key=len,reverse=True) 
    return d

print(anogramtastic(wordlist))

最佳答案

使用卡住集字典怎么样？ Frozensets 是不可变的，这意味着您可以对它们进行哈希处理以进行持续查找。当谈到变位词时，使两个词彼此变位词的原因是它们具有相同的字母和相同的计数。因此，您可以构造一个由 {(letter, count), ...} 对组成的卡住集，并对它们进行哈希处理以进行高效查找。

这是一个使用 collections.Counter 将单词转换为多重集的快速小函数:

from collections import Counter, defaultdict

def word2multiset(word):
    return frozenset(Counter(word).items())

现在，给定一个单词列表，像这样填充你的 Anagram 字典:

list_of_words = [... ]

anagram_dict = defaultdict(set)
for word in list_of_words:
    anagram_dict[word2multiset(word)].add(word)

例如，当list_of_words = ['hello', 'olleh', 'test', 'apple']时，这是anagram_dict运行后的输出上面的循环:

print(anagram_dict)
defaultdict(set,
            {frozenset({('e', 1), ('h', 1), ('l', 2), ('o', 1)}): {'hello',
              'olleh'},
             frozenset({('e', 1), ('s', 1), ('t', 2)}): {'test'},
             frozenset({('a', 1), ('e', 1), ('l', 1), ('p', 2)}): {'apple'}})

关于python - 减少 Anagram 词搜索的计算时间，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51118108/

24

4

0

文章推荐： python django 或条件

文章推荐： java - 数组在多线程环境中。读和写都

文章推荐： java - ORA-03115 : unsupported network data type or representation

文章推荐： python - 将列表中的元素添加到字典并增加值

anagram - 这是最好的字谜检查解决方案吗？
我正在寻找一种有效的解决方案来检查两个字符串是否是字谜词，但字符表/字典检查对于 unicode 可能不是一个好的解决方案。我已经提出了一个解决方案，但我不知道如何在数学上证明它是正确的。公式表达为“
java - Anagrams - 我怎样才能通过以下两个测试用例
这是我的代码，用于判断两个字符串是否是字谜 static boolean isAnagram(String a, String b) { if (a.length() != b.length(
java - 我正在尝试检查 Anagram
为什么代码向我显示缺少 return 语句的错误？我想做的是检查字符串的长度及其内容并比较它们。 import java.util.Scanner; public class Solution {
使用通配符 (*) 和随机顺序比较字符串 — Anagrams
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
Java Anagram 内存不足
我正在尝试解决古老的字谜问题。感谢那里的许多教程，我能够遍历一组字符串，递归地找到所有排列，然后将它们与英语单词列表进行比较。我发现的问题是，在大约三个词之后(通常是“变形”之类的词)，我得到了 Ou
Python Anagrams 递归
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 7 个月前。 Improve
c - "Anagram"用C写的程序
完全披露我是一名正在做家庭作业的大学生。我不一定是在寻找我的问题的直接答案，而是在寻找正确方向的插入力。所以这是我的问题。我必须编写一个接受 2 个命令行参数的 C 程序，一个是包含单词列表的文件，另
java - Anagram 排序最后一步
我试图执行变位词排序，直到这里我才这样做: 我对数组中的每个string进行了排序，并将其存储到hashmap中。现在我有一个映射，键是字符串，值是该字符串的变位词。代码如下: public st
Java anagram 查找器算法
我在 Java 中有一个 Strings 数组。我需要从数组中找到字谜并将它们打印到屏幕上。我在比较数组元素以检查它们是否是字谜的部分遇到了困难。我该怎么做？显然，我必须创建一个循环才能遍历数组。
Java Anagram 求解器
我可以弄清楚如何创建字符串的变位词，但我不知道如何将它们与真实单词词典进行比较以检查变位词是否是真实单词。 Java API 中是否有包含整个英语词典的类？最佳答案没有，但是你可以从 variou
49. Group Anagrams 字母异位词分组
题目地址：https://leetcode.com/problems/anagrams/#/descriptionopen in new window 题目描述 Given an array of
242. Valid Anagram 有效的字母异位词
题目地址：https://leetcode.com/problems/valid-anagram/open in new window Total Accepted: 78186 Total Sub
javascript - JavaScript Anagram 函数的时间复杂度
我有一个分配给一个函数，该函数将接受 2 个字符串并返回需要删除的字符数，以便使 2 个字符串彼此变位。我的问题是这个函数的时间复杂度是多少以及是否有更快的方法来达到相同的结果。这是我的解决方案: f
anagram - 问题 98 - 欧拉计划
问题如下: 通过将 CARE 一词中的每个字母分别替换为 1、2、9 和 6，我们形成一个平方数:1296 = 36^(2)。值得注意的是，通过使用相同的数字替换，字谜词 RACE 也形成了一个平方数
java - 在另一个字符串中查找字符串的 Anagrams 的最佳算法
我在 Cracking The Coding Interview 书中遇到了这个主题。挑战在于找到给定的较小字符串 s 在较大字符串 b 中的排列。我可以提出以下算法，其时间复杂度为 O(B x S)
java - 黑客排名 : Sherlock and Anagrams
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
java - Anagram Checker 解决管测验
正如您在标题中看到的，我正在尝试编写一个程序，该程序可以为我解决“晚间标准管测验”。它的一部分。它必须能够在地铁站名称中找到字谜。我在网上找到了很多代码来检查两个单词是否是字谜。但我需要一些不同的东西
c++ - C++ Anagram Solver速度优化
我决定为我的父亲制作一个字谜解算器。我对编程很陌生，但我认为我仍然可以做到。我的成品可以用，但是速度确实很慢，例如找到8个字符的所有组合花了大约15分钟以上。我正在寻找对其进行优化/使其更快的方法。
c - Anagram - 最小删除数量 - 某些测试用例失败
这是一个解决以下问题的程序:“给定两个字符串和，其长度可能相同也可能不同，确定制作和字谜所需的最小字符删除数。可以从其中删除任何字符任一字符串”。最后，两个字符串应该具有相同的字母，并且每个字
java - 在不使用数组的情况下生成并打印数字的所有 "anagrams"的程序
这是一个 Java 程序，可以在不使用数组的情况下生成和打印四位数字的所有可能的“Anagrams”。到目前为止，这是我能够做的: import java.util.*; class Anag {

首页

博学

6Ren·AI

商城

python - 减少 Anagram 词搜索的计算时间