python - 在指定时间内查找所有排列匹配-6ren

python - 在指定时间内查找所有排列匹配

转载作者：行者123 更新时间：2023-12-01 03:18:44

24

4

我正在编写一个程序，该程序需要 9 个字符，创建所有可能的排列，并获取每个字符的字典文件，然后创建一组所有可能的单词。我需要做的是将所有排列与单词进行比较并返回匹配项。

import os, itertools

def parsed(choices): 
    mySet = set()
    location = os.getcwd()
    for item in choices: 
        filename = location + "\\dicts\\%s.txt" % (item)
        mySet.update(open(filename).read().splitlines())

    return mySet  

def permutations(input): 
    possibilities = []
    pospos = []   

    for x in range(3,9):
        pospos.append([''.join(i) for i in itertools.permutations(input, x)])


    for pos in pospos: 
        for i in pos: 
            possibilities.append(i)
    return possibilities

有问题的函数是这个:

def return_matches(): 
    matches = []
    words = parsed(['s','m','o','k','e', 'j', 'a', 'c', 'k'])
    pos = permutations(['s','m','o','k','e', 'j', 'a', 'c', 'k'])

    for item in pos:  
        if item in words: 
            matches.append(item)

    return matches

此代码应返回:

matches = ['a', 'om', 'ja', 'jo', ..., 'jacks', 'cokes', 'kecks', 'jokes', 'cakes', 'smoke', 'comes', 'makes', 'cameos']

如果我让这段代码正常工作，需要 10 - 15 分钟才能完成。另一方面，每次尝试在指定的时间内执行此操作，都只能使用 5 个或更少的字符来完成，否则会返回错误的结果。

所以我的问题是如何优化这段代码以在 30 秒内返回正确的结果。

编辑 http://www.mso.anu.edu.au/~ralph/OPTED/v003这是我正在从中抓取字典文件的网站。

最佳答案

在测试它们是否有效之前，将所有排列存储在列表中会浪费 RAM 和时间。相反，在生成排列时对其进行测试，并将有效的排列保存到一组中以消除重复。

由于 itertools.permutations 的方式，重复是可能的作品:

Elements are treated as unique based on their position, not on their value. So if the input elements are unique, there will be no repeat values in each permutation.

您的输入单词“SMOKEJACK”包含 2 K，因此每个包含 K 的排列都会生成两次。

无论如何，这里有一些使用 SOWPODS 的代码英语拼字游戏单词表。

from itertools import permutations

# Get all the words from the SOWPODS file
all_words = set('AI')
fname = 'scrabble_wordlist_sowpods.txt'
with open(fname) as f:
    all_words.update(f.read().splitlines())

print(len(all_words))

choices = 'SMOKEJACK'

# Generate all permutations of `choices` from length 3 to 8 
# and save them in a set to eliminate duplicates.
matches = set()
for n in range(3, 9):
    for t in permutations(choices, n):
        s = ''.join(t)
        if s in all_words:
            matches.add(s)

for i, s in enumerate(sorted(matches)):
    print('{:3} {}'.format(i, s))

输出

216555
  0 ACE
  1 ACES
  2 ACME
  3 ACMES
  4 AESC
  5 AKE
  6 AKES
  7 AMOK
  8 AMOKS
  9 ASK
 10 CAKE
 11 CAKES
 12 CAM
 13 CAME
 14 CAMEO
 15 CAMEOS
 16 CAMES
 17 CAMS
 18 CASE
 19 CASK
 20 CEAS
 21 COKE
 22 COKES
 23 COMA
 24 COMAE
 25 COMAKE
 26 COMAKES
 27 COMAS
 28 COME
 29 COMES
 30 COMS
 31 COS
 32 COSE
 33 COSMEA
 34 EAS
 35 EKKA
 36 EKKAS
 37 EMS
 38 JACK
 39 JACKS
 40 JAK
 41 JAKE
 42 JAKES
 43 JAKS
 44 JAM
 45 JAMES
 46 JAMS
 47 JOCK
 48 JOCKS
 49 JOE
 50 JOES
 51 JOKE
 52 JOKES
 53 KAE
 54 KAES
 55 KAM
 56 KAME
 57 KAMES
 58 KAS
 59 KEA
 60 KEAS
 61 KECK
 62 KECKS
 63 KEKS
 64 KOA
 65 KOAS
 66 KOS
 67 MAC
 68 MACE
 69 MACES
 70 MACK
 71 MACKS
 72 MACS
 73 MAE
 74 MAES
 75 MAK
 76 MAKE
 77 MAKES
 78 MAKO
 79 MAKOS
 80 MAKS
 81 MAS
 82 MASE
 83 MASK
 84 MES
 85 MESA
 86 MOA
 87 MOAS
 88 MOC
 89 MOCK
 90 MOCKS
 91 MOCS
 92 MOE
 93 MOES
 94 MOKE
 95 MOKES
 96 MOS
 97 MOSE
 98 MOSK
 99 OAK
100 OAKS
101 OCA
102 OCAS
103 OES
104 OKA
105 OKAS
106 OKE
107 OKES
108 OMS
109 OSE
110 SAC
111 SACK
112 SAE
113 SAKE
114 SAM
115 SAME
116 SAMEK
117 SCAM
118 SEA
119 SEAM
120 SEC
121 SECO
122 SKA
123 SKEO
124 SMA
125 SMACK
126 SMOCK
127 SMOKE
128 SOAK
129 SOC
130 SOCA
131 SOCK
132 SOJA
133 SOKE
134 SOMA
135 SOME

这段代码在我的相当古老的 32 位 2GHz 机器上运行大约 2.5 秒，在 Linux 上运行 Python 3.6.0。在 Python 2 上速度稍快一些(因为 Python2 字符串是 ASCII，而不是 Unicode)。

关于python - 在指定时间内查找所有排列匹配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42205319/

24

4

0

文章推荐： asp.net-core - 无法使用 VS 2017 访问 IIS 元数据库

文章推荐： javascript - 如何在 Angular 2 项目中使用 javascript 库

文章推荐： python - Django - 检查对象是否存在，如果存在则引发错误

F# 排列
我需要在给定的列表上生成排列。我设法这样做 let rec Permute (final, arr) = if List.length arr > 0 then for x i
Java 排列
我正在尝试运行我的代码，以便它打印循环排列，尽管我目前只能让它执行第一个排列。它正确运行到我标记的点，但我看不出出了什么问题。我认为 while 循环中没有中断，但我不确定。确实需要一些帮助。 pac
JavaScript 排列
我正在尝试计算不包含连续字母的排列数。我的代码通过了像“aabb”(答案:8)和“aab”(答案:2)这样的测试，但没有通过像“abcdefa”这样的情况(我的答案:2520；正确答案:3600)。这
【排列】（笛卡尔树上dp？）
比赛在这 B.排列前言：笛卡尔树上 dp？这名字很妙啊，但其实不需要笛卡尔树，只不过利用了笛卡尔树的定义一个性质：我们设一个区间 \([l,r]\) 中的最大值的位置为 \(pos\)，
r - 使用条件对字符列进行排序/排列
我正在尝试使用 dplyr 的 arrange 根据条件对字符串进行排序。我想在一列上排列，但如果第二列等于一个值，则按升序排列，如果第二列等于另一个值，则按降序排列。我发现了几个类似的问题(其中一
r - 排列()不识别列名参数
在 R 中，我使用 dplyr更具体地说 arrange() . 不知何故 arrange功能没有按预期工作。在下面的示例中，我首先存储列的名称，然后将此变量作为参数传递给名为“my_functio
qml - GridLayout 排列
以下是我的 main.qml : Window { id: window visible: true width: 800 height: 480 title:
javascript - 找到两个数组的可用组合(排列？)
很难用谷歌搜索这个问题，因为我不确定这些概念叫什么，并且所有“两个数组/组的组合”SO 帖子都没有给我我期望的输出。数组示例: var array1 = ['Bob', 'Tina']; var a
使用两个列表的 Scala 排列
实现以下目标的最佳方法是什么？我有两个列表: val l1 = List("a", "b") val l2 = List(1, 2) 我想生成这个: List ( List(('a', 1)
使用递归的 JavaScript 排列
我知道互联网上有很多针对我的具体问题的解决方案，但我一直在尝试以特定的方式解决它，但它不起作用，我真的无法理解出了什么问题。就我而言，我只想打印排列。这是我的代码: a = "abc"; functi
具有输出列表长度的 Haskell 排列
我有这样的代码来创建排列: --unique permutation perm :: [t] -> [[t]] perm [] = [[]] perm (x:xs) = [(y:zs) | (y,ys
math - 如何高效找到nPr(排列)？
有没有比使用基本公式 n!/(n-r)! 更好的方法？就像我们对 nCr(组合) nCr = (n-l)Cr + (n-1)C(r-1) 一样？最佳答案这样怎么样:nPr = (n−1)Pr +
r - 来自不同集合的混合组合/排列
此问答的动机是 How to build permutation with some conditions in R . 到目前为止，已经有一些很好的 R 软件包，例如 RcppAlgos 和 arr
Erlang 列表理解、排列
我正在修改一本书中的排列示例。以下代码按预期工作。 perms([]) -> [[]]; perms(L) -> [[H|T] || H []; 它返回一个空列表。当我替换时，我得到了这个。
Java 排列 2
大约一周前，我问了一个关于帮助我解决这个问题的问题 Java permutations ，打印排列方法有问题。我已经整理了我的代码，并有一个现在可以工作的工作示例，尽管如果 5 位于数组中的第五个位置
python - 如何计算具有重复元素的列表的排列(排列)
我有一个包含重复元素的列表，即orig = [1,1,1,2,2,3]。我想创建一个derangement b = f(orig)，使得 b 中的每个位置值都与 orig 中的值不同: b[i] !
具有最少随机数的 Java 排列
我想生成一个 array a 的排列而且我不想使用实用功能，例如 java.util.Collections() . 排列应该是随机的，并且每个排列都应该有可能发生 - 但不需要均等分布的概率。以下
java - 排列、递归
我有一个作业:用户输入一个字符串，例如 ABCD，程序必须给出所有排列。我不希望整个代码只是一个提示。这是我到目前为止在他们那里得到的，我没有得到任何实现。以ABCD为例: 在本例中获取字符串长度的
Python Itertools 排列
我目前正在编写一个使用 itertools 的程序，其中的一部分似乎无法正常运行。我希望确定排列函数输出列表长度的输入等于它生成输出的列表长度。换句话说，我有 import itertools b =
python - Itertools 排列
我有一个列表 x=[1,2,3,4,5] 并且想查看这个列表的不同排列，一次取两个数字。 x=[1,2,3,4,5] from itertools import permutations y=list

首页

博学

6Ren·AI

商城

python - 在指定时间内查找所有排列匹配