gpt4 book ai didi

python-3.x - Python - 如何递归搜索作为列表元素的文本中的变量子字符串

转载 作者:行者123 更新时间:2023-12-03 16:51:05 24 4
gpt4 key购买 nike

让我更好地解释一下我在标题中的意思。
要搜索的字符串示例(即可变长度的字符串每个都是列表的一个元素;实际上非常大):

STRINGS = ['sftrkpilotndkpilotllptptpyrh', 'ffftapilotdfmmmbtyrtdll', 'gftttepncvjspwqbbqbthpilotou', 'htfrpilotrtubbbfelnxcdcz']

要查找的子字符串,我知道这是肯定的:

  • 包含在STRINGS的每个元素中>
  • 也包含在一个SOURCE字符串中
  • 具有一定的固定 LENGTH(本例中为 5 个字符)。
SOURCE = ['gfrtewwxadasvpbepilotzxxndffc']

我正在尝试编写一个 Python3 程序,它可以找到 SOURCE 中这个包含 5 个字符的隐藏 word 以及它在每个元素中出现的位置字符串

我也在尝试将结果存储在数组或字典中(目前我不知道哪个更方便)。

此外,我需要执行其他相同类型但具有不同 LENGTH 值的搜索,因此该值应由变量提供以便更通用。

我知道第一个点在之前的帖子中已经解决了,但是从来没有(据我所知)与 second 点一起,这是我无法成功处理的代码部分(我没有发布我的代码,因为我知道它离修复太远了)。

非常感谢来自这个伟大社区的任何帮助。

-- 毛里齐奥

最佳答案

您可以遍历源字符串,并为每个子字符串使用 re 模块来查找每个其他字符串中的位置。然后,如果每个字符串至少出现一次,则产生结果:

import re

def find(source, strings, length):
for i in range(len(source) - length):
sub = source[i:i+length]
positions = {}
for s in strings:
# positions[s] = [m.start() for m in re.finditer(re.escape(sub), s)]
positions[s] = [i for i in range(len(s)) if s.startswith(sub, i)] # Using built-in functions.
if not positions[s]:
break
else:
yield sub, positions

生成器可以像下面的例子一样使用:

import pprint

pprint.pprint(dict(find(
source='gfrtewwxadasvpbepilotzxxndffc',
strings=['sftrkpilotndkpilotllptptpyrh',
'ffftapilotdfmmmbtyrtdll',
'gftttepncvjspwqbbqbthpilotou',
'htfrpilotrtubbbfelnxcdcz'],
length=5
)))

产生以下输出:

{'pilot': {'ffftapilotdfmmmbtyrtdll': [5],
'gftttepncvjspwqbbqbthpilotou': [21],
'htfrpilotrtubbbfelnxcdcz': [4],
'sftrkpilotndkpilotllptptpyrh': [5, 13]}}

关于python-3.x - Python - 如何递归搜索作为列表元素的文本中的变量子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58917815/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com