gpt4 book ai didi

python - 重新搜索逗号/分隔符删除的子字符串

转载 作者:行者123 更新时间:2023-12-01 00:40:52 25 4
gpt4 key购买 nike

我有一个文本,并使用一个函数来提取文本的一部分。但是,在返回值中,分隔符(例如“,”,“-”)被删除。我需要找到原文中提取的部分,包括子字符串和位置。例如:

original_text = "xyz, 19900 Praha 9, Letnany"
(or original_text = "xyz, 19900 Praha 9 - Letnany")
extracted_text = "praha 9 letnany" (lower case, delimiters are removed)

我希望输出与 re.search('praha 9, letnany', Original_text) 的输出相同,这意味着获取子字符串 'Praha 9, Letnany' 和比赛开始:11。

是否有正则表达式可以在原始文本中定位提取的文本?

  • 函数的输出无法更改(到目前为止)
  • 我尝试查找与使用正则表达式时忽略某些字符相关的问题,但它们的问题是不同的。

最佳答案

这将在原始文本中找到与提取的文本匹配的范围,忽略大小写并随意插入分隔符(在本例中为逗号或破折号):

import re

pat = ("[,-]*".join(list(extracted_text))).replace(" ","\\s")

mat = re.search( pat, original_text, re.I )
if mat:
print(mat.span())
else:
print("No match")

关于python - 重新搜索逗号/分隔符删除的子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57361746/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com