gpt4 book ai didi

Python 正则表达式 - 删除特定模式

转载 作者:太空宇宙 更新时间:2023-11-03 14:34:27 25 4
gpt4 key购买 nike

我正在尝试使用正则表达式来删除与数据集中的流派名称相关的特定关键代码。然而,到目前为止,我所拥有的是摆脱大部分键码,但留下一些字母,我不知道为什么。经检查,似乎主要是在后面有字母的 0 处出现问题,例如“/m/0lxr”留下了 lxr。

如果有人知道我将如何解决这个问题,请告诉我!

这是我到目前为止的代码。

def prepare(self, word): 
word = re.sub(r'//', "", word)
word = re.sub(r'/\u[0-9][a-z]', "", word)

word = re.sub(r'/.', "", word)
word = re.sub(r'/,', "", word)
word = re.sub(r'/!', "", word)
word = re.sub(r'/?', "", word)
word = re.sub(r'/{', "", word)

word = re.sub(r"'", "", word)
word = re.sub(r"//m//[0-9][a-z]+", "", word)
word = re.sub(r'[0-9][a-z]+', "", word)
word = re.sub(r'[a-z][0-9]+', "", word)

return word

最佳答案

您可以使用ast.literal_eval:

import ast
s = '{"/m/0lsxr":"Crime Fiction"}'
final_output = ast.literal_eval(s).values()
print(final_output)

输出:

['Crime Fiction']

关于Python 正则表达式 - 删除特定模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47057009/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com