gpt4 book ai didi

python - 替换多个模式python

转载 作者:行者123 更新时间:2023-11-30 22:59:33 25 4
gpt4 key购买 nike

我已经查看了各种链接,但所有链接都展示了如何一次性替换多个单词。然而,我想替换的不是单词,而是模式,例如

RT @amrightnow: "The Real Trump" Trump About You" Watch Make #1 https:\/\/t.co\/j58e8aacrE #tcot #pjnet #1A #2A #Tru mp #trump2016 https:\/\/t.co\u2026

当我对上面的文本执行以下两个命令时,我得到了所需的输出

result = re.sub(r"http\S+","",sent)
result1 = re.sub(r"@\S+","",result)

这样我就删除了所有的 url 和 @(推文中的处理程序)。输出将如下所示:

>>> result1
'RT "The Real Trump" Trump About You" Watch Make #1 #tcot #pjnet #1A #2A #Trump #trump2016 '

有人可以告诉我最好的方法是什么吗?我基本上会从文件中读取推文。我想阅读每条推文并将这些处理程序和网址替换为空白。

最佳答案

您需要正则表达式“或”运算符,它是管道|:

re.sub(r"http\S+|@\S+","",sent)

如果您有一长串要删除的模式,常见的技巧是使用 join 创建正则表达式:

to_match = ['http\S+',
'@\S+',
'something_else_you_might_want_to_remove']

re.sub('|'.join(to_match), '', sent)

关于python - 替换多个模式python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35713540/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com