"这就是这样" 我现在正在使用这个 reg。但它确实改变-6ren">
gpt4 book ai didi

python正则表达式去除重复的单词

转载 作者:太空狗 更新时间:2023-10-30 00:30:03 27 4
gpt4 key购买 nike

我是一个 Python 新手

如果有重复的话,我想换句话。

正确

  • 例如。 “这真是太好了”-->“这真是太好了”
  • 例如。 "这就是这样"--> "这就是这样"

我现在正在使用这个 reg。但它确实改变了字母。前任。 "My friend and i is happy"--> "My friend and is happy"(它删除了“i”和空格)错误

text = re.sub(r'(\w+)\1', r'\1', text) #remove duplicated words in row

我怎样才能做同样的改变,但它必须检查单词而不是字母?

最佳答案

text = re.sub(r'\b(\w+)( \1\b)+', r'\1', text) #remove duplicated words in row

\b 匹配空字符串,但仅在单词的开头或结尾。

关于python正则表达式去除重复的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17238587/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com