gpt4 book ai didi

python - 如何高效去除字符串中连续重复的单词或短语

转载 作者:太空狗 更新时间:2023-10-30 02:35:54 30 4
gpt4 key购买 nike

<分区>

我有一个包含重复出现的短语的字符串,或者它甚至可能是一个连续多次出现的单词。

尝试了各种方法,但找不到更节省时间和空间的方法。

这是我尝试过的方法

  1. 分组()
  2. 重新
String = "what type of people were most likely to be able to be able to be able to be able to be 1.35 ?"
s1 = " ".join([k for k,v in groupby(String.replace("&lt;/Sent&gt;","").split())])
s2 = re.sub(r'\b(.+)(\s+\1\b)+', r'\1', String)

他们两个似乎都不适用于我的情况

我的预期结果:

什么类型的人最有可能达到 1.35?

这些是我引用的一些帖子

  1. Is there a way to remove duplicate and continuous words/phrases in a string? - 不起作用
  2. How can I remove duplicate words in a string with Python? - 部分工作,但也需要针对大字符串的最佳方式

请不要将我的问题标记为与上面的帖子重复,因为我尝试了大部分实现但没有找到有效的解决方案。

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com