gpt4 book ai didi

python - 从单词中删除重复字符

转载 作者:太空狗 更新时间:2023-10-29 20:32:55 24 4
gpt4 key购买 nike

我想知道将“haaaaapppppyyy”之类的内容转换为“haappyy”的最佳方法是什么。

基本上,在解析俚语时,人们有时会重复字符以增加强调。

我想知道最好的方法是什么?使用 set() 不起作用,因为字母的顺序显然很重要。

有什么想法吗?我正在使用 Python + nltk。

最佳答案

可以使用正则表达式来完成:

>>> import re
>>> re.sub(r'(.)\1+', r'\1\1', "haaaaapppppyyy")
'haappyy'

(.)\1+ 替换任何字符 (.) 后跟一个或多个相同的字符(因为 backref \1 必须相同)乘以字符的两倍。

关于python - 从单词中删除重复字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10072744/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com