gpt4 book ai didi

python - 使用 Re.Findall 提取长度为 2 的所有字符串

转载 作者:行者123 更新时间:2023-12-01 03:15:40 26 4
gpt4 key购买 nike

我想使用正则表达式从文本中提取所有 2 个字母的字符串,例如:

just a test

会得到我ju、us、st、te、es、st

我尝试使用:re.findall(r'\w{2}',text),但它只将单词分成2个字母的字符串,并给我ju, st, te,st

预先非常感谢您的帮助。

最佳答案

我将把正则表达式解决方案留给正则表达式专家(我不是),因为它可以在没有正则表达式的情况下通过单行列表理解来完成:

s = "just a test"
result = ["".join(x) for w in s.split() if len(w)>1 for x in zip(w,w[1:])]

print(result)

结果:

['ju', 'us', 'st', 'te', 'es', 'st']

只需拆分单词,过滤掉少于 2 个字符的单词,然后使用 zip 将它们与移位的副本交错

当然只有在没有标点符号的情况下才有效。

关于python - 使用 Re.Findall 提取长度为 2 的所有字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42474829/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com