gpt4 book ai didi

Python正则表达式,删除除连字符以外的所有标点符号用于unicode字符串

转载 作者:IT老高 更新时间:2023-10-28 20:32:48 27 4
gpt4 key购买 nike

我有这段代码用于从正则表达式字符串中删除所有标点符号:

import regex as re    
re.sub(ur"\p{P}+", "", txt)

如何更改它以允许使用连字符?如果你能解释一下你是怎么做到的,那就太好了。我明白这里,如果我错了,请纠正我,P 后面的任何东西都是标点符号。

最佳答案

[^\P{P}-]+

\P\p 的补充- 不是标点符号。所以这匹配任何 not (不是标点符号或破折号) - 导致除破折号之外的所有标点符号。

示例:http://www.rubular.com/r/JsdNM3nFJ3

如果您想要一种不复杂的方式,另一种选择是 \p{P}(?<!-) : 匹配所有标点符号,然后检查它不是破折号(使用否定的后视)。
工作示例:http://www.rubular.com/r/5G62iSYTdk

关于Python正则表达式,删除除连字符以外的所有标点符号用于unicode字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21209024/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com