gpt4 book ai didi

python - 正则表达式删除首字母缩写词中的句点?

转载 作者:太空狗 更新时间:2023-10-30 00:31:25 26 4
gpt4 key购买 nike

我想从文本字符串中删除首字母缩略词中的句点,但我也想保留常规句点(例如在句子末尾)。

所以下面的句子:

"The C.I.A. is a department in the U.S. Government."

应该变成

"The CIA is a department in the US Government."

有没有一种使用 Python 来完成此操作的简洁方法?到目前为止,我有一个两步过程:

words = "The C.I.A. is a department in the U.S. Government."
words = re.sub(r'([A-Z].[A-Z.]*)\.', r'\1', words)
print words
# The C.I.A is a department in the U.S Government.
words = re.sub(r'\.([A-Z])', r'\1', words)
print words
# The CIA is a department in the US Government.

最佳答案

可能是这个?

>>> re.sub(r'(?<!\w)([A-Z])\.', r'\1', s)
'The CIA is a department in the US Government.'

如果在 \w 中单个字母前面没有任何内容,则替换前面有大写单个字母的单个点。字符集。后面的标准由负向后视断言强制执行 - (?<!\w) .

关于python - 正则表达式删除首字母缩写词中的句点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40196941/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com