gpt4 book ai didi

python - 将段落分割成句子

转载 作者:行者123 更新时间:2023-11-28 21:20:12 34 4
gpt4 key购买 nike

我正在尝试将段落分割成句子。我选择了“。”,“?”和 '!'作为分割符号。我试过:

format = r'((! )|(. )|(? ))'
delimiter = re.compile(format)
s = delimiter.split(line)

但它给了我sre_constants.error: unexpected end of pattern

我也试过

format = [r'(! )',r'(? )',r'(. )']
delimiter = re.compile(r'|'.join(format))

它也会导致错误。

我的方法有什么问题吗?

最佳答案

.(通配符)和 ?(零或一,量词)是特殊的正则表达式字符,您需要对它们进行转义才能按字面意思使用它们。

但是,在您的情况下,使用字符类(在其中这些字符不再特殊)会简单得多:

split(r'[!.?] ')

字符类 [...] 代表“一个字符,字符类中包含的任何字符”。

关于python - 将段落分割成句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23136417/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com