gpt4 book ai didi

python - 计算 Python 中标点字符之间的单词数

转载 作者:太空宇宙 更新时间:2023-11-04 08:11:37 25 4
gpt4 key购买 nike

我想使用 Python 来计算文本输入 block 中某些标点字符之间出现的单词数。例如,对到目前为止所写的所有内容的这种分析可能表示为:

[23, 2, 14]

...因为第一个句子除了最后的句点没有标点符号,有 23 个单词,接下来的“例如”短语有两个,其余以冒号结尾的有 14 个。

这可能不会太难实现,但是(遵循“不要重新发明轮子”的哲学,这似乎特别是 Pythonic)是否已经有任何东西特别适合这项任务?

最佳答案

punctuation_i_care_about="?.!"
split_by_punc = re.split("[%s]"%punctuation_i_care_about, some_big_block_of_text)
words_by_puct = [len(x.split()) for x in split_by_punc]

关于python - 计算 Python 中标点字符之间的单词数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21209044/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com