gpt4 book ai didi

ruby - 如何选择最接近句号的前280个单词?

转载 作者:太空宇宙 更新时间:2023-11-03 16:14:02 26 4
gpt4 key购买 nike

我需要从较长的文本中提取指定数量的单词的较短文本段。我可以使用

text = "There was a very big cat that was sitting on the ledge. It was  overlooking the garden. The dog next door watched with curiosity."

text.split[0..15].join(' ')
>>""There was a very big cat that was sitting on the ledge. It was overlooking"

我想选择到下一段的文本,这样我就不会以部分句子结尾。

有没有一种方法可以使用正则表达式来完成我正在尝试做的事情,从而能够使文本达到并包括第 15 个单词之后最接近的下一个句号?

最佳答案

你可以使用

(?:\w+[,.?!]?\s+){14}(?:\w+,?\s+)*?\w+[.?!]

重复一个单词,可选[逗号/句号/问号/感叹号]和空格,14次。然后,它延迟重复一个单词后跟一个空格,然后是另一个单词和一个句点,确保该模式在距离开头 15 个单词后的第一个句点处结束。

https://regex101.com/r/ardIQ7/4

关于ruby - 如何选择最接近句号的前280个单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52397635/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com