gpt4 book ai didi

javascript - 用 Javascript 中的单词数组拆分字符串

转载 作者:行者123 更新时间:2023-11-30 09:07:14 26 4
gpt4 key购买 nike

我正在获取一些文本并想将其拆分为一个数组。我的目标是能够将其拆分为由停用词(搜索引擎忽略的词,如“a”、“the”等)分隔的短语,这样我就可以在我的 API 中搜索每个单独的短语。例如:'The cow's hat was really funny' 将导致 arr[0] = cow's hatarr[1] = funny .我已经有了一系列停用词,但我真的想不出如何实际拆分其中的每个/任何单词,而不编写一个非常慢的函数来遍历每个停用词。

最佳答案

使用split()。它需要一个正则表达式。下面是一个简单的例子:

search_string.split(/\b(?:a|the|was|\s)+\b/i);

如果您已经有了停用词数组,您可以使用 join() 来构建正则表达式。尝试以下操作:

regex = new RegExp("\\b(?:" + stop_words.join('|') + "|\\s)+\\b", "i");

一个工作示例 http://jsfiddle.net/NEnR8/ . 注意:最好替换这些值而不是拆分它们,因为此结果中有数组元素。

关于javascript - 用 Javascript 中的单词数组拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4168644/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com