gpt4 book ai didi

php - 试图创建一个 'trending words/phrases' 引擎但需要过滤掉常用词

转载 作者:可可西里 更新时间:2023-11-01 07:35:57 26 4
gpt4 key购买 nike

我想解析进入我的系统的字符串,并在单独的表中保留每个单词的字数。问题是许多不应该包含的常用词,例如“the”、“at”等。我不想手动创建字典。任何人都知道一本体面的常用词词典,我可以匹配到不包括在内?谢谢。

最佳答案

您具体指的是“停用词”列表。

http://en.wikipedia.org/wiki/Stop_words

你可以在这里找到一个

http://truereader.com/manuals/onix/stopwords1.html

关于php - 试图创建一个 'trending words/phrases' 引擎但需要过滤掉常用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6687984/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com