gpt4 book ai didi

java - 如果没有 "doing advanced stuff",我可以使这个搜索相关性功能更好吗?

转载 作者:行者123 更新时间:2023-12-02 08:16:40 24 4
gpt4 key购买 nike

我的搜索引擎使用以下函数来计算相关性。

private static int calculateScore(String result, String searchStr, int modifier) 
{
String[] resultWords = result.split(" ");
String[] searchWords = searchStr.split(" ");

int score = 0;
for (String searchWord : searchWords)
{
for (String resultWord : resultWords)
{
if (resultWord.equals(searchWord))
score += 10;
else if (resultWord.startsWith(searchWord))
score += 4;
else if (resultWord.endsWith(searchWord))
score += 3;
else if (resultWord.contains(searchWord))
score += 1;
}

}
return score;
}

没有什么花哨的东西,而且我也没有足够的时间来做任何花哨的事情,但是我可以做一些简单的改进来使该功能更好地增加相关的东西,并减少不相关的东西吗?无需评论速度优化,这只是该功能的“功能部分”:)

谢谢。

最佳答案

不确定它是否算奇特,但是 soundex comparison ,大概在你的量表上获得+1分,将与打印上的未遂事件和同音词有一点相关性。

我建议使用stop word list防止或从根本上减少常用词赋予的相关性。如果有人正在搜索“马在屋顶上”,您需要授予“马”和“屋顶”的相关性,而不是大幅提升包含“the”的所有内容。

另一个简单的提升是为包含按顺序的整个搜索字符串的结果授予大量相关性(不区分大小写和标点符号)。

关于java - 如果没有 "doing advanced stuff",我可以使这个搜索相关性功能更好吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/916247/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com