gpt4 book ai didi

java - 从集合中删除不符合条件的项目

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:36:42 24 4
gpt4 key购买 nike

对于一个学校项目,目标是对查询字符串与歌曲对象内的歌词字符串进行模糊匹配。整体数据结构是一个 TreeMap,由独特的单词与歌词中包含该单词的歌曲集配对。

我有包含查询字符串的初步匹配歌曲集。这里的转折是我必须根据匹配部分中的字符数(包括空格)为每首结果歌曲分配一个等级。例如,搜索“她爱你”会在匹配项中返回这些:

“……她爱你……”甲壳虫乐队,排名= 13
“……她就是爱你……”Bonnie Raitt,rank=18
“……她爱我,好吧,你……”埃尔维斯·普雷斯利 (Elvis Presley),等级 =23

我用来对结果进行排序的是:

for (int i=0; i<lyrics.length; i++) {
if (lyrics[i].equals(query[0])) { //got the start point
start=i; //adjust the start index point

//loop through lyrics from start point
for (int j=1; j<query.length; j++) {
if (lyrics[j].equals(query[query.length-1])) {
end=i; //found the last word
}

//if next lyric word doesn't match this query word
if (!lyrics[i+j].equals(query[j])) {

//advance loop through lyrics. when a match is found, i is adjusted to
//the match index
for (int k= i+j+1; k<lyrics.length; k++) {
if (lyrics[k].equals(query[j]) || lyrics[k].equals(query[0]))
i=k++;
} //end inner advance loop

} //end query string test

}//end query test loop

song.setRanks(start, end); //start and end points for the rank algorithm.

} //end start point test

由于结果集中的所有歌曲都以任何特定顺序包含查询词,因此它们不会全部包含在结果打印输出中。使用此算法,如果查询与任何特定长度不匹配,我如何设置触发器以从集合中删除歌曲?

编辑 - Lucene 是解决这个问题的方法吗?这是项目中的一个灰色区域,我将在明天的类里面提出来。他允许我们为这个项目选择任何数据结构,但我不知道使用其他实现进行字符串匹配是否会通过集合。

编辑 2 @ belisarius - 我看不出编辑距离如何适用于此。 Levenshtein distance 最常见的应用是需要一个长度为 n 的 String a 和长度为 m 的 String b,距离就是 a==b 需要编辑的次数。对于这个项目,所需要的只是比赛中角色的排名,起点和终点未知。通过对上面发布的代码进行一些更改,我可以准确地找到起点和终点。如果歌词不符合搜索条件,我需要一种方法从集合中删除不匹配项。

最佳答案

可能您想查看 Levenstein distance . Apache commons-lang 库在 StringUtils 的 2.1 版中实现了它类。

关于java - 从集合中删除不符合条件的项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4309197/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com