作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
基本匹配查询:Billy Sue
测试匹配查询 #1:Billy Sue and
测试匹配查询 #2:Billy 和 Sue
我们最终得到 Base 和 #1 之间相同的分数,但 Base 和 #2 的分数相似但不同。
使用分析 API,停止词 and
在两个测试查询中都被删除,但 start_offset 和 end_offset 标记属性对于 Sue
在基本查询和测试查询之间不同#2.
本质上,剩余标记之间的停用词删除前距离会被记录下来,并且对评分的影响很小但有限。
问题
有没有办法延迟标记的 start_offset
和 end_offset
属性的计算,直到删除停用词之后,或者以其他方式防止删除的停用词影响以任何方式得分?
最佳答案
也许禁用 position increments在停用词过滤器上看看是否有帮助?特别是如果你的映射在停用词过滤器之后有某种过滤器,你会从位置增量中得到奇怪的人工制品
例如像这样:
"analyzer": {
"analyzer_example":{
"tokenizer":"standard",
"filter":["standard", "lowercase", "filter_stop"]
}
},
"filter": {
"filter_stop":{
"type":"stop",
"enable_position_increments":"false"
}
}
关于lucene - 在 ElasticSearch 中,移除停用词对评分的影响仍然很小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14483746/
我正在做一个项目,我的 android 在这个项目中作为一个网络服务器工作;输入带端口号的 IP 地址,打开 Web 界面,用户可以将文件上传到手机。我想在 Web 界面上显示一些图片,以便我们的界面
我是一名优秀的程序员,十分优秀!