- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 Elasticsearch 的新手,对 _score
的计算方式感到困惑。我试图通过阅读网上的一些论坛条目( here 和 here )来了解发生了什么,但仍然有一些疑问,无法完全解决我的问题。
瞄准
给定一些包含字段 title
和 content
的文档,查找与 query
匹配的文档,并增强 title 上的匹配
字段。
数据
PUT /sample/myType/1
{
"title": "Blabbertalk here",
"content": "Foobar here"
}
PUT /sample/myType/2
{
"title": "Foobar here",
"content": "Blabbertalk here"
}
查询
GET /sample/myType/_search
{
"query": {
"bool" : {
"should": [
{
"match" : {
"title" : {
"query": "Blabbertalk",
"fuzziness": 0.7,
"boost": 2
}
}
},
{
"match" : {
"content" : {
"query": "Blabbertalk",
"fuzziness": 0.7,
"boost": 1
}
}
}
],
"minimum_number_should_match": 1
}
}
}
结果
{
"took": 21,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 0.095891505,
"hits": [
{
"_index": "sample",
"_type": "myType",
"_id": "1",
"_score": 0.095891505,
"_source": {
"title": "Blabbertalk here",
"content": "Foobar here"
}
},
{
"_index": "sample",
"_type": "myType",
"_id": "2",
"_score": 0.095891505,
"_source": {
"title": "Foobar here",
"content": "Blabbertalk here"
}
}
]
}
}
问题
虽然这会在顶部返回正确的结果,但在另一种情况下却不会(这促使我问这个问题)。尽管如此,这个样本也有同样让我困惑的问题。
title
字段?explain
参数运行相同的查询会发现 boost 未应用于 _score
计算(见下文)。看来 Elasticsearch 确实能够识别增强因子(如以下行所示:"description": "weight(title:blabbertalk^2.0 in 0) [PerFieldSimilarity], result of:"
),但是,进一步查看细节会发现分数计算中实际上没有考虑任何提升因素。title:blabbertalk^2.0 in 0
表示怀疑。 in 0 到底是什么意思?我很确定这并不意味着“在 0 个文档中匹配”。 0 是否会抵消提升?如果是这样,有办法解决这个问题吗?最后但并非最不重要的一点是,我意识到这可能不是 Elasticsearch 的问题,因为我相信 Elasticsearch 将这个评分和搜索任务委托(delegate)给后端的 Lucene。不过,我对 Lucene 也不太熟悉,所以如果有人能对此有所了解,我将非常感激。
非常感谢您花时间阅读这么长的问题并帮助我。非常感谢,非常感谢!
使用解释参数运行相同的查询
{
"took": 40,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 0.095891505,
"hits": [
{
"_shard": 2,
"_node": "NaOynONhQWSvUmH77e_L9w",
"_index": "sample",
"_type": "myType",
"_id": "1",
"_score": 0.095891505,
"_source": {
"title": "Blabbertalk here",
"content": "Foobar here"
},
"_explanation": {
"value": 0.095891505,
"description": "product of:",
"details": [
{
"value": 0.19178301,
"description": "sum of:",
"details": [
{
"value": 0.19178301,
"description": "weight(title:blabbertalk^2.0 in 0) [PerFieldSimilarity], result of:",
"details": [
{
"value": 0.19178301,
"description": "fieldWeight in 0, product of:",
"details": [
{
"value": 1,
"description": "tf(freq=1.0), with freq of:",
"details": [
{
"value": 1,
"description": "termFreq=1.0"
}
]
},
{
"value": 0.30685282,
"description": "idf(docFreq=1, maxDocs=1)"
},
{
"value": 0.625,
"description": "fieldNorm(doc=0)"
}
]
}
]
}
]
},
{
"value": 0.5,
"description": "coord(1/2)"
}
]
}
},
{
"_shard": 3,
"_node": "NaOynONhQWSvUmH77e_L9w",
"_index": "sample",
"_type": "myType",
"_id": "2",
"_score": 0.095891505,
"_source": {
"title": "Foobar here",
"content": "Blabbertalk here"
},
"_explanation": {
"value": 0.095891505,
"description": "product of:",
"details": [
{
"value": 0.19178301,
"description": "sum of:",
"details": [
{
"value": 0.19178301,
"description": "weight(content:blabbertalk in 0) [PerFieldSimilarity], result of:",
"details": [
{
"value": 0.19178301,
"description": "fieldWeight in 0, product of:",
"details": [
{
"value": 1,
"description": "tf(freq=1.0), with freq of:",
"details": [
{
"value": 1,
"description": "termFreq=1.0"
}
]
},
{
"value": 0.30685282,
"description": "idf(docFreq=1, maxDocs=1)"
},
{
"value": 0.625,
"description": "fieldNorm(doc=0)"
}
]
}
]
}
]
},
{
"value": 0.5,
"description": "coord(1/2)"
}
]
}
}
]
}
}
最佳答案
我认为 boost 参数应该放在匹配查询本身中,而不是放在字段中,例如:
{
"query": {
"bool" : {
"should": [
{
"match" : {
"title" : {
"query": "Blabbertalk",
"fuzziness": 0.7
},
"boost": 2
}
},
{
"match" : {
"content" : {
"query": "Blabbertalk",
"fuzziness": 0.7
},
"boost": 1
}
}
],
"minimum_number_should_match": 1
}
}
}
虽然你可以用 multi_match 来简化相反:
{
"multi_match" : {
"query": "Blabbertalk",
"type": "most_fields",
"fields": [ "title^2", "content" ],
"fuzziness": 0.7
}
}
关于lucene - Boost 在 Elasticsearch 上不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24690125/
我正在尝试使用boost.spirit的qi库解析某些内容,而我遇到了一个问题。根据spirit docs,a >> b应该产生类型为tuple的东西。但这是boost::tuple(又名 fusio
似乎有/正在努力做到这一点,但到目前为止我看到的大多数资源要么已经过时(带有死链接),要么几乎没有信息来实际构建一个小的工作样本(例如,依赖于boost program_options 以构建可执行文
我对 Boost.Log 的状态有点困惑。这是 Boost 的官方部分,还是尚未被接受?当我用谷歌搜索时,我看到一些帖子谈论它在 2010 年是如何被接受的,等等,但是当我查看最后一个 Boost 库
Boost 提供了两种不同的实现 string_view ,这将成为 C++17 的一部分: boost::string_ref在 utility/string_ref.hpp boost::stri
最近,我被一家GIS公司雇用来重写他们的旧地理信息库。所以我目前正在寻找一个好的计算几何库。我看过CGAL,这真是了不起,但是我的老板想要免费的东西。 所以我现在正在检查Boost.Geometry。
假设我有一个无向图 G。假设我添加以下内容 add_edge(1,2,G); add_edge(1,3,G); add_edge(0,2,G); 现在我再说一遍: add_edge(0,2,G); 我
我使用 CMake 来查找 Boost。找到了 Boost,但 CMake 出错了 Imported targets not available for Boost version 请参阅下面的完整错
我是 boost::fusion 和 boost::mpl 库的新手。谁能告诉我这两个库之间的主要区别? 到目前为止,我只使用 fusion::vector 和其他一些简单的东西。现在我想使用 fus
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: What are the benefits of using Boost.Phoenix? 所以我开始阅读 boos
我正在尝试获得一个使用 Boost.Timer 的简单示例,用于一些秒表性能测量,但我不明白为什么我无法成功地将 Boost.Timer 链接到 Boost.Chrono。我使用以下简单脚本从源代码构
我有这样的东西: enum EFood{ eMeat, eFruit }; class Food{ }; class Meat: public Food{ void someM
有人可以告诉我,我如何获得boost::Variant处理无序地图? typedef boost::variant lut_value;unordered_map table; 我认为有一个用于boo
我对 Boost.Geometry 中的环和多边形感到困惑。 在文档中,没有图形显示什么是环,什么是多边形。 谁能画图解释两个概念的区别? 最佳答案 在 Boost.Geometry 中,多边形被定义
我正在使用 boost.pool,但我不知道何时使用 boost::pool<>::malloc和 boost::pool<>::ordered_malloc ? 所以, boost::pool<>:
我正在尝试通过 *boost::fast_pool_allocator* 使用 *boost::container::flat_set*。但是,我收到编译错误。非常感谢您的意见和建议。为了突出这个问题
sau_timer::sau_timer(int secs, timerparam f) : strnd(io), t(io, boost::posix_time::seconds(secs)
我无法理解此功能的文档,我已多次看到以下内容 tie (ei,ei_end) = out_edges(*(vi+a),g); **g**::out_edge_iterator ei, ei_end;
我想在 C++ 中序列化分层数据结构。我正在处理的项目使用 boost,所以我使用 boost::property_tree::ptree 作为我的数据节点结构。 我们有像 Person 这样的高级结
我需要一些帮助来解决这个异常,我正在实现一个 NPAPI 插件,以便能够使用来自浏览器扩展的本地套接字,为此我正在使用 Firebreath 框架。 对于套接字和连接,我使用带有异步调用的 Boost
我尝试将 boost::bind 与 boost::factory 结合使用但没有成功 我有这个类 Zambas 有 4 个参数(2 个字符串和 2 个整数)和 class Zambas { publ
我是一名优秀的程序员,十分优秀!