- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Solr中有什么方法可以给同义词赋予权重? (由 SynonymFilterFactory
生成)
问题的较长版本/一些背景:
我们希望为 SynonymFilterFactory
注入(inject)的同义词/术语赋予较小的权重.
所以精确匹配会更高score
.
第一个用例只是为所有同义词赋予一个静态权重
如果搜索时间通过同义词匹配,它将具有一定的(较低的)
重量比完全匹配。
在文档中找不到这个。
Solr 是否有办法为 SynonymFilterFactory
生成的术语分配权重? ?
任何指针高度赞赏。
PS。另一个用例是使用特定权重微调每个同义词
对于每个特定的同义词(即 synonyms="synonyms.txt"将有 3
列而不是 2)。目前似乎不可能,所以也许只是静态的
上述所有同义词的权重都是可能的。
最佳答案
与 Lucene 的大多数情况一样,解决方案是使用多个字段 - 一个扩展同义词的字段,一个不扩展同义词。这样,您可以决定是否完全启用同义词进行搜索,或者您可以使用不同的权重对不同字段中的匹配进行评分 - 您可以根据您的查询调整这些权重。在 Solr 中,您使用了 copyField
将相同的内容索引到两个字段中,然后您可以在使用带有 field^5 field_with_synonyms
的 edismax 时调整权重没有同义词的命中率比有同义词的命中率高五倍。
如果您真的想在一个单一的字段中进行操作,则需要更脆弱和自定义的设置,您可以在其中 can use payloads attached to each token手动对每个 token 进行不同的评分,但这是一个更高级的用例,不会完全适合所有其他功能。它会解决你的PS
不过,用例。我还建议查看 one of the presentations from Lucene/Solr Revolution关于有效载荷评分的用例。
使用两个字段是简单的方法,使用有效负载是更灵活但也更高级的方法。
Returns the float value computed from the decoded payloads of the term specified.
The field specified must have float or integer payload encoding capability (via DelimitedPayloadTokenFilter or NumericPayloadTokenFilter). If no payload is found for the term, the default value is returned.
payload(field_name,term)
: default value is 0.0, average function is used.
payload(field_name,term,default_value)
: default value can be a constant, field name, or another float returning function. average function used.
payload(field_name,term,default_value,function)
: function values can be min, max, average, or first.
token|payload
并允许您附加任何数值作为该 token 的“有效负载”。
关于elasticsearch - 赋予 SynonymFilterFactory 术语权重,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56839428/
我有几个系统,其中包含用户表以及某种形式的业力/权重/声誉。有时是用户发布的帖子数量,有时是用户在网站上的所有事件中收到的赞成/反对票数。 USER { id int name str
我需要能够使用填充的相对大小 - 根据设备的分辨率和 dpi 变大或变小。 例如,如果我的 View 宽度为 100 像素,我希望左侧填充 10 像素,右侧填充 10 像素。但是,如果它在更高密度的屏
我目前正在使用由大约 10 个字段组成的 Solr 索引数据。当我执行搜索时,我希望某些字段的权重更高。谁能帮我指出正确的方向? 例如,在所有字段中搜索“超人”等术语时,应在“Description”
我正在使用 igraph 模拟网络随时间的变化在 r并且我正在寻找一种有效且可扩展的方式来对此进行编码以用于业务。 网络变化的主要驱动因素是: 新增节点 新领带 新节点权重 在第一阶段,在 100 个
我一直在寻找一种使用OpenVINO框架上的C++ API获取网络每一层权重/参数和偏差张量的方法。我在文档中找不到任何内容,在示例中也找不到任何示例。我如何提取这些张量? 谢谢, 塞萨尔 编辑: 分
我的问题与 PHP Memcache 扩展的 addServer 函数中的“weight”参数有关。 在过去的几个月里,我一直在为所有服务器使用“weight = 1”。我现在正在尝试应用以下配置以最
我应该使用哪种数据结构来保持元素按给定权重排序?我需要在集合中添加元素,其中每个元素都会生成特定的权重,但该权重不包含(也不计算)在元素本身内部;它是由元素之外的其他人计算的。而且,权重不需要存储(但
我正在尝试在 keras/tensorflow 中使用具有多个类的焦点损失,这导致使用我猜的分类焦点损失。我找到了一些实现here和 there或there 。 据我了解,焦点损失中的参数a主要用于二
我有一个像这样的 Pandas 数据框: df = pd.DataFrame({'id': [121, 34324, 111, 12, 45, 232], 'weight'
我有一个带有输出神经元的神经网络,我想在软最大化之前使用经过训练的权重进行线性缩放。 我有 10 个输出,我想要 10 个权重,在输出被软最大化之前乘以每个输出。因此每个输出的权重为 1。 但我不断收
我有这样的布局: 我希望它看起来像: TextView - 宽度的 40%,带 ImageView 的布局
这让我彻底疯了。我想在 android 中使用有点复杂的布局。我正在尝试使用权重而不是固定事物的大小。也许我应该放弃…… 这是我想做的: 我想要 3 个 ScrollView (里面有 TextVie
我正在尝试开发类似于网格但使用 LinearLayout。我想在单行中有 3 张图像和图像后的确切底部文本。 我尝试过的: LinearLayout layout = new LinearLayout
我想在同一行添加一个 EditText 和一个 Button,我想将 80% 的行给 editText,20% 给 Button。 这是我的代码:
我有一个 mysql 表,其中存储一列(称为 tickets),并且 tickets 值可以是任意数字。 我想要做的是有一个mysql查询,从列中选择所有行,按降序对它们进行排序,然后使用PHP对查询
我搜索了一段时间,但结果让我很困惑,因为我对 MySQL 还很陌生。 我有一个包含这 4 列的表:AUTO_INCREMENT ID、NAME、TYPE、CHANCE 所以行看起来像这样: 1, NO
我不完全是 JS 专业人士,虽然不漂亮或高效,但这是有效的。 实际上,我在表单中有重复的字段组,并允许用户根据需要将数据从第一个字段复制到所有 5 个字段。 如何使这段代码更高效? function
我正在使用xgboost库来训练二元分类器。我想通过向权重添加噪声(例如集合中树的叶节点的值)来防止训练算法的数据泄漏。为此,我需要检索每棵树的权重并修改它们。 我可以通过在 Booster 对象上使
我正在尝试让 LinearLayout 中的 View 填充宽度。我尝试使用 LayoutParams 设置它,但它给了我一个错误: 我的代码: EditText et = new EditText(
我想改变 ScrollView 的权重,但找不到实现它的方法。 这是我的 XML: **other layout.. 从代码中只能设置scrollView的高度或者宽度,weigh
我是一名优秀的程序员,十分优秀!