gpt4 book ai didi

vespa - 查询排名配置文件时,召回不返回任何内容

转载 作者:行者123 更新时间:2023-12-04 08:45:58 26 4
gpt4 key购买 nike

我有一个示例 Vespa 实例,我想从 rank-profile 训练一个 lightgbm 模型。
https://docs.vespa.ai/documentation/learning-to-rank.html
但是,每当我使用 docID 指定召回时,我都会得到 0 次点击。我正在使用这里的示例代码:
https://github.com/vespa-engine/sample-apps/blob/master/text-search/src/python/collect_training_data.py

body = create_request_top_hits("test", "training", hits=2)
get_features(url, body)
这正确返回:
[{'id': 'index:domains/0/944f3a850511f388fe97ac85',
'relevance': 1.2427330381582673,
'source': 'domains',
'fields': {'uri': '6202597992',
'rankfeatures': {'bm25(body)': 2.8145480372957787,
'nativeFieldMatch(categories)': 0.0,
'nativeFieldMatch(concepts)': 0.8591903630989031,
'nativeFieldMatch(links)': 0.0,
'nativeFieldMatch(title)': 0.0,
'nativeProximity(categories)': 0.0,
'nativeProximity(concepts)': 0.0,
'nativeProximity(links)': 0.0,
'nativeProximity(title)': 0.0,
'rankingExpression(time_ranking)': 1.0}}},
{'id': 'index:domains/0/93f92aae1d6a010c2111e9b7',
'relevance': 1.2010786365413106,
'source': 'domains',
'fields': {'uri': '6206270866',
'rankfeatures': {'bm25(body)': 2.0397289658724347,
'nativeFieldMatch(categories)': 0.0,
'nativeFieldMatch(concepts)': 0.8591903630989031,
'nativeFieldMatch(links)': 0.0,
'nativeFieldMatch(title)': 0.0,
'nativeProximity(categories)': 0.0,
'nativeProximity(concepts)': 0.0,
'nativeProximity(links)': 0.0,
'nativeProximity(title)': 0.0,
'rankingExpression(time_ranking)': 1.0}}}]
要查看召回是否有效,我们将使用最高结果:
'id': 'index:domains/0/944f3a850511f388fe97ac85'
'uri': '6202597992' # docIDs are derived from the uri field
并将召回设置为docid:
doc_id = [6202597992, "6202597992", "944f3a850511f388fe97ac85"]  # multiple representations...
body = create_request_specific_ids("test", "training", doc_id)
get_features(url, body)
我希望这能返回之前的排名特征,但我得到了 0 次点击。这是完整的返回:
{'root': {'id': 'toplevel', 'relevance': 1.0, 'fields': {'totalCount': 0}, 'coverage': {'coverage': 100, 'documents': 798, 'full': True, 'nodes': 5, 'results': 5, 'resultsFull': 5}}}
我检查了文档和示例,但在这里找不到任何信息。任何见解将不胜感激。

最佳答案

collect 脚本/函数期望您的文档架构中有一个名为 id 的字段。如果您更改脚本以使用 uri 字段,您应该能够检索文档。

  • https://github.com/vespa-engine/sample-apps/blob/master/text-search/src/python/collect_training_data.py#L15
  • https://github.com/vespa-engine/sample-apps/blob/master/text-search/src/main/application/schemas/msmarco.sd#L6
  • 关于vespa - 查询排名配置文件时,召回不返回任何内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64322983/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com