gpt4 book ai didi

elasticsearch - 将预先标记的文本插入Elasticsearch

转载 作者:行者123 更新时间:2023-12-02 22:46:14 26 4
gpt4 key购买 nike

我有一个问题要使用托管的Elasticsearch服务,但是它们具体没有我需要的插件。该插件是拼音插件,可提供自定义标记器。我的想法是在插入Elasticsearch之前,在预处理步骤中复制此标记化。

例如,如果我调用_analyze?text=%e5%88%98%e5%be%b7%e5%8d%8e&analyzer=pinyin_analyzer,我将收到输出

{
"tokens": [
{
"token": "ldh",
"start_offset": 0,
"end_offset": 3,
"type": "word",
"position": 1
},
{
"token": "liu",
"start_offset": 0,
"end_offset": 3,
"type": "word",
"position": 2
},
{
"token": "hua",
"start_offset": 0,
"end_offset": 3,
"type": "word",
"position": 4
}
]
}

我有一种在预处理步骤中生成像这样的 token 的方法,但是是否可以将经过预先分析的 token 插入到Elasticsearch索引中?

最佳答案

您可以创建标记化值的数组。效果是一样的。此外,如果您要进行所有预处理而不仅仅是标记化,请使用关键字字段。否则,您的 token 将再次单独进行分析。

关于elasticsearch - 将预先标记的文本插入Elasticsearch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43841723/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com