gpt4 book ai didi

elasticsearch - 如何存储分析仪生成的内容?

转载 作者:行者123 更新时间:2023-12-03 00:54:52 25 4
gpt4 key购买 nike

假设我使用此映射:

PUT test
{
"settings" : {
"index" : {
"number_of_shards" : 1,
"number_of_replicas" : 0
}
},
"mappings": {
"testtype": {
"properties": {
"content": {
"type": "text",
"analyzer": "english",
"store": true
}
}
}
}
}

现在,我可以为文档建立索引了:
PUT test/testtype/0
{
"content": "The Quick Brown Box"
}

我可以检索它:
GET test/testtype/0

哪个会返回我:
{
"_index": "test",
"_type": "testtype",
"_id": "0",
"_version": 1,
"found": true,
"_source": {
"content": "The Quick brown Fox"
}
}

我知道在源字段中您应该只拥有插入的文档,这就是为什么我在映射中指定要存储内容字段的原因。因此,通过查询我的商店字段,我希望其中包含分析仪生成的内容,如下所示:
"quick brown fox"

但是当我查询存储的字段时:
GET test/testtype/_search
{
"stored_fields": "content"
}

我的文档完全是我写的:
{
"took": 1,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1,
"hits": [
{
"_index": "test",
"_type": "testtype",
"_id": "0",
"_score": 1,
"fields": {
"content": [
"The Quick brown Fox"
]
}
}
]
}
}

所以我的问题是如何将我的分析器生成的结果存储在我的Elasticsearch中?

最佳答案

您的问题是关于存储的文本和生成的 token 之间的区别:
the store attribute of a lucene field

存储的字段与“_source” -JSON中的相应字段完全相同。

生成的 token 以Lucene内部表示形式。但是您可以使用 _analyze _termvectors 端点查看 token
或者您可以使用term-aggregation

关于elasticsearch - 如何存储分析仪生成的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45933335/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com