gpt4 book ai didi

elasticsearch - 在AWS DynamoDB中创建数据类型并 Elasticsearch URL列表

转载 作者:行者123 更新时间:2023-12-03 01:20:39 25 4
gpt4 key购买 nike

我启用了Aws DynamoDB流,并创建了一个lambda函数来将数据索引到Elasticsearch中。

在我的DynamoDb表中,有一个名为URL的列,我将存储一行的URL列表。

URL最像AWS S3对象的对象URL

流式传输后,我将数据索引到 flex 搜索中,这里的问题是我应该在DynamoDB(单行)和Elasticsearch(单文档)中同时存储多个URL的数据类型是什么?

有人可以帮助我以最有效的方式实现这一目标吗?提前致谢

Json结构

 {
"id":"234561",
"policyholdername":"xxxxxx",
"age":"24",
"claimnumber":"234561",
"policynumber":"456784",
"url":"https://dgs-dms.s3.amazonaws.com/G-3114_Textract.pdf",
"claimtype":"Accident",
"modified_date":"2020-02-05T17:36:49.053Z",
"dob":"2020-02-05T17:36:49.053Z",
"client_address":"no,7 royal avenue thirumullaivoyal chennai"
}

将来,对于单个索偿号,应该有多个URL
那么,如何处理呢?

最佳答案

不确定Dynamo DB类型。但是在Elasticsearch中,没有专用的列表类型。要存储字符串列表(在您的情况下为URL),可以使用关键字字段类型。

例如,您的数据可以像

 {
"id":"234561",
"policyholdername":"xxxxxx",
"age":"24",
"claimnumber":"234561",
"policynumber":"456784",
"url":["https://dgs-dms.s3.amazonaws.com/G-3114_Textract.pdf","https://foo/bar/foo.pdf"]
"claimtype":"Accident",
"modified_date":"2020-02-05T17:36:49.053Z",
"dob":"2020-02-05T17:36:49.053Z",
"client_address":"no,7 royal avenue thirumullaivoyal chennai"
}

并且等效的elasticsearch映射可能是
{
"mappings": {
"_doc": {
"properties": {
"url": {
"type": "keyword"
}
}
}
}
}

搜索查询可以是
POST index/_search
{
"query": {
"term": {
"url": "https://foo/bar/foo.pdf"
}
}
}

关于elasticsearch - 在AWS DynamoDB中创建数据类型并 Elasticsearch URL列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60333665/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com