gpt4 book ai didi

elasticsearch - "flat"结构的重要术语聚合

转载 作者:行者123 更新时间:2023-11-29 02:53:07 25 4
gpt4 key购买 nike

我目前尝试使用 Elasticsearch Significant Terms 聚合来制作产品推荐系统的原型(prototype)。到目前为止,我还没有找到一个很好的例子来处理来自关系数据库的 sales(这里是 itemId)的“扁平”JSON 结构,例如我的:

文档 1

{
"lineItemId": 1,
"lineNo": 1,
"itemId": 1,
"productId": 1234,
"userId": 4711,
"salesQuantity": 2,
"productPrice": 0.99,
"salesGross": 1.98,
"salesTimestamp": 1234567890
}

文档 2

{
"lineItemId": 1,
"lineNo": 2,
"itemId": 1,
"productId": 1235,
"userId": 4711,
"salesQuantity": 1,
"productPrice": 5.99,
"salesGross": 5.99,
"salesTimestamp": 1234567890
}

我的 Elasticsearch 索引中有大约 150 万个这样的文档。 lineItemsale 的一部分(由 itemId 标识),它可以包含 1 个或多个 lineItems我想要收到的是 5 种最不寻常的常见产品,这些产品是在销售一个特定的 productId 时购买的。

MovieLens 示例 (https://www.elastic.co/guide/en/elasticsearch/guide/current/_significant_terms_demo.html) 处理

结构中的数据
{
"movie": [122,185,231,292,
316,329,355,356,362,364,370,377,420,
466,480,520,539,586,588,589,594,616
],
"user": 1
}

所以不幸的是,它对我来说并不是很有用。对于使用我的“平面”结构的示例或建议,我会非常高兴。非常感谢。

最佳答案

听起来您正在尝试构建一个基于项目的推荐系统Apache Mahout有帮助协作过滤的工具(以前是 Taste 项目)。

还有一个Taste plugin for Elasticsearch 1.5.x我相信它可以使用像您这样的数据来生成基于项目的推荐。

(注意:此插件使用的 Rivers 在 Elasticsearch 1.5 中已被弃用,因此在采纳此建议之前,我会与作者核实支持更新版本的 Elasticsearch 的计划。)

关于elasticsearch - "flat"结构的重要术语聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30653720/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com