gpt4 book ai didi

hadoop - 如何在 Apache mahout 中合并两个相似实例

转载 作者:可可西里 更新时间:2023-11-01 16:56:15 25 4
gpt4 key购买 nike



我是 Apache mahout 的新手,我有一些疑问,如果我错了请纠正我。
假设我们有数据集并根据数据集计算推荐,然后将结果显示给用户,当用户再次访问我们的网站时,我们将有新的数据集,因此我们必须根据新数据集再次计算推荐。
我们可以通过组合两个数据集来做到这一点,即旧数据集和新数据集,但是由于我们已经对旧数据集进行了计算,如果我们将它们组合在一起,那么我们将再次对旧数据集进行相同的计算,这将在数据增加时成为问题所以想问问有没有其他方法可以做到这一点,我认为另一种方法是结合两个数据集的相似性,因为推荐是基于相似性的,但我找不到任何关于这个的东西。

请帮我解决这个问题,

谢谢

最佳答案

您想计算移动数据窗口的建议。确定您的窗口和更新频率。如果您每天更新并且您的窗口是 3 个月,那么您每天都会丢弃最旧日期的数据,并在每次更新时使用最近 3 个月的数据。

关于hadoop - 如何在 Apache mahout 中合并两个相似实例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29600266/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com