gpt4 book ai didi

sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:19:03 25 4
gpt4 key购买 nike

我将使用 Apriori 算法实现个人推荐系统。我知道有“支持”、“信心”和“提升”三个有用的概念。我已经知道他们的意思了。我也知道如何使用支持概念找到频繁项集。但我想知道,如果我们可以使用支持规则找到频繁项集,为什么会有置信度和提升度概念?

你能解释一下为什么在已经应用了“支持”概念的情况下会出现“信心”和“提升”概念吗?如果我已经对数据使用了支持概念,我该如何继续使用“信心”和“提升”概念设置?

如果你能用 SQL 查询来回答我将不胜感激,因为我还是一名本科生。非常感谢

最佳答案

仅支持会产生许多冗余规则。

例如

A -> B
A, C -> B
A, D -> B
A, E -> B
...

提升和类似措施的目的是去除并不比简单规则好多少的复杂规则。在上述情况下,简单规则 A -> B 的置信度可能低于复杂规则,但支持度更高。其他规则可能只是这种强模式的巧合,由于样本量较小,因此信心略强。

同样,如果你有:

A -> B  confidence: 90%
C -> D confidence: 90%
A, C -> B, D confidence: 80%

那么最后一条规则甚至不好,尽管置信度很高!前两个规则产生相同的结果,但具有更高的置信度。所以最后一条规则不应该是 80% 正确,但如果你假设前两条规则成立,正确率为 -10%!

因此,支持和信心不足以考虑。

关于sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36473372/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com