sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用-6ren

sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用

转载作者：塔克拉玛干更新时间：2023-11-03 06:19:03

25

4

我将使用 Apriori 算法实现个人推荐系统。我知道有“支持”、“信心”和“提升”三个有用的概念。我已经知道他们的意思了。我也知道如何使用支持概念找到频繁项集。但我想知道，如果我们可以使用支持规则找到频繁项集，为什么会有置信度和提升度概念？

你能解释一下为什么在已经应用了“支持”概念的情况下会出现“信心”和“提升”概念吗？如果我已经对数据使用了支持概念，我该如何继续使用“信心”和“提升”概念设置？

如果你能用 SQL 查询来回答我将不胜感激，因为我还是一名本科生。非常感谢

最佳答案

仅支持会产生许多冗余规则。

例如

A -> B
A, C -> B
A, D -> B
A, E -> B
...

提升和类似措施的目的是去除并不比简单规则好多少的复杂规则。在上述情况下，简单规则 A -> B 的置信度可能低于复杂规则，但支持度更高。其他规则可能只是这种强模式的巧合，由于样本量较小，因此信心略强。

同样，如果你有:

A -> B  confidence: 90%
C -> D  confidence: 90%
A, C -> B, D confidence: 80%

那么最后一条规则甚至不好，尽管置信度很高!前两个规则产生相同的结果，但具有更高的置信度。所以最后一条规则不应该是 80% 正确，但如果你假设前两条规则成立，正确率为 -10%!

因此，支持和信心不足以考虑。

关于sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36473372/

25

4

0

文章推荐： algorithm - 在 3D 空间中对一组点进行排序

文章推荐： java - 没有重复元素的字符串排列

文章推荐： java - 如何反转这个从第 n 个元素到最后的链表

文章推荐： algorithm - MATLAB 函数可以将数学函数作为输入吗？

r - Apriori 生成的编写规则
我正在处理一些大型交易数据。我一直在使用 read.transactions 和 apriori(arules 包的一部分)来挖掘频繁的项目配对。我的问题是:生成规则时(使用“inspect()”)
dataset - Apriori 算法的超市数据集
'我必须开发一款供“ future 商店”超市业务分析师使用的软件，该软件对超市销售交易的给定过渡数据执行关联规则挖掘，并通过准备 Combo 来准备折扣策略。该软件利用数据挖掘算法，即 Aprior
python - Apriori 算法即使对于少量数据也能显示大量结果
我正在尝试先验算法，它花费的时间比预期的时间长，这是代码。 import pandas as pd dataset = pd.read_csv("data.csv", header=None) tra
java - Apriori 算法给出内存位置
我的应用程序需要通过Apriori 算法获取关联。为了获得结果，我使用 Weka 依赖项。虽然我想获得关联，但它会打印内存位置。我也附上了输出。谢谢。这是我的代码: public class Ap
algorithm - Apriori 算法运行时间
1994 年引入的基本 Apriori 算法的时间复杂度是多少？如果可能，请引用引用论文/文章来支持响应。谢谢。最佳答案 Markus England 的这篇论文详分割析了 Apriori 的复杂性
algorithm - Apriori 算法中的字典顺序
我使用 Apriori 算法有一段时间了，我问我有关频繁项集候选生成的步骤。如果我想将两个频繁的 3 项集连接到一个(候选)4 项集，则连接项集中必须有 2 个相同的项和另一个不同的项。比如我可以
algorithm - Apriori 的最小置信度和最小支持度
Apriori algorithm 的最小置信度和最小支持值的合适值是多少？？你怎么能调整它们？它们是固定值，还是会在算法运行期间发生变化？如果您以前使用过此算法，您使用的是什么值？最佳答案我建
database - Apriori 算法的数据集
我打算开发一个用于市场购物篮分析的应用程序(使用先验算法)，我发现了一个包含超过 90,000 条交易记录的数据集。问题是这个数据集中没有项目的名称，只包含项目的条形码。我刚刚开始这个项目并研究先
Scala/Spark Apriori 实现速度极慢
我们正在尝试实现 Apriori algorithm在 Scala 中使用 Spark(您不需要知道回答这个问题的算法)。计算Apriori算法项集的函数是freq() .代码是正确的，但每次迭代后
python - 元组是另一个元组的子集 - Apriori 算法
我正在尝试实现先验算法。在最后步骤之一中，我从产品列表生成了两个元组数组。 >>> arr1 = array([(2421,), (35682,), (30690,), ..., (18622,),
hadoop - Apriori 和关联规则与 Hadoop
是否可以使用 map-reduce 创建 Apriori 应用程序？我刚开始，但不清楚如何根据之前的运行创建下一个候选集。有没有人有这方面的经验？最佳答案看看 Apache Mahout 可能会有
data-mining - 如何在 Apriori 算法中找到最小支持度
当给出支持度和置信度的百分比值时，如何在 Apriori 算法中找到最小支持度。例如，当支持度和置信度分别为 60% 和 60% 时，最小支持度是多少？最佳答案支持度和置信度是衡量规则有趣程度的度
rapidminer - Rapidminer 中的 W-apriori
我需要在 Rapidminer 中使用先验算法创建关联规则，但我似乎无法让它工作。我正在使用 5.3.1 weka 扩展。我已经使用内置的 FP-Growth 和 Create Associatio
评估 elat 和 apriori 项集时删除具有空值的行
我正在 R 中工作，并且有一个如下所示的数据集 [1, 2, 3, ""] [1, 2, "", 4] [1,"", "", ""] 我正在将这些值读入事务对象，然后将它们传递给 eclat 或 ap
python - Python 中的 Apriori 结果
我正在尝试在 python 中运行先验算法。我的具体问题是，当我使用 apriori 函数时，我将 min_length 指定为 2。但是，当我打印规则时，我得到的规则仅包含 1 项。我想知道为什么
r - 如何从 apriori R(关联规则)中提取信息
我正在 R 中进行一些关联规则挖掘并想提取我的结果以便我可以构建报告我的结果是这样的: > inspect(rules[1:3]) lhs rhs
r - 如何从 R 中的 apriori 调用中获取常见项集的频率？
问题: apriori arules的功能包从输入事务中推断关联规则，并报告每条规则的支持、置信度和提升。关联规则源自频繁项集。我想获取输入事务中最频繁的项集。具体来说，我想获得具有给定最小支持的所有
python - 使用 pandas 训练 apriori 数据集不显示结果
我已经根据先验算法创建了数据框和列表，我也创建了规则。但结果没有出来，也没有显示任何错误。下面是代码: df = pd.read_csv('itemlist.csv', header = None)
java - Weka Apriori 算法快速 vector 输出内存位置值
我使用weka依赖项通过Apriori算法获取关联规则。下面是我的代码。当我获取值时，快速 vector 显示内存位置值。如果有人能给我一个答案来获取关联规则，我将非常感激。 package com.
python - 如何加速基于仅生成结果(右侧)是数据集的一个元素的关联规则的 Apriori 框架？
我有一个包含 600 000 行和 15 列的 csv 文件 "Col1, Col2 ... COl15"。我想生成关联规则，其中只有右侧只有来自 col15 的值。我正在使用 here 中的先验实现

首页

博学

6Ren·AI

商城

sql-server - Apriori算法的 'confidence'和 'lift'概念有什么用