gpt4 book ai didi

data-mining - 数据挖掘的最小支持和最小信心

转载 作者:行者123 更新时间:2023-12-04 23:49:42 27 4
gpt4 key购买 nike

我想知道在挖掘关联规则中是否可以自动确定最小支持度和最小置信度?如果是这样,任何指向资源的提示或指针都会很棒。

最佳答案

是的,有一些方法可以自动确定 minsup 和 minconf 阈值。

但首先,让我告诉您如何选择 minsup 和 minconf 参数。选择它们取决于您的数据。

对于 最低支持 ,我在一些数据上使用了 80%。对于其他一些数据,我使用 0.05%。这一切都取决于数据集。通常,我从一个高值开始,然后减小这些值,直到找到一个可以生成足够多模式的值。

对于 分钟信心 ,它更容易一点,因为它代表了您对规则的信心。所以通常,我使用 60% 之类的东西,因为我对真正少于 60% 的时间的规则不感兴趣。但这也取决于数据。

在性能方面,当 minsup 更高时,您会发现更少的模式并且算法更快。对于minconf,当它设置得更高时,模式会更少,但可能不会更快,因为许多算法不使用minconf来修剪搜索空间。所以很明显,设置这些参数还取决于你想要多少规则。

如果您不想使用 minsup 参数,您可以使用 top-k关联规则挖掘算法 .在这种情况下,例如您将指定 k=1000,算法将发现 1000 条最常见的规则,并具有给定的最小置信度。我设计了一个这样的算法,名为 TopKRules 用于关联规则挖掘。您可以从 SPMF open-source data mining library 下载源代码。 ,它提供了许多关联规则和模式挖掘算法的实现。

自动设置 minsup 阈值的另一种解决方案是使用数学函数根据您拥有的数据量来设置它。你可以看到我的blog post here作为如何做到这一点的例子。

其他一些工作试图找到设置 minsup 和 minconf 的解决方案。您可以在 Google 学术搜索中找到它们。

关于data-mining - 数据挖掘的最小支持和最小信心,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25322204/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com