- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道在挖掘关联规则中是否可以自动确定最小支持度和最小置信度?如果是这样,任何指向资源的提示或指针都会很棒。
最佳答案
是的,有一些方法可以自动确定 minsup 和 minconf 阈值。
但首先,让我告诉您如何选择 minsup 和 minconf 参数。选择它们取决于您的数据。
对于 最低支持 ,我在一些数据上使用了 80%。对于其他一些数据,我使用 0.05%。这一切都取决于数据集。通常,我从一个高值开始,然后减小这些值,直到找到一个可以生成足够多模式的值。
对于 分钟信心 ,它更容易一点,因为它代表了您对规则的信心。所以通常,我使用 60% 之类的东西,因为我对真正少于 60% 的时间的规则不感兴趣。但这也取决于数据。
在性能方面,当 minsup 更高时,您会发现更少的模式并且算法更快。对于minconf,当它设置得更高时,模式会更少,但可能不会更快,因为许多算法不使用minconf来修剪搜索空间。所以很明显,设置这些参数还取决于你想要多少规则。
如果您不想使用 minsup 参数,您可以使用 top-k关联规则挖掘算法 .在这种情况下,例如您将指定 k=1000,算法将发现 1000 条最常见的规则,并具有给定的最小置信度。我设计了一个这样的算法,名为 TopKRules 用于关联规则挖掘。您可以从 SPMF open-source data mining library 下载源代码。 ,它提供了许多关联规则和模式挖掘算法的实现。
自动设置 minsup 阈值的另一种解决方案是使用数学函数根据您拥有的数据量来设置它。你可以看到我的blog post here作为如何做到这一点的例子。
其他一些工作试图找到设置 minsup 和 minconf 的解决方案。您可以在 Google 学术搜索中找到它们。
关于data-mining - 数据挖掘的最小支持和最小信心,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25322204/
我的应用程序仅在未使用 XCode 调试器运行时崩溃。很难跟踪,因为我无法调试,但我终于弄明白了。这是因为在不属于我的某个对象上调用释放。在我更正它之前,我在这里搜索并找到了 2 个相关问题(下面的链
Luis、watson、dialogflow - 所有它们在 json 结果中都返回分数/置信度值(luis 示例): "intents": [ { "intent": "SearchSigil"
我是一名优秀的程序员,十分优秀!