- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的意思是,是否只有像 aprioriall 这样的序列模式算法才能对项目进行排序?这是否可以减少关联规则的数量?
最佳答案
频繁项集挖掘 (FIM) 算法(如 Apriori)将事务数据库作为输入。交易只是一组没有任何排序的项目。目标是找到交易中经常出现的项目集,而不考虑时间等顺序。
序列模式挖掘 (SPM) 算法,例如 AprioriAll、PrefixSpan、CM-SPADE 和 GSP,将序列数据库作为输入。序列是事务的有序列表。目标是发现经常出现在一组序列中的子序列。在这种情况下,将考虑项目之间的顺序排序。
因此,如果数据中存在顺序排序或者您关心结果中的顺序,则应使用顺序模式挖掘而不是频繁项集挖掘。如果您不关心顺序,您可以使用 FIM 算法。
此外,我注意到您还谈到了关联规则。让我澄清一下这些想法。频繁项集可用于生成关联规则。两组项目之间的规则 X --> Y 意味着 X 中的项目与 Y 中的项目一起出现,具有给定的置信度和支持度。但是关联规则并没有提供任何关于 X 和 Y 之间是否存在顺序排序的信息。如果要查找具有顺序排序的规则,则应考虑使用顺序规则。顺序规则可以通过某种算法直接找到,也可以从顺序模式中导出。
顺序规则和顺序模式有什么区别?顺序模式通常是根据它们的支持度(它们在序列数据库中出现的序列数)找到的。另一方面,顺序规则通常是根据其支持度和置信度找到的,因此对于推荐等应用更有用。规则 X -> Y 的置信度可以看作是对 Y 遵循 X 的概率的估计。
如果你想尝试一些FIM、SPM和顺序规则挖掘算法,你可以访问SPMF data mining library的网站。 (我是创始人)它还提供了 200 多种针对这些问题的算法实现以及一些示例。
关于data-mining - 顺序挖掘模式相对于先验算法的优势是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28269789/
我想创建一组参数用于 R 中的 brms 模型: library(brms) tmp <- prior(normal(10,2), nlpar = "x") 理想情况下,我想从导入的矩阵中提取每个先验
我想在 PyMC3 中指定大型多元正态分布作为先验。该分布的精度矩阵的行列式在数值上等于零。看来这是 PyMC3 的问题。有什么建议么?我只需要最大化后验,无论行列式的值如何,都可以这样做。 最佳答案
(未在 Activator 文档中找到) 通过在文件 build.sbt 中添加以下条目(粗体),似乎可以让 Activator 也使用现有的本地 Maven 存储库: 解析器 += Seq( 位于“
我之前实现了原始的 Bayesian Probabilistic Matrix Factorization (BPMF) pymc3 中的模型。 See my previous question供引用
我是一名优秀的程序员,十分优秀!