gpt4 book ai didi

data-mining - 顺序挖掘模式相对于先验算法的优势是什么?

转载 作者:行者123 更新时间:2023-12-02 15:30:00 24 4
gpt4 key购买 nike

我的意思是,是否只有像 aprioriall 这样的序列模式算法才能对项目进行排序?这是否可以减少关联规则的数量?

最佳答案

频繁项集挖掘 (FIM) 算法(如 Apriori)将事务数据库作为输入。交易只是一组没有任何排序的项目。目标是找到交易中经常出现的项目集,而不考虑时间等顺序。

序列模式挖掘 (SPM) 算法,例如 AprioriAll、PrefixSpan、CM-SPADE 和 GSP,将序列数据库作为输入。序列是事务的有序列表。目标是发现经常出现在一组序列中的子序列。在这种情况下,将考虑项目之间的顺序排序。

因此,如果数据中存在顺序排序或者您关心结果中的顺序,则应使用顺序模式挖掘而不是频繁项集挖掘。如果您不关心顺序,您可以使用 FIM 算法。

此外,我注意到您还谈到了关联规则。让我澄清一下这些想法。频繁项集可用于生成关联规则。两组项目之间的规则 X --> Y 意味着 X 中的项目与 Y 中的项目一起出现,具有给定的置信度和支持度。但是关联规则并没有提供任何关于 X 和 Y 之间是否存在顺序排序的信息。如果要查找具有顺序排序的规则,则应考虑使用顺序规则。顺序规则可以通过某种算法直接找到,也可以从顺序模式中导出。

顺序规则和顺序模式有什么区别?顺序模式通常是根据它们的支持度(它们在序列数据库中出现的序列数)找到的。另一方面,顺序规则通常是根据其支持度和置信度找到的,因此对于推荐等应用更有用。规则 X -> Y 的置信度可以看作是对 Y 遵循 X 的概率的估计。

如果你想尝试一些FIM、SPM和顺序规则挖掘算法,你可以访问SPMF data mining library的网站。 (我是创始人)它还提供了 200 多种针对这些问题的算法实现以及一些示例。

关于data-mining - 顺序挖掘模式相对于先验算法的优势是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28269789/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com