gpt4 book ai didi

algorithm - 查找频繁项集

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:21:31 25 4
gpt4 key购买 nike

我有以下数据集: enter image description here

| 拆分集合的位置。基本上,例如第 2 行看起来像这样:

{{null}, {shop, atm}, {null}, {shop, atm}, {null}, {null}}

集合的顺序没有任何作用:{shop, amt} == {atm, shop}

我想做两件事:

1) 找到共同模式和频繁项集。例如,集合 {shop, atm} 频繁出现在第 1、2 和 4 行。

2) 找出哪些元素后跟哪些集合(或集合元素)。例如,shop 后面经常跟着其他商店:{shop, atm}, {shop} - 第 1 行和 {shop}, {shop, atm} - 第 4 行。

第一个问题用Apriori算法很容易解决吧?这很容易。但是第二个问题呢?我该如何解决?用户使用哪些算法?

最佳答案

是的,Apriori 会找到频繁的项目集(即具有高支持度的集)。 FP-Tree 通常更好,因为它只需要两次遍历数据。

第二部分,规则生成,涉及采用成对的频繁项集,其中第一个是第二个的超集。然后你可以形成一个规则,其中较小的集合是前提,集合的差异是结果。较大项集与较小项集的支持度之比即为规则的统计置信度。

这些都是相当基本的数据挖掘内容,并且在维基百科等中有很好的描述。Weka 和 R 等软件包会为您完成艰苦的工作。

关于algorithm - 查找频繁项集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33354514/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com