gpt4 book ai didi

python - 与 Pandas 数据框的关联规则

转载 作者:太空宇宙 更新时间:2023-11-03 11:26:01 25 4
gpt4 key购买 nike

我有这样一个数据框

df = pd.DataFrame(data=[980,169,104,74], columns=['Count'], index=['X,Y,Z', 'X,Z','X','Y,Z'])

Count
X, Y, Z 980
X,Z 169
X 104
Y,Z 74

我希望能够从中提取关联规则。我看到 Apriori 算法 是引用。并且还发现用于数据挖掘的Orange库在该领域是众所周知的。

但问题是,为了使用AssociationRulesInducer我需要先创建一个包含所有交易的文件。由于我的数据集非常庞大(20 列和 500 万行),将所有这些数据写入一个文件并使用 Orange 再次读取它的成本太高。

您知道如何利用我当前的数据帧结构来查找关联规则吗?

最佳答案

Orange3-Associate Orange data mining suite 的附加组件似乎包括小部件和 code that mines frequent itemsets (以及来自它们的 association rules )甚至来自稀疏数组或列表列表,这可能对您有用。

有了 500 万行,如果它确实如此,那就太棒了。 :)

关于python - 与 Pandas 数据框的关联规则,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33652744/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com