gpt4 book ai didi

scala - 数据框上的 FPGrowth?

转载 作者:行者123 更新时间:2023-11-30 09:20:42 26 4
gpt4 key购买 nike

假设我有一个这种结构的数据框:

time| asset | parameter  
----|-------|----------
T1 | A1 | P1
T1 | A1 | P2
T1 | A1 | P3
T1 | A2 | P1
T1 | A2 | P2
T1 | A2 | P3
T2 | A1 | P1
....

等等

我想在此数据帧上使用 FPGrowth API(作为 spark.mllib 的一部分),其中与同一时间戳对应的所有参数都被视为事务。我该怎么办?

documentation 中给出的示例简单地谈论正在读取的文件,每一行对应一个不同的事务。

我是 Spark 新手,因此欢迎任何形式的帮助!(Spark 版本 1.6.2 与 Scala)

最佳答案

透视您的数据,以便每个事务只有一行。

然后运行 ​​FPgrowth。

关于scala - 数据框上的 FPGrowth?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40768888/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com