gpt4 book ai didi

java - Hive Hook 有没有 Spark Hook

转载 作者:可可西里 更新时间:2023-11-01 14:22:24 26 4
gpt4 key购买 nike

我正在做一个项目,必须跟踪文件转换沿袭。假设一个名为 SomeTextFile.txt 的文件经过多个配置单元操作,并在最后阶段根据需要产生一些出色的结果。

案例:1 文件运行情况(如果我对文件应用配置单元操作)

文件-->FileAfterAction1-->FileAfterAction2--->FinalResultantFile

在这种情况下,我使用的是 hive hook,它将与应用于 File.say 的中间过程相关的数据存储在一个文本文件中,lineageEngine 代码从该文本文件中读取并生成该最终文件的沿袭。

现在,由于技术堆栈中涉及 spark,客户端也可以对文件应用 spark 操作。

案例 2 同样的事情发生在文件上,但现在是 Spark 操作。

问题 - 有什么方法可以获取中间信息,文件在转换开始和结束之间发生了什么。

到目前为止,我从网上得到的是 spark 转换呕吐中间图,但在我的情况下,客户端将应用 Spark 操作而不是 Spark 转换。如果有一些带宽,请参与其中。

最佳答案

https://issues.apache.org/jira/browse/SPARK-18127

此功能将在 Spark 2.2 中实现

关于java - Hive Hook 有没有 Spark Hook,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36791125/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com