gpt4 book ai didi

hadoop - Spark : Export graph data to anything (Hive, 文本等)

转载 作者:可可西里 更新时间:2023-11-01 15:34:06 25 4
gpt4 key购买 nike

我有一个以这种方式创建的星图

val graph = Graph(vertices, edges, defaultArticle).cache

我的顶点是 RDD[(Long, (String, Option[String], List[String], Option[String])] 我的边是 RDD[Edge[长]]

如何将此图形/边/顶点保存到 Hive/文本文件/其他任何内容,以及如何读回它?我查看了 Spark SQL 文档和 Spark 核心文档,但我仍然没有成功。如果我执行 saveAsTextFile(),那么当我读回它时,它是一个 RDD[String],这不是我需要的....

编辑: Daniel 提供了另存为对象文件的答案...我仍然有兴趣了解如何将上面的对象保存和读取为 Hive 表。谢谢!

最佳答案

使用 rdd.saveAsObjectFile()/sc.objectFile 而不是 rdd.saveAsTextFile()/sc.textFile() ()。这将为每一行使用普通的 Java 序列化,存储为 Hadoop SequenceFile。

关于hadoop - Spark : Export graph data to anything (Hive, 文本等),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28212475/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com