gpt4 book ai didi

postgresql - Spark + HAWQ 集成(HDP 2.4.2)

转载 作者:行者123 更新时间:2023-11-29 13:22:01 25 4
gpt4 key购买 nike

我正在使用 HDP 2.4.2 我想将 Spark 与 HAWQ 连接起来以获取数据。

如果有任何推荐/正确的方法,请告诉我,目前我正在使用 postgress jdbc 驱动程序将 spark 与 HAWQ 连接起来。我面临这样的问题

-如果表不存在,DataFrame 会在 HAWQ 中自动创建表。

-记录摄取太慢。

-间歇性地显示错误,例如 "org.postgresql.util.PSQLException: ERROR: relation "table_name"already exists"

最佳答案

请参阅此示例 Scala 项目以通过 Spark RDD 读取 HAWQ 数据:https://github.com/kdunn926/sparkHawq

如果您希望使用 HAWQ 读取由 Spark 生成的数据,最好的选择是从 Spark 写入 HDFS,然后使用 PXF 与 HAWQ 一起读取它。请参阅此处的文档:http://hdb.docs.pivotal.io/200/hawq/pxf/PivotalExtensionFrameworkPXF.html

关于postgresql - Spark + HAWQ 集成(HDP 2.4.2),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40101231/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com