gpt4 book ai didi

postgresql - 使用 pyspark 连接到 PostgreSQL

转载 作者:行者123 更新时间:2023-11-29 11:13:36 26 4
gpt4 key购买 nike

我正在尝试使用 pyspark 连接到数据库,我正在使用以下代码:

sqlctx = SQLContext(sc)
df = sqlctx.load(
url = "jdbc:postgresql://[hostname]/[database]",
dbtable = "(SELECT * FROM talent LIMIT 1000) as blah",
password = "MichaelJordan",
user = "ScottyPippen",
source = "jdbc",
driver = "org.postgresql.Driver"
)

我收到以下错误:

enter image description here

知道为什么会这样吗?

编辑:我正在尝试在我的计算机上本地运行代码。

最佳答案

https://jdbc.postgresql.org/download/ 下载 PostgreSQL JDBC 驱动程序

然后用您的值替换数据库配置值。

from pyspark.sql import SparkSession

spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.jars", "/path_to_postgresDriver/postgresql-42.2.5.jar") \
.getOrCreate()

df = spark.read \
.format("jdbc") \
.option("url", "jdbc:postgresql://localhost:5432/databasename") \
.option("dbtable", "tablename") \
.option("user", "username") \
.option("password", "password") \
.option("driver", "org.postgresql.Driver") \
.load()

df.printSchema()

更多信息:https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html

关于postgresql - 使用 pyspark 连接到 PostgreSQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34948296/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com