java - 如何使用 Pyspark 连接 Teradata-6ren

java - 如何使用 Pyspark 连接 Teradata

转载作者：行者123 更新时间：2023-12-02 06:03:00

24

4

我正在尝试通过 PySpark 连接 teradata 服务器。

我的 CLI 代码如下，

from pyspark.sql import SparkSession
spark=SparkSession.builder
                  .appName("Teradata connect")
                  .getOrCreate()
df = sqlContext.read
               .format("jdbc")
               .options(url="jdbc:teradata://xy/",
                        driver="com.teradata.jdbc.TeraDriver",
                        dbtable="dbname.tablename",
                        user="user1",password="***")
               .load()

这是一个错误，

py4j.protocol.Py4JJavaError: An error occurred while calling o159.load. : java.lang.ClassNotFoundException: com.teradata.jdbc.TeraDriver

为了解决这个问题，我认为，我需要添加 jar terajdbc4.jar 和 `tdgssconfig.jar。

在Scala中，我们可以使用添加jar

    sc.addJar("<path>/jar-name.jar")

如果我对 PySpark 使用相同的内容，则会出现错误，

AttributeError: 'SparkContext' object has no attribute 'addJar'.

或

AttributeError: 'SparkSession' object has no attribute 'addJar'

如何添加 jar terajdbc4.jar 和 tdgssconfig.jar？

最佳答案

尝试按照这篇文章进行操作，其中解释了如何将 jdbc 驱动程序添加到 pyspark。

How to add jdbc drivers to classpath when using PySpark?

上面的示例适用于 postgres 和 docker，但答案应该适用于您的场景。请注意，您对驱动程序文件的看法是正确的。大多数 JDBC 驱动程序都位于单个文件中，但 Teradata 将其分为两部分。我认为一个是实际的驱动程序，另一个(tdgss)包含安全内容。 这两个文件必须添加到类路径中才能正常工作。

或者，只需谷歌搜索“如何将 jdbc 驱动程序添加到 pyspark”。

关于java - 如何使用 Pyspark 连接 Teradata，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55961635/

24

4

0

文章推荐： wpf - 使用模板化菜单项关闭 ContextMenu

文章推荐： java - Guice - 从覆盖内访问原始值

文章推荐： xcode - 添加系统头搜索路径到Xcode

文章推荐： asp.net-mvc - 如何从 MVC View 生成 webapi url？

teradata - Teradata 中的日期函数
Teradata 中是否有一个函数，可以通过将任意年份的日、月作为参数来“生成”日期？那么如果我有整数参数 p1_day、p2_month 和 p3_year (顺便说一句，它们是属性)，是否有一个像
teradata - 添加具有默认值的多列(Teradata)
我试图搜索，但我没有找到任何东西。我正在尝试将两列添加到具有默认值 (Teradata) 的表中。我正在尝试这个声明 ALTER TABLE TEST add (DWH_Change_dt date
teradata - Teradata 中的日期函数
Teradata 中是否有一个函数可以通过给定任何年份的日、月作为参数来“制作”一个日期？所以，如果我有整数参数 p1_day、p2_month 和 p3_year(顺便说一下，它们是属性)，是否有类
teradata - 如何在 Teradata 中将纪元时间转换为人类可读
在我的 Teradata 表中，dhTimestamp 列下有纪元时间戳 dhTimestamp 1435308067705 1434965874565 1434763800794 14347
teradata - 解释 Teradata 中的查询带
谁能解释 Teradata 中的查询带？我已经对此进行了很多搜索，但无法获得我能理解的信息。请详细一点。谢谢!!! 最佳答案 TeraDATA 中的查询分段: Query Banding 提供了
teradata - 替换 Teradata 中的特殊字符
Teradata 数据库中有特殊字符，我想删除它。 Example - special character: "aa€bb" (special charcter is "€" sign) Desir
teradata - Teradata Kylo 产品发生了什么变化？
GitHub 事件只是 empty last month , 至少 latest release 0.10.1 的下载链接(2019 年 3 月)无路可走对于 VirtualBox images 同
teradata - 如何识别 Teradata 用户的所有权限？
我正在寻找一种方法来识别授予特定数据库中用户的默认权限。我已经尝试过: select * from dbc.allrights where username='user-id' and datab
teradata - 什么是完整的 Teradata 客户端软件？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
teradata - 在 Teradata 中计算上周数据
如何计算前 7 天的数据(前一周的周日至周六)。无论一周中的哪一天运行，它都应始终给出前一周的星期日至星期六。谢谢最佳答案您的 Teradata 版本是什么？ TD14 支持 NEXT_DAY，它
teradata - 如何在 Teradata 中对日期使用递归？
我为参加马拉松比赛的人准备了下表 person start end mike 2-Jun-14 2-Jul-14 nike 3-Jul-14 9-Aug-14 m
teradata - 如何计算 Teradata 数据库中的可用空间
我想报告特定 Teradata 数据库的各种统计数据，尤其是“可用空间”。表倾斜是否应该包括在计算中？例如，有人建议了以下查询: SELECT databasename , SUM(maxp
teradata - Teradata 查询中的领先和滞后 - 对于类别
我正在编写一个查询以从数据转储中获取 SCD 2 类型的数据。我的数据和代码如下: create table promotions ( start_date date, end_date date,
teradata - 如何获取 Teradata 中的表大小？
我在 Teradata 中有一张表。我想知道它的大小。对于 Teradata 中的数据库，同样的事情可能会很有趣。我该怎么做？最佳答案要检查您的 table 大小，您可以从 dbc.tables
teradata - 如何使用 Teradata SQL 检查字段是否包含所有数值？
我正在寻找类似于 ISNUMERIC() 的函数来自 T-SQL 和 Teradata SQL。如果字符类型字段中包含的数据都是数字，我想要一个简单的方法来返回一个 bool 值(或数字 1/0)。
teradata - 为什么 Teradata 标识列不增加 1？
我有下表 CREATE SET TABLE myTab,FALLBACK,NO BEFORE JOURNAL,NO AFTER JOURNAL,CHECKSUM = DEFAULT,DEFAULT M
teradata - 从 Teradata 表导出到 CSV
是否可以将 Teradata 表中的日期直接传输到 .csv 文件中。问题是 - 我的表有超过 1800 万行。如果是，请发送告诉我过程最佳答案对于这样大小的表，我建议使用 FastExport
teradata - 删除/删除 Teradata 中的数据库
请帮助指导如何在 Teradata 中删除数据库。当我运行命令DROP DATABASE database_name时，我收到错误消息: *** Failure 3552 Cannot DROP d
teradata - Teradata 中的 LISTAGG 等效项
teradata中是否有相当于oracle的Listagg函数的函数。递归是我尝试过的一个选项，但想要其他的东西。谢谢阿里特拉最佳答案如果安装了 Teradata 的 XML 服务(从 14.1
teradata - 如何在 Teradata 14 中对子字符串进行分组？
我在Teradata 14 中有下表，不允许我自己编写过程和函数，但我可以使用strtok、strtok_split_to_table 等等 id property 1 1234X (Yel),

首页

博学

6Ren·AI

商城

java - 如何使用 Pyspark 连接 Teradata