java - JDBC 连接无法从 apache spark 连接 Teradata-6ren

java - JDBC 连接无法从 apache spark 连接 Teradata

转载作者：行者123 更新时间：2023-11-30 08:50:17

25

4

我尝试了许多不同的方法来使用 JDBC 连接从 Apache Spark 连接到我们的 Teradata 环境。下面是我一直在使用的代码。

我确保我的 JDBC 驱动程序是正确的，因为我使用相同的驱动程序从其他平台连接到 Teradata。

我还在运行 spark-shell 时添加驱动程序 Jar./bin/spark-shell --jars/home/path/*.jar --driver-class-path/home/path/*.jar

如有任何帮助，我们将不胜感激!

val jdbcDF = sqlContext.load("jdbc", Map(
  "url" -> "jdbc:teradata://<server_name>, TMODE=TERA, user=my_user, password=*****",
  "dbtable" -> "schema.table_name",
  "driver" -> "com.teradata.jdbc.TeraDriver"))

异常的堆栈跟踪:

warning: there were 1 deprecation warning(s); re-run with -deprecation for details
java.lang.ClassNotFoundException: com.teradata.jdbc.TeraDriver
        at scala.tools.nsc.interpreter.AbstractFileClassLoader.findClass(AbstractFileClassLoader.scala:83)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
        at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
        at org.apache.spark.sql.jdbc.package$DriverRegistry$.register(jdbc.scala:227)
        at org.apache.spark.sql.jdbc.DefaultSource.createRelation(JDBCRelation.scala:94)
        at org.apache.spark.sql.sources.ResolvedDataSource$.apply(ddl.scala:265)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:114)
        at org.apache.spark.sql.SQLContext.load(SQLContext.scala:1242)
        at $iwC$$iwC$$iwC$$iwC$$iwC$$iwC$$iwC$$iwC.<init>(<console>:19)
        at $iwC$$iwC$$iwC$$iwC$$iwC$$iwC$$iwC.<init>(<console>:27)
        at $iwC$$iwC$$iwC$$iwC$$iwC$$iwC.<init>(<console>:29)
        at $iwC$$iwC$$iwC$$iwC$$iwC.<init>(<console>:31)
        at $iwC$$iwC$$iwC$$iwC.<init>(<console>:33)
        at $iwC$$iwC$$iwC.<init>(<console>:35)
        at $iwC$$iwC.<init>(<console>:37)
        at $iwC.<init>(<console>:39)
        at <init>(<console>:41)
        at .<init>(<console>:45)
        at .<clinit>(<console>)
        at .<init>(<console>:7)
        at .<clinit>(<console>)
        at $print(<console>)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:497)
        at org.apache.spark.repl.SparkIMain$ReadEvalPrint.call(SparkIMain.scala:1065)
        at org.apache.spark.repl.SparkIMain$Request.loadAndRun(SparkIMain.scala:1338)
        at org.apache.spark.repl.SparkIMain.loadAndRunReq$1(SparkIMain.scala:840)
        at org.apache.spark.repl.SparkIMain.interpret(SparkIMain.scala:871)
        at org.apache.spark.repl.SparkIMain.interpret(SparkIMain.scala:819)
        at org.apache.spark.repl.SparkILoop.reallyInterpret$1(SparkILoop.scala:857)
        at org.apache.spark.repl.SparkILoop.interpretStartingWith(SparkILoop.scala:902)
        at org.apache.spark.repl.SparkILoop.reallyInterpret$1(SparkILoop.scala:875)
        at org.apache.spark.repl.SparkILoop.interpretStartingWith(SparkILoop.scala:902)
        at org.apache.spark.repl.SparkILoop.reallyInterpret$1(SparkILoop.scala:875)
        at org.apache.spark.repl.SparkILoop.interpretStartingWith(SparkILoop.scala:902)
        at org.apache.spark.repl.SparkILoop.reallyInterpret$1(SparkILoop.scala:875)
        at org.apache.spark.repl.SparkILoop.interpretStartingWith(SparkILoop.scala:902)
        at org.apache.spark.repl.SparkILoop.command(SparkILoop.scala:814)
        at org.apache.spark.repl.SparkILoop.processLine$1(SparkILoop.scala:657)
        at org.apache.spark.repl.SparkILoop.innerLoop$1(SparkILoop.scala:665)
        at org.apache.spark.repl.SparkILoop.org$apache$spark$repl$SparkILoop$$loop(SparkILoop.scala:670)
        at org.apache.spark.repl.SparkILoop$$anonfun$org$apache$spark$repl$SparkILoop$$process$1.apply$mcZ$sp(SparkILoop.scala:997)
        at org.apache.spark.repl.SparkILoop$$anonfun$org$apache$spark$repl$SparkILoop$$process$1.apply(SparkILoop.scala:945)
        at org.apache.spark.repl.SparkILoop$$anonfun$org$apache$spark$repl$SparkILoop$$process$1.apply(SparkILoop.scala:945)
        at scala.tools.nsc.util.ScalaClassLoader$.savingContextLoader(ScalaClassLoader.scala:135)
        at org.apache.spark.repl.SparkILoop.org$apache$spark$repl$SparkILoop$$process(SparkILoop.scala:945)
        at org.apache.spark.repl.SparkILoop.process(SparkILoop.scala:1059)
        at org.apache.spark.repl.Main$.main(Main.scala:31)
        at org.apache.spark.repl.Main.main(Main.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:497)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:664)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:169)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:192)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:111)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

最佳答案

我终于搞定了。它不适用于 --jars 的原因在 spark docs 中有解释。 :

The JDBC driver class must be visible to the primordial class loader on the client session and on all executors. This is because Java’s DriverManager class does a security check that results in it ignoring all drivers not visible to the primordial class loader when one goes to open a connection.

解决方法是:

将 JDBC jar 复制到集群中的每个 spark 节点
修改您的 spark-defaults.conf 为您的驱动程序和执行程序添加 extraClassPath 选项

将这些添加到 spark-defaults.conf:

spark.driver.extraClassPath
- /usr/lib/tdch/1.4/lib/terajdbc4.jar:/usr/lib/tdch/1.4/lib/tdgssconfig.jar
spark.executor.extraClassPath
- /usr/lib/tdch/1.4/lib/terajdbc4.jar:/usr/lib/tdch/1.4/lib/tdgssconfig.jar

如果您使用的是 Ambari，则可以在“Custom spark-defaults”下添加这两个属性，然后重新启动 Spark。

关于java - JDBC 连接无法从 apache spark 连接 Teradata，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31031156/

25

4

0

文章推荐： java - 为什么 JPA\Hibernate 不自动创建这个映射字段？

文章推荐： javascript - 更优雅的按钮将数据提交到脚本

jdbc - 新的 Databricks JDBC 驱动程序版本无法识别 JDBC URL
我一直在使用 Databricks JDBC 驱动程序版本 2.6.22，并尝试升级到 2.6.27。但是，升级后我收到消息说我的 JDBC URL 在尝试连接时无效。这些 JDBC URL 与旧版本
jdbc - JDBC 上的事件或空闲连接
似乎JDBC Spec没有详细说明数据源连接池中alive or idle connections的准确含义。它只是具体实现吗？ DBCP2如何或 HikariCP实际检查连接状态？下面没有事件事务
jdbc - JDBC 连接文件可以包含计算属性吗？
在“XPages 扩展库”一书中，第 12 章，第 409 页有一个 JDBC 连接文件的例子: org.apache.derby.jdbc.EmbeddedDriver jdbc:
jdbc - jdbc 是如何工作的
谁能告诉我 jdbc 是如何工作的？它如何设法与 DBMS 通信？因为 DBMS 可能是用其他编程语言编写的。最佳答案与数据库的通信由 JDBC 驱动程序处理，这些驱动程序可以使用各种策略与数据库
Spring JDBC 无法加载 JDBC 驱动程序类 [oracle.jdbc.driver.OracleDriver]
我想知道是否有人可以帮助我解决这个问题。我在尝试使用 Spring JDBC 编写代码时遇到了一个问题。当我运行服务器时，我收到了标题中提到的消息。我google了一下，有人说你应该导入ojdbc.j
jdbc - 配置单元 jdbc 连接发出内存不足错误
我只是想运行一个示例 hivejdbc 客户端程序，但它给我一个内存不足的错误。 import java.sql.SQLException; import java.sql.Connection; i
jdbc - 谷歌电子表格 jdbc 连接器
我需要将 Google Spreadsheet 与 JasperReports Server 一起使用，为此我需要一个用于 Google Spreadsheet 的 JDBC 连接器。我找到了这个
jdbc - DB2 JDBC 事务大小有限制吗？
我需要将大量行(最多 100,000 行)插入到 6 个不同的 DB2 表中。我正在使用 Java JDBC 来完成它。我想在单个数据库事务中完成所有操作，以便在遇到任何问题时可以回滚整个操作。在某处
jdbc - jmeter jdbc 变量名查询
再次为自己是 Jmeter 新手道歉——我对 JDBC 请求有点困惑——我在过去的 3 个小时里浏览了这个网站上的帖子——但我找不到任何相关的东西(除非我我错过了一些东西)。我的环境:Jmeter
jdbc - 使用动态 JDBC 用户名和密码的最佳方式是什么？
我们正在创建一个带有 MySQL 后端的 XPages 应用程序。应用程序将被多个客户使用。每个都有自己的 NSF 数据库和相应的 MySQL 数据库。每个客户都有自己的 MySQL 用户名。我们正在
jdbc - 处理来自同一供应商的多个 JDBC 驱动程序
昨天我遇到了一个大问题。在我当前的项目中，我使用 Oracle 的 JDBC 的 ojdbc6 实现进行连接，但我还需要处理例如 oracle 8 数据库，这对于这个 JAR 是完全不可能的。你会说
jdbc - 是否需要关闭从 jdbc 连接池获取的连接？
这个问题在这里已经有了答案: Closing JDBC Connections in Pool (3 个答案) 关闭 2 年前。假设我有以下代码 DataSource source = (Data
jdbc - Informix JDBC 时间戳字符串格式
我有 Informix 数据库，时间戳字段定义为 YEAR TO SECOND。当我使用 JDBC rs.getString(column) 显示此字段时，它使用带毫秒的格式，因此此字段如下所示:
jdbc - Logstash-JDBC-MYSQL配置错误
看完本教程之后; https://www.youtube.com/watch?v=ZnI_rlrei1s 我正在尝试使用logstash和jdbc获取我的本地主机mysql(使用laravel val
jdbc - Elasticsearch JDBC River未索引数组
有人给我小费。 { "type": "jdbc", "jdbc": { "driver": "com.microsoft.sqlserver.jdbc.SQLServerDriver"
jdbc - Cassandra jdbc 是否仍得到积极支持？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
jdbc - Elasticsearch JDBC River吞噬了整个内存
我正在尝试从mysql表中将1600万个文档(47gb)索引为elasticsearch索引。我正在使用jparante's elasticsearch jdbc river执行此操作。但是，在创建河
jdbc - ElasticSearch JDBC River创建重复项
我正在尝试使用JDBC河将我的MySQL数据库复制到我的ElasticSearch索引中。但是，每当我启动服务器时，与MySQL表的count(*)相比，创建的文档数量就增加了一倍。我通过清空索引并
jdbc - Logstash jdbc 连接器基于时间的数据
使用新的logstash jdbc 连接器: https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html后续的
jdbc - 有没有成熟的命令行 JDBC 客户端？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便

首页

博学

6Ren·AI

商城

java - JDBC 连接无法从 apache spark 连接 Teradata