java - Apache 飞艇/ Spark : Why can't I access a remote DB with this code sample-6ren

java - Apache 飞艇/ Spark : Why can't I access a remote DB with this code sample

转载作者：行者123 更新时间：2023-11-30 10:47:24

25

4

我正在使用 Spark 和 Zeppelin 执行自己的第一步，但不明白为什么此代码示例不起作用。

第一 block :

%dep
z.reset()                                                     // clean up 
z.load("/data/extraJarFiles/postgresql-9.4.1208.jar")         // load a jdbc driver for postgresql

第二 block

%spark
// This code loads some data from a PostGreSql DB with the help of a JDBC driver.
// The JDBC driver is stored on the Zeppelin server, the necessary Code is transfered to the Spark Workers and the workers build the connection with the DB.
// 
// The connection between table and data source is "lazy".  So the data will only be loaded in the case that an action need them.
// With the current script means this the DB is queried twice.   ==> Q:  How can I keep a RDD in Mem or on disk?

import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.SparkConf
import org.apache.spark.rdd.JdbcRDD
import java.sql.Connection
import java.sql.DriverManager
import java.sql.ResultSet

import org.apache.spark.sql.hive._ 
import org.apache.spark.sql._

val url = "jdbc:postgresql://10.222.22.222:5432/myDatabase"
val username = "postgres"
val pw = "geheim"

Class.forName("org.postgresql.Driver").newInstance                             // activating the jdbc driver. The jar file was loaded inside of the %dep block


case class RowClass(Id:Integer, Col1:String , Col2:String)                         // create a class with possible values

val myRDD = new JdbcRDD(sc,                                                    // SparkContext sc
                        () => DriverManager.getConnection(url,username,pw),    // scala.Function0<java.sql.Connection> getConnection
                        "select * from tab1 where \"Id\">=? and \"Id\" <=? ",  // String sql    Important: we need here two '?' for the lower/upper Bounds vlaues
                        0,                                                     // long lowerBound   = start value
                        10000,                                                // long upperBound,  = end value that is still included
                        1,                                                     // int numPartitions  = the area is spitted into x sub commands.   
                                                                               //  e.g. 0,1000,2  => first cmd from 0 ... 499, second cmd from 500..1000
                        row => RowClass(row.getInt("Id"),
                                        row.getString("Col1"),
                                        row.getString("Col2"))
                       )

myRDD.toDF().registerTempTable("Tab1")

// --- improved methode (not working at the moment)----
val prop = new java.util.Properties
prop.setProperty("user",username)
prop.setProperty("password",pw)

val tab1b = sqlContext.read.jdbc(url,"tab1",prop)             // <-- not working

tab1b.show

那么问题是什么。

我想连接到外部 PostgreSql 数据库。

block I 正在为数据库添加必要的 JAR 文件，第二个 block 的第一行已经在使用 JAR，它能够从数据库中获取一些数据。

但是第一种方式比较丑陋，因为你必须自己将数据转换成表格，所以我想在脚本末尾使用更简单的方法。

但是我收到了错误信息

java.sql.SQLException: No suitable driver found for jdbc:postgresql://10.222.22.222:5432/myDatabase

但它是与上述代码相同的 URL/相同的登录名/相同的 PW。为什么这不起作用？

也许有人对我有帮助的提示。

---- 更新:24.3。 12:15 ---

我不认为 JAR 的加载不起作用。我添加了一个额外的 val db = DriverManager.getConnection(url, username, pw); 用于测试。 (在异常内部失败的函数)这很好用。

另一个有趣的细节。如果我删除 %dep block 和类行，则会在第一个 block 中产生一个非常相似的错误。相同的错误信息；相同的函数+失败的行号，但函数堆栈有点不同。

我在这里找到了源代码:http://code.metager.de/source/xref/openjdk/jdk8/jdk/src/share/classes/java/sql/DriverManager.java

我的问题在第 689 行。所以如果所有参数都正常，可能它来自 isDriverAllowed() 检查？

最佳答案

我在 Zeppelin 中遇到了与依赖项相同的问题，我不得不将我的 jar 添加到 zeepelin-env.sh 中的 SPARK_SUBMIT_OPTIONS 以将它们包含在所有笔记本和段落中

因此，在 zeppelin-env.sh 中，您将 SPARK_SUBMIT_OPTIONS 修改为:

export SPARK_SUBMIT_OPTIONS="--jars/data/extraJarFiles/postgresql-9.4.1208.jar

然后你必须重启你的 zeppelin 实例。

关于java - Apache 飞艇/ Spark : Why can't I access a remote DB with this code sample，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36176620/

25

4

0

文章推荐： javascript - 如何用 jQuery 包装一些项目？

文章推荐： javascript - 从外部的 javascript 控制 Flash 播放器？

文章推荐： swift - 在 Alamofire 中上传带有深度参数的图像

ms-access - 使用安全工作组文件编写 Access Access 文件的脚本
我正在尝试编写 Access Access 数据库的脚本，以便在命令行上使用。 Access 数据库使用工作组文件进行保护。 Dim oApp, sWGF,myWS Set sApp = Create
ms-access - 如何 Access Access 中选定的行？
我有一个包含数据表的表格。我希望用户能够选择多行，单击按钮并运行一些 sql 查询并对这些行执行一些工作。查看我的 VBA 代码，我发现如何使用 CurrentRecord 属性 Access 最后
ms-access - 网络 Access 的 Access 数据库的最大连接数
如果我在某个网络位置有 Microsoft Access 2007 数据库，那么可以使用该数据库的客户端计算机的数量是否有限制？客户端不会安装 Access，而是使用 Access Runtime 2
ms-access - Access 时出现 MS ACCESS 错误
我正在开发一个注册系统。但我收到此错误:You tried to execute a query that does not include the specified expression.. 我正
ms-access - MS Access (JET) 是否适合多用户 Access ？
我有一个产品设计为使用 MS Access 文件作为数据库的桌面产品。现在，一些用户需要将它安装在几台 PC(比如说 2 或 3 台)上并共享数据库。我想将 MS Access 文件放在共享文件夹
ms-access - 如何解密或 Access protected Access 数据库？
我接手了一个旧的软件项目，该项目使用 MS Access 数据库来存储数据。但是数据库不会在 Access 中打开，如下所示: "You do not have the necessary permi
ms-access - 以编程方式将包含 Access 97 文件的文件夹更新为 Access 2003
我有一个文件夹，里面装满了 100 多个 Access97 文件。我需要将它们全部更新到 Access2003。我可以手动完成，但使用 VBA 可能会快很多。有没有人会有一个片段可以做到这一点？或
ms-access - 使用链接表 Access 连续表单 - 如何避免为表单中的每一行 Access 数据库服务器？
我正在通过 SQL Server 迁移助手 (SSMA) 将数据从 Access 数据库迁移到 SQL Server。 Access 应用程序将继续与转换为链接表的本地表一起使用。一个连续的表单在加
ms-access - 使用链接表 Access 连续表单 - 如何避免为表单中的每一行 Access 数据库服务器？
我正在通过 SQL Server 迁移助手 (SSMA) 将数据从 Access 数据库迁移到 SQL Server。 Access 应用程序将继续与转换为链接表的本地表一起使用。一个连续的表单在加
ms-access - 通过链接到 Access 数据库的 ODBC 数据源进行缓慢的数据 Access
我的公司用 Visual Basic 6 开发了一个应用程序。该应用程序通过 ODBC 数据源使用 Access 数据库。 Access 数据库是一个扩展名为“.mdb”的文件。在以下环境中运行应
ms-access - 使用 SetParent 使 Access 表单从 Access 中转义
我一直在尝试让 Microsoft Access 从主 Access 窗口中“退出”，以便我可以隐藏 Access 窗口并仅在桌面上显示表单，以便可以轻松地将其放置在其他应用程序旁边。起初我发现了一
ms-access - 从 Access 2000/2003 迁移到 Access 2010
我想在 access 2010 中使用 access 2000 和 2003 数据库。由于我不想检查一切是否手动工作，我正在寻找一种工具来分析 VBA 代码以查找使用 access 2010 发生的错
ms-access - 从 Access 打开 Excel 文件并将图片复制到 Access 表单
所以我有一个 Excel 工作簿，其中有一个很好的 shaperange 对象的全局 map 。通过一些非常简单的代码，我可以更改颜色、将国家/地区集合分组和取消分组为数组等......并且效果非常好
ms-access - Access 将支持 35-40 个用户写入 Access 数据库
我们希望有大约 35-40 人通过共享驱动器上的脚本写入 Access 数据库。这些指标分解为他们需要每小时写大约 3-7 次。 Access 会支持这一点而不会对我产生影响吗？是的，我很乐意将其用
ms-access - MS Access 使用 VBA 从 Access 文件中删除模块
我正在寻找一种使用 VBA 代码从外部数据库文件中删除 VBA 模块的方法。名为“myfile.accdb”的外部文件有一个名为“mod1”的模块，我希望能够在单独的项目中使用 VBA 代码删除该模块
ms-access - 尝试从子窗体 Access 孙窗体时出现 Microsoft Access 运行时错误 2455
我在 Access 2003 数据库(在 Access 2007 中开发)中有三个表单，它们处于父级 -> 子级 -> 孙子级关系中。在子窗体的 'Form_Load' 子窗体中，我设置了孙子窗体的一
ms-access - MS Access 2007 弹出式表单拒绝在设计模式下显示/无法 Access (但出现在表单列表中)
MS Access 2007 存在拒绝在设计模式下显示表单的问题。我可以看到表单的代码(如果我查看显示表单的按钮的事件属性)，但我看不到作为 GUI 布局的表单。而且，当我尝试从应用程序的主窗口调用此
ms-access - 在计算机上未安装 MS Access 的情况下使用 Excel 从 Access 中读取
我编写了代码，使用 Excel 中的下拉列表提供的标准将两个表连接起来，然后将数据返回到电子表格上的特定位置(工作表上已经有标题)。这在我的机器上和其他机器上使用 MS Access 的机器上都可以
ms-access - 如何以编程方式将 Access 1997 .mdb 转换为 Access 2007 .accdb
我正在开始构建一个应用程序，该应用程序从给定的根路径开始遍历文件夹结构，并将所有找到的 Access 1997 .mdb 文件转换为较新的 Access 2007/2010 .accdb 格式。但是，
ms-access - 微软 Access : passing parameters from one access form to another
我有一个表单和一个按钮。我想通过单击按钮打开另一个表单，并将参数从父表单传递到子表单(子表单的 RecordSource 有参数)。我该怎么做？最佳答案您可以通过引用表单的对象来引用调用表单的任何

首页

博学

6Ren·AI

商城

java - Apache 飞艇/ Spark : Why can't I access a remote DB with this code sample