java - 如何将 client_protocol 传递给 R 中的 JDBC 驱动程序？-6ren

java - 如何将 client_protocol 传递给 R 中的 JDBC 驱动程序？

转载作者：行者123 更新时间：2023-12-03 23:13:25

26

4

我正在尝试使用 dplyr.spark.hive 包与 HiveServer2 连接，但出现无法将用户名传递给dbConnect 函数，这可能是我收到有关 NULL client_protocol 错误的原因。

有谁知道如何解决这个问题或如何将 user/username 传递给 dbConnect 函数，其中驱动程序是 JDBC?

这个beeline 请求对我来说没问题

beeline  -u "jdbc:hive2://host:port/dbname;auth=noSasl" -n mkosinski --outputformat=tsv --incremental=true -f sql_statement.sql > sql_output

但是这个 R 等价物不:

> library(dplyr.spark.hive)
Warning: changing locked binding for ‘over’ in ‘dplyr’ whilst loading ‘dplyr.spark.hive’
Warning: changing locked binding for ‘partial_eval’ in ‘dplyr’ whilst loading ‘dplyr.spark.hive’
Warning: changing locked binding for ‘default_op’ in ‘dplyr’ whilst loading ‘dplyr.spark.hive’

Attaching package: ‘dplyr.spark.hive’

The following object is masked from ‘package:SparkR’:

    cache

Warning messages:
1: replacing previous import by ‘purrr::%>%’ when loading ‘dplyr.spark.hive’ 
2: replacing previous import by ‘purrr::order_by’ when loading ‘dplyr.spark.hive’ 
> Sys.setenv(HADOOP_JAR = "/opt/spark-1.5.0-bin-hadoop2.4/lib/spark-assembly-1.5.0-hadoop2.4.0.jar")
> Sys.setenv(HIVE_SERVER2_THRIFT_BIND_HOST = 'tools-1.hadoop.srv')
> Sys.setenv(HIVE_SERVER2_THRIFT_PORT = '10000')
> host = 'tools-1.hadoop.srv'
> port = 10000
> driverclass = "org.apache.hive.jdbc.HiveDriver"
> Sys.setenv(HADOOP_JAR = "/opt/spark-1.5.0-bin-hadoop2.4/lib/spark-assembly-1.5.0-hadoop2.4.0.jar")
> library(RJDBC)
> dr = JDBC(driverclass, Sys.getenv("HADOOP_JAR"))
> #url = paste0("jdbc:hive2://", host, ":", port)
> url = paste0("jdbc:hive2://", host, ":", port,"/loghost;auth=noSasl")
> class = "Hive"
> con.class = paste0(class, "Connection") # class = "Hive"
> con = new(con.class, dbConnect(dr, url, username = "mkosinski", database = "loghost"))
log4j:WARN No appenders could be found for logger (org.apache.hive.jdbc.Utils).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1],  : 
  java.sql.SQLException: Could not establish connection to jdbc:hive2://tools-1.hadoop.srv:10000/loghost;auth=noSasl: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=loghost})
> con = new(con.class, dbConnect(dr, url, username = "mkosinski"))
Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1],  : 
  java.sql.SQLException: Could not establish connection to jdbc:hive2://tools-1.hadoop.srv:10000/loghost;auth=noSasl: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=loghost})

编辑 1

我尝试使用不同的 .jar 进行连接(如评论中所建议)，看起来之前的问题已解决(我可能使用了错误的 .jar ) 但现在我收到一条错误消息，告诉我连接未配置:

> Sys.setenv(HADOOP_HOME="/usr/share/hadoop/share/hadoop/common/")
> Sys.setenv(HIVE_HOME = '/opt/hive/lib/')
> host = 'tools-1.hadoop.srv'
> port = 10000
> driverclass = "org.apache.hive.jdbc.HiveDriver"
> library(RJDBC)
Loading required package: DBI
Loading required package: rJava
> dr = JDBC(driverclass,classPath = c("/opt/hive/lib/hive-jdbc-1.0.0-standalone.jar"))
> dr2 = JDBC(driverclass,classPath = c("/opt/hive/lib/hive-jdbc-1.0.0-standalone.jar",
+                                      "/opt/hive/lib/commons-configuration-1.6.jar"))
> url = paste0("jdbc:hive2://", host, ":", port)
> dbConnect(dr, url, username = "mkosinski", database = "loghost") -> cont
log4j:WARN No appenders could be found for logger (org.apache.hive.jdbc.Utils).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1],  : 
  java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration
> dbConnect(dr2, url, username = "mkosinski", database = "loghost") -> cont
Error in .jcall(drv@jdrv, "Ljava/sql/Connection;", "connect", as.character(url)[1],  : 
  java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration
> sessionInfo()
R version 3.1.3 (2015-03-09)
Platform: x86_64-redhat-linux-gnu (64-bit)
Running under: CentOS Linux 7 (Core)

locale:
 [1] LC_CTYPE=en_US.UTF-8          LC_NUMERIC=C                  LC_TIME=en_US.UTF-8           LC_COLLATE=en_US.UTF-8       
 [5] LC_MONETARY=en_US.UTF-8       LC_MESSAGES=en_US.UTF-8       LC_PAPER=en_US.UTF-8          LC_NAME=en_US.UTF-8          
 [9] LC_ADDRESS=en_US.UTF-8        LC_TELEPHONE=en_US.UTF-8      LC_MEASUREMENT=en_US.UTF-8    LC_IDENTIFICATION=en_US.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] RJDBC_0.2-5 rJava_0.9-7 DBI_0.3.1  

loaded via a namespace (and not attached):
[1] tools_3.1.3

最佳答案

问题是错误的 .jar 规范(JDBC 中的 classPath arg)和错误的 hiveServer2 url

解释在这里https://stackoverflow.com/a/34792408/3857701

关于java - 如何将 client_protocol 传递给 R 中的 JDBC 驱动程序？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34547322/

26

4

0

文章推荐： GitLab CI/CD 未设置变量在 CI/CD 设置中设置

文章推荐： python - "name ' word_tokenize ' is not defined"in python 字数频率

文章推荐： java - 升级到 Netbeans 8.0.1 和 Glassfish 4,1 后包不存在

jdbc - 新的 Databricks JDBC 驱动程序版本无法识别 JDBC URL
我一直在使用 Databricks JDBC 驱动程序版本 2.6.22，并尝试升级到 2.6.27。但是，升级后我收到消息说我的 JDBC URL 在尝试连接时无效。这些 JDBC URL 与旧版本
jdbc - JDBC 上的事件或空闲连接
似乎JDBC Spec没有详细说明数据源连接池中alive or idle connections的准确含义。它只是具体实现吗？ DBCP2如何或 HikariCP实际检查连接状态？下面没有事件事务
jdbc - JDBC 连接文件可以包含计算属性吗？
在“XPages 扩展库”一书中，第 12 章，第 409 页有一个 JDBC 连接文件的例子: org.apache.derby.jdbc.EmbeddedDriver jdbc:
jdbc - jdbc 是如何工作的
谁能告诉我 jdbc 是如何工作的？它如何设法与 DBMS 通信？因为 DBMS 可能是用其他编程语言编写的。最佳答案与数据库的通信由 JDBC 驱动程序处理，这些驱动程序可以使用各种策略与数据库
Spring JDBC 无法加载 JDBC 驱动程序类 [oracle.jdbc.driver.OracleDriver]
我想知道是否有人可以帮助我解决这个问题。我在尝试使用 Spring JDBC 编写代码时遇到了一个问题。当我运行服务器时，我收到了标题中提到的消息。我google了一下，有人说你应该导入ojdbc.j
jdbc - 配置单元 jdbc 连接发出内存不足错误
我只是想运行一个示例 hivejdbc 客户端程序，但它给我一个内存不足的错误。 import java.sql.SQLException; import java.sql.Connection; i
jdbc - 谷歌电子表格 jdbc 连接器
我需要将 Google Spreadsheet 与 JasperReports Server 一起使用，为此我需要一个用于 Google Spreadsheet 的 JDBC 连接器。我找到了这个
jdbc - DB2 JDBC 事务大小有限制吗？
我需要将大量行(最多 100,000 行)插入到 6 个不同的 DB2 表中。我正在使用 Java JDBC 来完成它。我想在单个数据库事务中完成所有操作，以便在遇到任何问题时可以回滚整个操作。在某处
jdbc - jmeter jdbc 变量名查询
再次为自己是 Jmeter 新手道歉——我对 JDBC 请求有点困惑——我在过去的 3 个小时里浏览了这个网站上的帖子——但我找不到任何相关的东西(除非我我错过了一些东西)。我的环境:Jmeter
jdbc - 使用动态 JDBC 用户名和密码的最佳方式是什么？
我们正在创建一个带有 MySQL 后端的 XPages 应用程序。应用程序将被多个客户使用。每个都有自己的 NSF 数据库和相应的 MySQL 数据库。每个客户都有自己的 MySQL 用户名。我们正在
jdbc - 处理来自同一供应商的多个 JDBC 驱动程序
昨天我遇到了一个大问题。在我当前的项目中，我使用 Oracle 的 JDBC 的 ojdbc6 实现进行连接，但我还需要处理例如 oracle 8 数据库，这对于这个 JAR 是完全不可能的。你会说
jdbc - 是否需要关闭从 jdbc 连接池获取的连接？
这个问题在这里已经有了答案: Closing JDBC Connections in Pool (3 个答案) 关闭 2 年前。假设我有以下代码 DataSource source = (Data
jdbc - Informix JDBC 时间戳字符串格式
我有 Informix 数据库，时间戳字段定义为 YEAR TO SECOND。当我使用 JDBC rs.getString(column) 显示此字段时，它使用带毫秒的格式，因此此字段如下所示:
jdbc - Logstash-JDBC-MYSQL配置错误
看完本教程之后; https://www.youtube.com/watch?v=ZnI_rlrei1s 我正在尝试使用logstash和jdbc获取我的本地主机mysql(使用laravel val
jdbc - Elasticsearch JDBC River未索引数组
有人给我小费。 { "type": "jdbc", "jdbc": { "driver": "com.microsoft.sqlserver.jdbc.SQLServerDriver"
jdbc - Cassandra jdbc 是否仍得到积极支持？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
jdbc - Elasticsearch JDBC River吞噬了整个内存
我正在尝试从mysql表中将1600万个文档(47gb)索引为elasticsearch索引。我正在使用jparante's elasticsearch jdbc river执行此操作。但是，在创建河
jdbc - ElasticSearch JDBC River创建重复项
我正在尝试使用JDBC河将我的MySQL数据库复制到我的ElasticSearch索引中。但是，每当我启动服务器时，与MySQL表的count(*)相比，创建的文档数量就增加了一倍。我通过清空索引并
jdbc - Logstash jdbc 连接器基于时间的数据
使用新的logstash jdbc 连接器: https://www.elastic.co/guide/en/logstash/current/plugins-inputs-jdbc.html后续的
jdbc - 有没有成熟的命令行 JDBC 客户端？
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便

首页

博学

6Ren·AI

商城

java - 如何将 client_protocol 传递给 R 中的 JDBC 驱动程序？