python - PySpark session 中缺少 java.util.HashMap-6ren

python - PySpark session 中缺少 java.util.HashMap

转载作者：太空狗更新时间：2023-10-30 02:43:58

24

4

我正在使用 Apache Spark Windows 7 x64 上的 1.4.0，IPython 3.2.0 中的 Java 1.8.0_45 x64 和 Python 2.7.10 x86

我正在尝试写一个 DataFrame IPython 笔记本中基于 - 的程序，该程序从 SQL Server 数据库读取和写回。

到目前为止我可以从数据库中读取数据

from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
df = sqlContext.load(source="jdbc",url="jdbc:sqlserver://serverURL", dbtable="dbName.tableName", driver="com.microsoft.sqlserver.jdbc.SQLServerDriver", user="userName", password="password")

并将数据转换为 Panda 并做任何我想做的事。 (这不仅仅是一个小麻烦，但是在将微软的sqljdbc42.jar添加到spark-defaults.conf中的spark.driver.extraClassPath之后就可以了)

当我使用 DataFrameWriter API 将数据写回 SQL Server 时，出现了当前问题。 :

df.write.jdbc("jdbc:sqlserver://serverURL", "dbName.SparkTestTable1", dict(driver="com.microsoft.sqlserver.jdbc.SQLServerDriver", user="userName", password="password"))

---------------------------------------------------------------------------
Py4JError                                 Traceback (most recent call last)
<ipython-input-19-8502a3e85b1e> in <module>()
----> 1 df.write.jdbc("jdbc:sqlserver://jdbc:sqlserver", "dbName.SparkTestTable1", dict(driver="com.microsoft.sqlserver.jdbc.SQLServerDriver", user="userName", password="password"))

C:\Users\User\Downloads\spark-1.4.0-bin-hadoop2.6\python\pyspark\sql\readwriter.pyc in jdbc(self, url, table, mode, properties)
    394         for k in properties:
    395             jprop.setProperty(k, properties[k])
--> 396         self._jwrite.mode(mode).jdbc(url, table, jprop)
    397 
    398 

C:\Python27\lib\site-packages\py4j\java_gateway.pyc in __call__(self, *args)
    536         answer = self.gateway_client.send_command(command)
    537         return_value = get_return_value(answer, self.gateway_client,
--> 538                 self.target_id, self.name)
    539 
    540         for temp_arg in temp_args:

C:\Python27\lib\site-packages\py4j\protocol.pyc in get_return_value(answer, gateway_client, target_id, name)
    302                 raise Py4JError(
    303                     'An error occurred while calling {0}{1}{2}. Trace:\n{3}\n'.
--> 304                     format(target_id, '.', name, value))
    305         else:
    306             raise Py4JError(

Py4JError: An error occurred while calling o49.mode. Trace:
py4j.Py4JException: Method mode([class java.util.HashMap]) does not exist
    at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:333)
    at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:342)
    at py4j.Gateway.invoke(Gateway.java:252)
    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:133)
    at py4j.commands.CallCommand.execute(CallCommand.java:79)
    at py4j.GatewayConnection.run(GatewayConnection.java:207)
    at java.lang.Thread.run(Unknown Source)

问题似乎是 py4j 在将我的 connectionProperties 字典转换为 JVM 对象时找不到 Java java.util.HashMap 类。将我的 rt.jar(带路径)添加到 spark.driver.extraClassPath 并不能解决问题。从写入命令中删除字典可避免此错误，但当然写入失败是由于缺少驱动程序和身份验证。

编辑:错误的 o49.mode 部分会随着运行而变化。

最佳答案

Davies Liu 在 Spark 用户邮件列表中 found the problem . Scala 之间存在细微差别和 Python我错过的 API。您必须传入一个模式字符串(例如“overwrite”)作为 Python API 中的第三个参数，但 Scala API 则不行。如下更改语句可解决此问题:

df.write.jdbc("jdbc:sqlserver://serverURL", "dbName.SparkTestTable1", "overwrite", dict(driver="com.microsoft.sqlserver.jdbc.SQLServerDriver", user="userName", password="password"))

关于python - PySpark session 中缺少 java.util.HashMap，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31417653/

24

4

0

文章推荐： Python Tkinter 网格复选框

文章推荐： Python Selenium Chrome 禁用提示 "Trying to download multiple files"

hashmap - 以忽略 HashMap 值的通用方式公开 HashMap
我有不同的结构，它们都包含一个 HashMap与 String作为键，但具有不同的值类型。例如，一个结构有一个类型为 HashMap 的成员, 另一个将有一个 HashMap 类型的成员, 等等。我
JAVA HashMap 2D，无法获得制作 2D HashMap 的正确方法，我的意思是将 HashMap 转换为另一个 HashMap
我想制作一个包含学生姓名和科目的板，每个学生在每个科目中都有一个成绩(或者没有..他可以离开考试而不写，然后他的案子将是空的)。我只想使用 HashMap。我的意思是，它会是这样的: HashMap>
hashmap - 八叉树的动态 HashMap
是否有内存和速度高效的方法来在 HashMap 中动态存储唯一键:值对？ key 保证是唯一的，但它们的数量经常变化。插入和删除必须很快。我所做的是包含有符号距离场的八叉树(非线性/完整)。八叉树经
hashmap - 为什么 LinkedList 作为 HashMap 的存储桶实现而不是另一个 Hashmap？
有谁知道为什么选择通过 LinkedList 而不是另一个 Hashmap 来实现 HashMap 的存储桶。如果桶本身变成了 HashMap，那么 contains 或 get 的时间复杂度似乎是
hashmap - 无法将字符串以外的值添加到嵌套 HashMap
我想创建一个具有嵌套结构的 HashMap，就像这个复杂的示例: { type: boy name: Phineas father: type: man
hashmap - 库中的全局可变 HashMap
这个问题在这里已经有了答案: How do I create a global, mutable singleton? (7 个答案) 关闭 7 年前。我想要一个可扩展的字典，将 Object 与
java - 如何使用其他 HashMap 的对象在 HashMap 中定义 HashMap
HashMap> hm = new HashMap>(); hm.put("Title1","Key1"); for(int i=0;i hm1 = new H
java - 无法将 HashMap 类型转换为 HashMap 本身且内部包含 HashMap 对象的对象
我必须修改当前代码以适应 Spring MVC。我有 HashMap hashmap = new HashMap(); request.setAttribute("dslrErrors", hashm
java - 检查数组的长度并检查 HashMap 键是否在 HashMap 中(Java、Arrays、HashMap)
我正在尝试进行一些错误捕获。错误应该检查数组的长度是否小于 2，并检查 HashMap 是否包含用户输入的键。捕获的错误必须仅使用 if 语句，并且必须使用 .length() 方法，并且必须使用
java - 奇怪的 HashMap 异常(HashMap$Node 无法转换为 HashMap$TreeNode)
在 stackoverflow 上提出另一个问题后，(Java- Why this program not throwing concurrent Modification exception)我开始
java - 如何使用 DozerBeanMapper 将具有对象数组列表的 HashMap(列表是 HashMap 中的值)映射到另一个 HashMap？
我有两个类，想使用 org.dozer.Mapper( http://dozer.sourceforge.net/ ) 将 Female 对象的属性映射到 Male 对象。第一类是: public
hashmap - 面试问题:什么是 HashMap ？
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
hashmap - Kotlin HashMap 使用数组包含键
是否有任何方法可以检查 HashMap 是否包含一组特定的键(这些键是在数组中给出的)。当我尝试类似下面的代码时，它返回 false。 map.containsKey(arrayOf("2018-01
Java， HashMap 中的 HashMap
跟进我的问题:How To Access hash maps key when the key is an object 我想尝试这样的事情:webSearchHash.put(xfile.getPa
java - HashMap 内的 HashMap ？
我有一个可扩展的 ListView ，对于每个 child ，我需要有 4 个“额外”或字符串或其他名称来调用它:- 子标题- 描述- 链接1- 链接2 跟着教程，创建 ListView 、不同的 p
java - HashMap 内部的 HashMap
我想确保这是正确的，因为如果不正确，它可能会破坏我的应用程序。我有这个: private static HashMap> balance = new HashMap<>(); 如果我得到这样的值:
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st

首页

博学

6Ren·AI

商城

python - PySpark session 中缺少 java.util.HashMap