python - PySpark ML Pipeline.load 结果抛出 java.lang.UnsupportedOperationException : empty collection-6ren

python - PySpark ML Pipeline.load 结果抛出 java.lang.UnsupportedOperationException : empty collection

转载作者：行者123 更新时间：2023-12-05 07:36:52

27

4

我有一个适合 PySpark 的管道，我正在将其保存到磁盘以备后用。

这是我的管道代码:

model  = Pipeline(stages=[segment_indexer, model_name_indexer, make_name_indexer, engine_type_indexer, segment_encoder, model_name_incoder, make_name_incoder, engine_type_incoder, x_assembler, estimator]).fit(trainingData)
model.save('file:/opt/app/fitted-model' )

这会将模型保存到磁盘。

我正在尝试像这样加载模型

model2 = pyspark.ml.pipeline.PipelineModel.load("file:/tmp/mymodels/fitted-model")

抛出

Traceback (most recent call last):

File "<stdin>", line 1, in <module>
  File "/usr/lib/spark/python/pyspark/ml/util.py", line 257, in load
    return cls.read().load(path)
  File "/usr/lib/spark/python/pyspark/ml/util.py", line 197, in load
    java_obj = self._jread.load(path)
  File "/usr/lib/spark/python/lib/py4j-0.10.4-src.zip/py4j/java_gateway.py", line 1133, in __call__
  File "/usr/lib/spark/python/pyspark/sql/utils.py", line 63, in deco
    return f(*a, **kw)
  File "/usr/lib/spark/python/lib/py4j-0.10.4-src.zip/py4j/protocol.py", line 319, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling o2760.load.
: java.lang.UnsupportedOperationException: empty collection
    at org.apache.spark.rdd.RDD$$anonfun$first$1.apply(RDD.scala:1370)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:112)
    at org.apache.spark.rdd.RDD.withScope(RDD.scala:362)
    at org.apache.spark.rdd.RDD.first(RDD.scala:1367)
    at org.apache.spark.ml.util.DefaultParamsReader$.loadMetadata(ReadWrite.scala:382)
    at org.apache.spark.ml.Pipeline$SharedReadWrite$.load(Pipeline.scala:266)
    at org.apache.spark.ml.PipelineModel$PipelineModelReader.load(Pipeline.scala:347)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
    at py4j.Gateway.invoke(Gateway.java:280)
    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
    at py4j.commands.CallCommand.execute(CallCommand.java:79)
    at py4j.GatewayConnection.run(GatewayConnection.java:214)
    at java.lang.Thread.run(Thread.java:748)

我做错了什么？

`

最佳答案

我必须执行 pipeline.transform 以便管道在保存之前实际对数据帧应用转换。这样做之后，加载模型会带回模型实例，然后我们可以在数据帧上再次应用 transform 。

关于python - PySpark ML Pipeline.load 结果抛出 java.lang.UnsupportedOperationException : empty collection，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48917438/

27

4

0

文章推荐： typescript - Redux 操作类型的字符串与常量

文章推荐： regex - 正则表达式 - 最多包含 1 个子字符串

文章推荐： Nginx 在初始安装后不显示欢迎页面

文章推荐： R ggplot2直方图覆盖每个直方图的归一化值

java - 无法清除数据或将数据添加到列表 - UnsupportedOperationException
我一直在开发搜索功能，该功能使我能够在 RecyclerView 中搜索数据。当我单击搜索图标时，我的应用程序崩溃了。经过一些调试后，我发现了问题，似乎无法清除信息或将信息添加到新列表。 Adapte
java - UnsupportedOperationException getUserPrincipal
我已经创建了一个 ContainerRequestfilter 并成功触发了它。现在我想访问我之前在 grizzly HttpServerProbe 中设置的 UserPrincipal，如下所示:
java - 如何在获取百分比符号时避免 UnsupportedOperationException？
我试图获取特定于区域设置的百分比符号。我的崩溃日志在尝试从 DecimalFormatSymbols 获取百分比时显示“UnsupportedOperationException”。我使用给定区域设
java - 尝试从另一个列表中删除项目列表时出现 UnsupportedOperationException
我在下面编写了代码，我不知道出了什么问题，但 validDatesIterator.remove() 给了我 UnsupportedOperationException 异常。使用java 1.6 L
android - 无法修改ListView中的ArrayAdapter : UnsupportedOperationException
我正在尝试制作一个包含名称的列表。该列表应该是可修改的(添加、删除、排序等)。但是，每当我尝试更改 ArrayAdapter 中的项目时，程序都会崩溃，并出现 java.lang.Unsupporte
java - 遍历目录并获取 UnsupportedOperationException
所以，我目前正在编写一个方法来迭代目录以及该目录内的所有目录: public static Set iterateDirectory(String dir){ Set children = n
java - 线程挂起() UnsupportedOperationException
我正在开发一个滑雪追踪器应用程序，但我在第一个任务上失败了:)秒表这是我的服务: public class TrackerService extends Service { private
java - UnsupportedOperationException 尝试设置二维列表的值
当运行以下代码时，我遇到一个异常，它简单地说:线程“LWJGL Application”中出现异常 java.lang.UnsupportedOperationException // Declare
java - 删除时出现 UnsupportedOperationException
这个问题已经有答案了: remove() on List created by Arrays.asList() throws UnsupportedOperationException (3 个回答)
java - 连接两个字符串数组会抛出 UnsupportedOperationException
String[] aArr = ...; String[] bArr = ...; List images = Arrays.asList(aArr); images.addA
android - 请求新权限时不断收到 UnsupportedOperationException
我是 facebook sdk 的新手，所以我不太确定为什么会收到此错误。我已将其缩小到此部分: List permissions = session.getPermissions()
java - 集合抛出 UnsupportedOperationException
调用 add() 时出现 UnsupportedOperationException在以下代码中: Collection myClass = method(); MyClass newObject =
java - 合并包含集合的映射会抛出 UnsupportedOperationException
代码如下: private static Map> merge(Map> m1, Map> m2) { Map> mx = new HashMap>(); for (Entry> en
java - 为什么在尝试从列表中删除元素时会收到 UnsupportedOperationException？
我有这个代码: public static String SelectRandomFromTemplate(String template,int count) { String[] split
java - 抛出 UnsupportedOperationException
所以其中一个方法的描述如下: public BasicLinkedList addToFront(T data) This operation is invalid for a sorted list
mongodb - 访问对象列表上的唯一闭包会给出 UnsupportedOperationException
我正在使用 Grails 2.3.11 并使用 MongoDb 插件 mongodb:3.0.3。我的代码是这样的: def home() { List abcs = ABC.list()
java - 带有自定义布局的 UnsupportedOperationException
我正在尝试创建一个自定义 ListView 来保存自定义对象的 View ，在这种情况下，自定义对象将是 Data 类的实例 Java 代码如下: import android.app.ListAct
java - 了解 UnsupportedOperationException
我不太明白在哪里可以抛出这个异常。例如，我正在实现 Future接口(interface)并且不希望任何人调用该方法: Future#get(long, TimeUnit) . 那么，我可以直接扔掉
java - 列表抛出 UnsupportedOperationException
我有下面的示例代码: String[] patternArray = {"1","2","3"}; List patternCheck = Arrays.asList(patternArray); p
java - 集合上的 UnsupportedOperationException
在研究 Collection API 时，我们发现某些方法(add、remove、...)可能会抛出 java.lang.UnsupportedOperationException 如果 Collec

首页

博学

6Ren·AI

商城

python - PySpark ML Pipeline.load 结果抛出 java.lang.UnsupportedOperationException : empty collection