作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
按照此处所述使用 iforest
:https://github.com/titicaca/spark-iforest但是 model.save() 抛出异常:
Exception:scala.NotImplementedError: The default jsonEncode only supports string, vector and matrix. org.apache.spark.ml.param.Param must override jsonEncode for java.lang.Double.
遵循上述 git 页面上“Python API”部分提到的代码片段。
from pyspark.ml.feature import VectorAssembler
import os
import tempfile
from pyspark_iforest.ml.iforest import *
col_1:integer
col_2:integer
col_3:integer
assembler = VectorAssembler(inputCols=in_cols, outputCol="features")
featurized = assembler.transform(df)
iforest = IForest(contamination=0.5, maxDepth=2)
model=iforest.fit(df)
model.save("model_path")
model.save()
应该能够保存模型文件。
下面是执行 model.transform(df)
后得到的输出数据帧:
col_1:integer
col_2:integer
col_3:integer
features:udt
anomalyScore:double
prediction:double
最佳答案
我刚刚解决了这个问题。这是由错误的参数类型引起的。您可以在master分支查看最新的代码,然后再尝试一下。
关于machine-learning - 无法使用 pyspark 保存 pyspark iforest 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56791931/
按照此处所述使用 iforest:https://github.com/titicaca/spark-iforest但是 model.save() 抛出异常: Exception:scala.NotI
我是一名优秀的程序员,十分优秀!