gpt4 book ai didi

apache-spark - VectorUDT 用法

转载 作者:行者123 更新时间:2023-12-03 09:26:49 25 4
gpt4 key购买 nike

我必须获取数据类型并进行大小写匹配并将其转换为某种所需的格式。但是 org.apache.spark.ml.linalg.VectorUDT 的用法表明 VectorUDTprivate。此外,我特别需要使用 org.apache.spark.ml.linalg.VectorUDT 而不是 org.apache.spark.mllib.linalg.VectorUDT。有人可以建议如何解决这个问题吗?

最佳答案

对于 org.apache.spark.ml.linalg 类型,您应该使用 org.apache.spark.ml.linalg.SQLDataTypes 指定架构 which provide singleton instances of the private UDT types :

  • MatrixType对于矩阵 (org.apache.spark.ml.linalg.Matrix)。

    scala> org.apache.spark.ml.linalg.SQLDataTypes.MatrixType.getClass
    res0: Class[_ <: org.apache.spark.sql.types.DataType] = class org.apache.spark.ml.linalg.MatrixUDT
  • VectorType对于向量 (org.apache.spark.ml.linalg.Vector)。

    scala> org.apache.spark.ml.linalg.SQLDataTypes.VectorType.getClass
    res1: Class[_ <: org.apache.spark.sql.types.DataType] = class org.apache.spark.ml.linalg.VectorUDT

关于apache-spark - VectorUDT 用法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45868854/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com