gpt4 book ai didi

apache-spark - 如何将 cassandraRow 转换为 Row(apache spark)?

转载 作者:行者123 更新时间:2023-12-04 04:54:13 24 4
gpt4 key购买 nike

我正在尝试从 RDD[cassandraRow] 创建一个 Dataframe .. 但我不能因为 createDataframe( RDD[Row] ,schema: StructType) 需要 RDD[Row] 而不是 RDD[cassandraRow]。

  • 我怎样才能做到这一点?

  • 并且根据这个问题的答案
    How to convert rdd object to dataframe in spark

    (答案之一)在 RDD[Row] 上使用 toDF() 从 RDD 获取数据帧的建议对我不起作用。我尝试在另一个示例中使用 RDD[Row] (尝试使用 toDF() )。
  • 我也不知道我们如何使用 RDD ( RDD[Row] ) 的实例调用 Dataframe ( toDF() ) 的方法?

  • 我正在使用 Scala。
    enter image description here

    最佳答案

    如果你真的需要这个,你总是可以将你的数据映射到 Spark 行:

    sqlContext.createDataFrame(
    rdd.map(r => org.apache.spark.sql.Row.fromSeq(r.columnValues)),
    schema
    )

    但如果你想要 DataFrames最好直接导入数据:
    val df = sqlContext
    .read
    .format("org.apache.spark.sql.cassandra")
    .options(Map( "table" -> table, "keyspace" -> keyspace))
    .load()

    关于apache-spark - 如何将 cassandraRow 转换为 Row(apache spark)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35123539/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com