gpt4 book ai didi

sql - 如何为 Spark SQL DataFrame 映射构造 ClassTag?

转载 作者:行者123 更新时间:2023-12-04 18:05:34 26 4
gpt4 key购买 nike

Spark SQL 1.2.0 查询返回 JavaRDD。 Spark SQL 1.3.0 查询返回 DataFrame。通过 DataFrame.toJavaRDD 将 DataFrame 转换为 JavaRDD 似乎需要相当多的时间。我尝试使用 DataFrame.map() 并遇到一个令人费解的问题:

DataFrame df = sqlSC.sql(sql);
RDD<String> rdd = df.map(new AbstractFunction1<Row, String> (){

@Override
public String apply(Row t1) {
return t1.getString(0);
}


}, ?);

“?”应该是 scala.reflect.ClassTag。我使用了 ClassManifestFactory.fromClass(String.class) 但它没有用。我应该把什么放在“?”。

顺便说一下, http://spark.apache.org/docs/1.3.0/sql-programming-guide.html 给出的例子的 与 RDD 互操作 部分 Java 代码未更正:它使用了“map(new Function() {”。那里的“Function”是 Not Acceptable 。它应该是“Function1”。

最佳答案

尝试这个:

RDD<String> rdd = df.map(new AbstractFunction1<Row, String> (){

@Override
public String apply(Row t1) {
return t1.getString(0);
}


}, scala.reflect.ClassManifestFactory.fromClass(String.class));

关于sql - 如何为 Spark SQL DataFrame 映射构造 ClassTag?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29068864/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com