gpt4 book ai didi

java - 如何将 Dataset 转换为 JavaPairRDD?

转载 作者:搜寻专家 更新时间:2023-10-31 08:31:46 25 4
gpt4 key购买 nike

有一些方法可以将 Dataset 转换为 JavaRDD 。

Dataset<Row> dataFrame;
JavaRDD<String> data = dataFrame.toJavaRDD();

是否有任何其他方法可以将 Dataset 转换为 javaPairRDD<Long, Vector>

最佳答案

您可以像下面这样使用 PairFunction。请检查数据集中元素的索引。在下面的示例中,索引 0 具有长值,索引 3 具有 vector 。

JavaPairRDD<Long, Vector> jpRDD = dataFrame.toJavaRDD().mapToPair(new PairFunction<Row, Long, Vector>() {
public Tuple2<Long, Vector> call(Row row) throws Exception {
return new Tuple2<Long, Vector>((Long) row.get(0), (Vector) row.get(3));
}
});

关于java - 如何将 Dataset 转换为 JavaPairRDD?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43731721/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com