gpt4 book ai didi

java - Spark : How RDD. map/mapToPair 使用 Java

转载 作者:塔克拉玛干 更新时间:2023-11-01 22:22:20 24 4
gpt4 key购买 nike

我有一些 cw 对(整数 i,字符串字),在文本文件中有 iword 出现的次数。

我只想为每一对添加一个新的对 c1 (Integer i, 1) 和 1 个固定数字。

这看起来真的很琐碎,但我一直不明白 map/mapToPair 函数实际上是如何工作的。

JavaPairRDD<Integer, Integer> c1 = cw.map(??? -> new Tuple2<Integer, Integer>(??, 1));

我正在使用 Java-8 工作。

最佳答案

如果我没理解错的话,你有下面的 JavaPairRDD。

JavaPairRDD<Integer, String> cw = ...;

现在你想在 JavaPairRDD 下面创建第二个值为 1 的地方。

JavaPairRDD<Integer, Integer> c1;

为了得到这个,首先你必须从 cw JavaPairRDD 中提取 JavaRDD,为此你必须调用 map 函数,如下所示。我们将从对中提取第一个值。

JavaRDD<Integer> cw1 = cw.map(tuple -> tuple._1());

现在您将使用 mapToPair 函数从 JavaRDD 创建新的 JavaPairRDD,如下所示。

JavaPairRDD<Integer, Integer> c1 = cw1.mapToPair(i -> new Tuple2<Integer, Integer>(i, 1));

在一行中你可以这样写

JavaPairRDD<Integer, Integer> c1 = cw.map(tuple -> tuple._1()).mapToPair(i -> new Tuple2<Integer, Integer>(i, 1));

关于java - Spark : How RDD. map/mapToPair 使用 Java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41058998/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com