gpt4 book ai didi

java - 如何从字符串列表数据集创建字符串数据集 Spark Java

转载 作者:行者123 更新时间:2023-12-01 22:06:05 26 4
gpt4 key购买 nike

我有一个字符串列表数据集,我需要从上面创建一个新的数据集,将列表的每个条目作为新数据集中的一行。

List<String> list = new ArrayList("abc", "def", "ghi");

Dataset<String> input = spark.createDataset(list,Encoders.bean(String.class));

新数据集如下:

"abc
def
ghi"

最佳答案

您可以使用 flatmap 将字符串列表转换为单个字符串。//flatMap 每行到行中的单词

JavaRDD<String> words = input.toJavaRDD().flatMap(s -> Arrays.asList(s.split(",")).iterator());

关于java - 如何从字符串列表数据集创建字符串数据集 Spark Java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58687246/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com