apache-spark - Spark 数据帧 : explode list column-6ren

apache-spark - Spark 数据帧 : explode list column

转载作者：行者123 更新时间：2023-12-01 10:21:25

26

4

我有一个来自 Spark Aggregator 的输出，它是 List[Character]

case class Character(name: String, secondName: String, faculty: String)
val charColumn = HPAggregator.toColumn
val resultDF = someDF.select(charColumn)

所以我的数据框看起来像:

+-----------------------------------------------+
|               value                           |
+-----------------------------------------------+
|[[harry, potter, gryffindor],[ron, weasley ... |
+-----------------------------------------------+

现在我想把它转换成

+----------------------------------+
| name  | second_name | faculty    |
+----------------------------------+
| harry | potter      | gryffindor |
| ron   | weasley     | gryffindor |

我怎样才能正确地做到这一点？

最佳答案

这可以使用 Explode 和 Split Dataframe 函数来完成。

下面是一个例子:

>>> df = spark.createDataFrame([[[['a','b','c'], ['d','e','f'], ['g','h','i']]]],["col1"])
>>> df.show(20, False)
+---------------------------------------------------------------------+
|col1                                                                 |
+---------------------------------------------------------------------+
|[WrappedArray(a, b, c), WrappedArray(d, e, f), WrappedArray(g, h, i)]|
+---------------------------------------------------------------------+

>>> from pyspark.sql.functions import explode
>>> out_df = df.withColumn("col2", explode(df.col1)).drop('col1')
>>>
>>> out_df .show()
+---------+
|     col2|
+---------+
|[a, b, c]|
|[d, e, f]|
|[g, h, i]|
+---------+

>>> out_df.select(out_df.col2[0].alias('c1'), out_df.col2[1].alias('c2'), out_df.col2[2].alias('c3')).show()
+---+---+---+
| c1| c2| c3|
+---+---+---+
|  a|  b|  c|
|  d|  e|  f|
|  g|  h|  i|
+---+---+---+

>>>

关于apache-spark - Spark 数据帧 : explode list column，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51609740/

26

4

0

文章推荐： Kubernetes RBAC - 禁止尝试授予额外权限

文章推荐： java - 在 .Properties 文件中搜索日语字符串消息

文章推荐： json - 使用 Powershell invoke-restmethod 和 json 响应

Java webapp 部署 : explode or not to explode?
一个很简单的问题。我有一个要在 JBoss 上运行的 .war(~40MB) 文件。部署的最佳实践是什么:war 文件应该以分解格式部署吗？还是不行？我问是因为如果它爆炸了，那么我可以选择随时更新我
jQuery Explode 在 explode 时更改字体，我该如何停止？
转到 http://hartford.uconn.edu/scholarships/单击任何名称，然后单击“关闭”按钮，这将显示在“展开”时字体从默认的“Trebuchet MS/Trebuchet”
arrays - Hive JSON数据 explode 选项不 explode 数组
我正在将Json数据插入Hive。这是格式- A1 Array > dim2 array >
java explode a line/string 像 php explode
我正在制作一个可以在本地服务器上运行的 java 程序。服务器使用 PHP 从客户端接收请求。现在我在本地服务器上有文件“temp.txt”。 Java 程序应该逐行打开文件，每行都应该用
iOS 应用程序因 "function signature specialization "而崩溃
Crashlytics 报告了多次崩溃并显示以下消息: function signature specialization 这个异常首先意味着什么？这是我的代码，在闭包内的“return resu
PHP在整数和字母之间 explode
array ( [0] => 3 / 4 Bananas [1] => 1 / 7 Apples [2] => 3 / 3 Kiwis ) 可以说，遍历此列表，并
php解析错误 explode
我正在优化我的网站。在本地测试了页面，一切正常。当我上传它并实时访问它时，它会突然抛出一个解析错误……但它在本地完美运行，就像我说的那样。 Parse error: syntax error, un
php中的多个分隔符 explode
这个问题在这里已经有了答案: How to split a string by multiple delimiters in PHP? (4 个回答) 关闭 8 个月前。我有一个问题，我有一个字符串
php - explode 后在PHP上获取剩余的拆分字符串
我希望能够在 explode 后得到剩余的字符串。 $string = "First Middle Last"; $d = explode(" ", $string); print_r($d); Ou
php: explode 字符串
我正在尝试从字符串中获取一个简单的数组。 Ej。 [位置] => ???? [标题] => ??? [音调] => ??? [缩放] => ??? 但由于某种原因，我收到以下错误: Notice: U
php在两个分隔符之间 explode 并且分隔符没有丢失
如何在分隔符“[”之间分解字符串，但我希望分隔符不会丢失例如，我有这样的字符串 $str = "i want to show you my youtube channel : [youtube id
PHP explode() 函数问题
请帮我解决这个 explode() 函数问题。对于第三种情况，我得到了意想不到的结果，解释是什么？编辑: $page_string 值实际上来自数据库。这次我使用 var_dump 而不是 echo
php - Explode 正在删除字符串中的最后一个字符
我正在制作一个电子商务网站。我在测试时遇到了以下问题: 从管理面板更新订单状态(处理中、发货、已完成和已取消)不适用于 1 种产品。当从数据库中检索值时，Explode 会删除最后一个字符。如果订
PHP explode 正在删除第一个数组值
好吧，首先，如果之前有人问过这个问题，我很抱歉，我在过去的 12 个小时里筛选了数百个论坛主题，但还没有找到能准确回答这个问题的主题，所以这里开始吧。我有一个我构建的页面，它有一个用户列表，当用户登
Mysql explode 函数
我有一个表，其中有一个包含以下记录的字段: 1,2,3,4,5,6 我想请教以下两件事: 1)如何在另一个表中创建外键？规则是:对于字段“field_name”中以逗号分隔的任何值，必须是 other
php - explode 然后插入表
我只是对如何分解字符串以单独插入数据库感到困惑。我的代码: $mymotives = "Entrega de Documentos, Orientacion, Username y Password
javascript - explode 不能与破折号一起正常工作
我们有这个字符串:“Il Responsabile della Sicurezza nelle gallerie – 1° PARTE”，我们想要得到它的两个部分: Il Responsabile d
sql - "Explode"SQL函数返回的表成列
我有一个函数 symbol_scan(integer) 返回一个包含三列的表:schema, table, count。我可以像这样对其执行选择查询: > SELECT name, symbol_s
javascript - explode 函数在文本区域中返回单行
嗨，实际上，当我执行代码时，我得到一个输出，它将被吐出在 echo 语句中，但如果我将 echo 放入文本区域，我只能从数据库中获取字符串的最后一个值 $sql = mysqli_query(
PHP explode 检测用户名
我正在尝试构建一个 PHP 代码来检测类似 Twitter 的提及，但我不是链接到 @username，而是定位用户的 ID 并引用它。 function get_user_id_from_usern

首页

博学

6Ren·AI

商城

apache-spark - Spark 数据帧 : explode list column