python - 在 Spark 数据帧转置期间。列名称未转换为行标题-6ren

python - 在 Spark 数据帧转置期间。列名称未转换为行标题

转载作者：太空宇宙更新时间：2023-11-03 15:22:01

25

4

我有 Dataframe，将“tbl”命名为，

summary col1    col2    col3        col200
count   20000   20000   20000       20000
mean    3.02    789.83  8379.02     20.03
std dev 1.02    2.03    0.8         0.56

我使用下面的代码进行了转置，

header = [i[0] for i in tbl.select("summary").rdd.map(tuple).collect()]
tt = tbl.select([c for c in tbl.columns if c not in ["summary"]])
rtt = tt.rdd.map(tuple)
rtt1 = rtt.zipWithIndex().flatMap(lambda (x,i): [(i,j,e) for (j,e) in enumerate(x)])
rtt2 = rtt1.map(lambda(i,j,e):(j,(i,e))).groupByKey().sortByKey()
rtt3 = rtt2.map(lambda (i,x):sorted(list(x), cmp=lambda(i1,e1),(i2,e2) : cmp(i1,i2)))

rtt4 = rtt3.map(lambda x: map(lambda (i,y):y, x))

问题:

在转置时，我能够生成诸如以下的列:

count   Mean    Std dev
20000   3.02    1.02
20000   789.83  2.03

但是此转换缺少列标题名称来标识转置针对哪个变量。我有“3 X 42000”维度的数据框，并且所有列都是唯一的，正在寻找方法来确定如何在转置时将列标题添加为行标题。

最佳答案

使用 Pandas 怎么样:

df = sc.parallelize([(-1.0, 2.0, -3.0), (4.4, 5.1, -6.4)]).toDF()

pdf = df.describe().toPandas()
pdf.T[1:].rename(columns=pdf.T.iloc[0])

   count                mean              stddev   min   max
_1     2  1.7000000000000002   3.818376618407357  -1.0   4.4
_2     2                3.55   2.192031021678297   2.0   5.1
_3     2                -4.7  2.4041630560342617  -6.4  -3.0

这并不像您需要 Spark 来处理 120,000 个值......

关于python - 在 Spark 数据帧转置期间。列名称未转换为行标题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43451818/

25

4

0

文章推荐： c# - WPF 将控件的 zindex 绑定(bind)到属性不起作用

文章推荐： c# - 使用 Moq 实现不接受任何参数并返回 void 的方法

文章推荐： c# - IIS 随机错误请求 - 主机名

文章推荐： python - python 递归函数不停地转

WPF 转 XPS 转 PDF
我已经在标准 WPF 控件中实现了一个报告，并且还实现了一个 DocumentPaginator获取这些控件并将它们转换为用于打印的文档。我还实现了一些使用文档分页器将页面呈现为图像并使用 PDFS
javascript - 字符串转 UTF8 转 SHA256 转 BASE64
在 C# 中，我有以下代码: public static string GetHashCode(string p) { var a = new SHA256Managed();
javascript - mySQLi 转 Json 转 Js 文件
您好，我正在尝试在编码后将我的 mysqli 数据库输出到一个 js 文件，我用 json_encode 对其进行编码没有任何问题，但是如何将其放入 js 文件中(每次更新时更新) mysqli数据已
javascript - 从 JS 转 HTML 转 PHP
我需要将 select 从 JS 传递到 HTML。 select 应该包含来自 PHP 的 option。所以，首先我有一个 HTML div，我将在其中添加来自 JS 的内容。
javascript - SVG 转 PNG 转 AJAX API 帖子
我有一个相当大且复杂的 SVG 代码，它根据页面信息使用 JavaScript 和 jQuery 动态生成。然后我有一个 AJAX 帖子保存。我无法将其转换为正确发布图像数据？ var canva
objective-c - NSDate 转 GMTDate 转 JSON 格式
我想将我的本地日期 ([NSDate date]) 转换为 GMT 以创建一个 JSON 字符串 (/Date(1324435876019-0000)/)。当我将时钟设置为 EST 时区时，我的代码
数据库设计技巧[转]
1. 原始单据与实体之间的关系　　可以是一对1、一对多、多对多的关系。在一般情况下，它们是一对一的关系：即一张原始单据对应且只对应一个实体。在特殊情况下，它们可能是一对多或多对一的关系，即一张原
服务器五大相关基础知识【转】
CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章服务器五大相关基础知识【转】由作者收集整理，如果你对这篇文章有兴趣，记得
GmailMessage 转 PDF
Google Apps 脚本 - Gmail 是否会实现 GmailMessage (GmailThread) .getAsPdf() 方法？预期输出与 Gmail 中可用的打印为 PDF 的输出相同
一个函数解决SQLServer中bigint 转 int带符号时报错问题
有一个需求是要在一个云监控的状态值中存储多个状态（包括可同时存在的各种异常、警告状态）使用了位运算机制在一个int型中存储。现在监控日志数据量非常大（亿级别）需要对数据按每小时、每天进行聚合，供
1张图看懂RAID功能，6张图教会配置服务器【转】
CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界. 这篇CFSDN的博客文章1张图看懂RAID功能，6张图教会配置服务器【转】由作者收集整理，如果你
FFMpeg rtsp 转 m3u8
我正在使用 FFMPeg(版本 ffmpeg-20170330-ad7aff0-win64-static)将 RTSP 转换为 .m3u8。命令是: ffmpeg -rtsp_transport t
treeview - Jtree 转 JPanel
我有一个 JTree使用 DefaultTreeModel 的对象作为模型，我添加/删除与该模型相关的节点。此时，我需要在图形界面中显示树结构，例如 JPanel .如何映射 DefaultTree
iphone - NSString 转 NSArray
我当前正在接收一个文件并将其存储到 NSString 中。然后，我从字符串中创建一个数组并将其呈现在 TableView 中。这在一定程度上有效。我目前收到的数据如下: 公司名称|帐户代码\r\n公司
cocoa - NSImage 转 Base64
我需要创建 NSImage cocoa 对象的 base64 字符串表示形式。处理这个问题的最佳方法是什么，苹果文档似乎在这个主题上有点短(或者我只是找不到它)。 Base64 编码从外面看起来相当复
Javascript 转 ISOString 格式
JS 中的 .toISOString() 函数给我这样的字符串: 2015-06-14T20:00:00:000Z 我需要它是这样的: 2015-06-14T20:00:00Z JS 中是否有其他函数
javascript - COLORREF 转 RGB
我正在尝试使用 JavaScript 转换 COLORREF: COLORREF : When specifying an explicit RGB color, the COLORREF value
JavaFX TextField 转 Int
我在这里遇到了这个代码的问题，只是想制作一个小计算器: 打包申请； import javafx.event.ActionEvent; import javafx.scene.control.TextF
sshfs EBCDIC 转 ASCII
我想要做的是能够通过本地PC上的USS通过sshfs挂载主机上的一些文件。我可以做到这一点，但 sshfs 不能直接完成从 EBCDIC 到 ascii/unicode 的转换。有没有我可以设置的标志
Python Visio 转 pdf
我正在尝试在 python 中将一堆 Visio 文件转换为 pdf。我已经引用了这个.doc to pdf using python并编写了以下代码: import comtypes.client

首页

博学

6Ren·AI

商城

python - 在 Spark 数据帧转置期间。列名称未转换为行标题