gpt4 book ai didi

apache-spark - 如何将spark sql数据框的摘要写入excel文件

转载 作者:行者123 更新时间:2023-12-04 05:22:29 25 4
gpt4 key购买 nike

我有一个非常大的数据框,有 8000 列和 50000 行。我想把它的统计信息写入excel文件。我想我们可以使用 describe() 方法。但是如何以良好的格式编写它以使其脱颖而出。谢谢

最佳答案

describe 的返回类型是一个 pyspark 数据帧。将 describe 数据框转换为 excel 可读格式的最简单方法是将其转换为 pandas 数据框,然后将 pandas 数据框写为 csv 文件,如下所示

import pandas
df.describe().toPandas().to_csv('fileOutput.csv')

如果你想要excel格式的,可​​以试试下面

import pandas
df.describe().toPandas().to_excel('fileOutput.xls', sheet_name = 'Sheet1', index = False)

注意,以上需要安装xlwt包(命令行pip install xlwt)

关于apache-spark - 如何将spark sql数据框的摘要写入excel文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43548012/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com