gpt4 book ai didi

python - 将 HDF5 (.h5) 转换为 spark 数据帧

转载 作者:太空宇宙 更新时间:2023-11-04 05:22:50 25 4
gpt4 key购买 nike

我刚刚开始学习 spark(更准确地说是 pyspark)。

如何将 HDF5 文件转换为 spark 数据帧?

可以 dask help on that or dask dataframes 与 spark dataframes 有什么不同?

最佳答案

读取 pandas 中的 Dataframe。然后你可以将 pandas dataframe 转换为 spark Dataframe。我就是这样做的。此代码将帮助您:

import pandas as pd

store = pd.HDFStore('/mypath')
wav = store.select('mykey')
spark_df = sqlContext.createDataFrame(wav, mySchema) //mySchema is optional
spark_df.take(1)

希望对您有所帮助!

关于python - 将 HDF5 (.h5) 转换为 spark 数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39774426/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com