gpt4 book ai didi

Python + Pandas + Spark - 如何将数据框导入 Pandas 数据框并将其转换为字典?

转载 作者:太空宇宙 更新时间:2023-11-04 10:21:27 25 4
gpt4 key购买 nike

如何将数据框导入 Pandas 数据框并将其转换为字典?

我从 Spark 创建了这个数据框,

sc = SparkContext(appName="PythonSQL")
sqlContext = SQLContext(sc)

path = os.path.join(os.environ['SPARK_HOME'], "examples/src/main/resources/people.json")

# Create the DataFrame
df = sqlContext.read.json(path)

# Register this DataFrame as a table.
df.registerTempTable("people")

# SQL statements can be run by using the sql methods provided by sqlContext
teenagers = sqlContext.sql("SELECT name FROM people")

sc.stop()

当我尝试将其导入 Pandas 时,

teenagers = pd.DataFrame(teenagers, columns=['name'])

我收到这个错误,

[client 127.0.0.1:50885] PandasError: DataFrame constructor not properly called!

毕竟我只是想把dataframe转换成字典,

dict = teenagers.set_index('name').to_dict()
print dict

有什么想法吗?

最佳答案

Spark DataFrame 可以通过 toPandas 转换为 pandas DataFrame方法。

关于Python + Pandas + Spark - 如何将数据框导入 Pandas 数据框并将其转换为字典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32042302/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com