gpt4 book ai didi

python - 将字符串列表转换为 Python 数据框 - pyspark python Sparksql

转载 作者:太空宇宙 更新时间:2023-11-03 14:55:51 27 4
gpt4 key购买 nike

我有以下 Python/Pyspark 代码:

sql_command = ''' query ''''
df = spark.sql(sql_command)
ls_colnames = df.schema.names
ls_colnames
['id', 'level1', 'level2', 'level3', 'specify_facts']

cSchema = StructType([
StructField("colname", StringType(), False)
])
df_colnames = spark.createDataFrame(dataset_array,schema=cSchema)

File "/opt/mapr/spark/spark-2.1.0/python/pyspark/sql/types.py", line 1366, in _verify_type raise TypeError("StructType can not accept object %r in type %s" % (obj, type(obj))) TypeError: StructType can not accept object 'id' in type class 'str'

如何获取 colname 的 Spark 对象?`

最佳答案

不确定我是否正确理解了您的问题。但是,如果您尝试根据给定列表创建数据框,则可以使用以下代码。

from pyspark.sql import Row
l = ['id', 'level1', 'level2', 'level3', 'specify_facts']
rdd1 = sc.parallelize(l)
row_rdd = rdd1.map(lambda x: Row(x))
sqlContext.createDataFrame(row_rdd,['col_name']).show()

希望有帮助。

问候,

尼拉吉

关于python - 将字符串列表转换为 Python 数据框 - pyspark python Sparksql,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45585828/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com