gpt4 book ai didi

python - 派斯帕克。如何像那样创建 df.shema?

转载 作者:太空宇宙 更新时间:2023-11-04 02:09:23 26 4
gpt4 key购买 nike

我正在尝试创建这样的模式:

root
|-- _ehid: string (nullable = true)
|-- duration: double (nullable = true)
|-- list: array (nullable = true)
| |-- element: array (containsNull = true)
| | |-- element: string (containsNull = true)
|-- request.id: string (nullable = true)

但我只能创建那个:

root
|-- _ehid: string (nullable = true)
|-- duration: double (nullable = true)
|-- list: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- element: string (nullable = true)
|-- request.id: string (nullable = true)

我看到元素的结构类型而不是数组。当我尝试通过 df.show(10) 查看我的 df 时,我只看到空值。

我的脚本:

schema = StructType([
StructField("_ehid", StringType(), True),
StructField("duration", DoubleType(), True),
StructField("list", ArrayType(StructType([
StructField("element", StringType())
])), True),
StructField("request.id", StringType(), True)])

最佳答案

直接使用StringType即可:

schema = StructType([
StructField("_ehid", StringType(), True),
StructField("duration", DoubleType(), True),
StructField("list", ArrayType(ArrayType(StringType())), True),
StructField("request.id", StringType(), True)])

关于python - 派斯帕克。如何像那样创建 df.shema?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53959188/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com