gpt4 book ai didi

python - Spark Data Frames - 检查列是否为整数类型

转载 作者:行者123 更新时间:2023-12-01 09:33:04 25 4
gpt4 key购买 nike

我试图找出 Spark 数据框中我的列是什么数据类型,并根据该推导操作该列。

这是我到目前为止所拥有的:

import pyspark
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('MyApp').getOrCreate()
df = spark.read.csv('Path To csv File',inferSchema=True,header=True)

for x in df.columns:
if type(x) == 'integer':
print(x+": inside if loop")

print(x+": inside ifloop") 语句似乎永远不会被执行,但我确信有几列是整数数据类型。我在这里缺少什么?

最佳答案

您正在迭代列的名称,因此 type(x) 永远不会等于“整数”(它始终是字符串)。

您需要使用pyspark.sql.DataFrame.dtypes

for x, t in df.dtypes:
if t=="int":
print("{col} is integer type".format(col=x))

使用 df.printSchema() 查看架构也很有用。

关于python - Spark Data Frames - 检查列是否为整数类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49784063/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com