gpt4 book ai didi

apache-spark - 更改PySpark数据框中的列的数据类型

转载 作者:行者123 更新时间:2023-12-04 05:09:11 25 4
gpt4 key购买 nike

我有一个输入数据框( ip_df ),此数据框中的数据如下所示:

id            col_value
1 10
2 11
3 12

id和col_value的数据类型为 字符串

我需要获得另一个数据框( output_df ),其id的数据类型为字符串,而col_value列的数据类型为十进制**(15,4)**。这不是数据转换,只是数据类型转换。
我可以通过PySpark使用它吗?任何帮助将不胜感激

最佳答案

尝试使用cast方法:

from pyspark.sql.types import DecimalType
<your code>
output_df = ip_df.withColumn("col_value",ip_df["col_value"].cast(DecimalType()))

关于apache-spark - 更改PySpark数据框中的列的数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45453294/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com