gpt4 book ai didi

dataframe - 如何在 pyspark - dataframe 中将月份名称更改为其他语言

转载 作者:行者123 更新时间:2023-12-05 02:42:51 25 4
gpt4 key购买 nike

我正在尝试使用以下配置在 Databricks 上为“日期”创建一个表:

# Get date range
dateFrom = dbutils.widgets.get("date_from")
dateTo = dbutils.widgets.get("date_to")

dateDF_TESTE = spark.sql("SELECT sequence(to_date('{0}'), to_date('{1}'), interval 1 day) AS date".format(dateFrom, dateTo))\
.select(F.explode("date").alias('DSC_DATE'))'''

但是,当我添加包含这些数据的列时,我只会获得英文信息,例如月份名称或星期几。

我打算将此信息更改为另一种语言(葡萄牙语),但没有成功。我尝试使用区域设置,但它不起作用。

import locale
# use user's default settings
locale.setlocale(locale.LC_ALL, 'pt_PT.utf8')

最佳答案

从 Spark 3.0 开始可以使用 to_csv()在一个列上。 to_csv 接受与标准 csv 编写器相同的参数,因此可以在此处设置语言环境:

from pyspark.sql import functions as F

dateDF_TESTE.withColumn("formatted_date",
F.to_csv(F.struct(F.col("DSC_DATE")),
{"dateFormat": "EEEE, d 'de' MMMM 'de' yyyy", "locale": "pt", "quote":""}))\
.show(truncate=False, n=5)

打印

+----------+------------------------------------+
|DSC_DATE |formatted_date |
+----------+------------------------------------+
|2020-01-01|Quarta-feira, 1 de Janeiro de 2020|
|2020-01-02|Quinta-feira, 2 de Janeiro de 2020|
|2020-01-03|Sexta-feira, 3 de Janeiro de 2020 |
|2020-01-04|Sábado, 4 de Janeiro de 2020 |
|2020-01-05|Domingo, 5 de Janeiro de 2020 |
+----------+------------------------------------+
only showing top 5 rows

关于dataframe - 如何在 pyspark - dataframe 中将月份名称更改为其他语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67234092/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com