- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
PySpark 在什么条件/标准下以 dd-MMM-yy
格式转换日期(01-JAN-40) 至 1940-01-01 00:00:00.000
而不是 2040-01-01 00:00:00.000
?
from pyspark.sql import functions as psf
df.withColumn('my_date', psf.to_timestamp("my_date", "dd-MMM-yy"))
01-JAN-40 -> 1940-01-01 00:00:00.000
01-JAN-47 -> 1947-01-01 00:00:00.000
01-JAN-15 -> 2015-01-01 00:00:00.000
01-JAN-18 -> 2018-01-01 00:00:00.000
01-JAN-19 -> 2019-01-01 00:00:00.000
01-JAN-20 -> 2020-01-01 00:00:00.000
最佳答案
目前(Spark <= 2.4.4),spark 正在使用 java SimpleDateFormat
引擎盖下的类来解析字符串。来自 java 文档 here , 规定
For parsing with the abbreviated year pattern ("y" or "yy"), SimpleDateFormat must interpret the abbreviated year relative to some century. It does this by adjusting dates to be within 80 years before and 20 years after the time the SimpleDateFormat instance is created.
关于pyspark - to_timestamp 什么时候从 19xx 产生结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59365446/
我有两列,一列名为“日期”,另一列名为“时间”。日期是日期数据类型,“时间”是字符数据类型。我正在使用以下查询来选择一个新的组合时间戳列 SELECT to_timestamp(concat_
我正在尝试将字符串验证为来自多个 CSV 的时间戳,并且简单地将它们转换为 timestamptz 将失败,因为无法强制使用唯一的日期时间格式: select '10/31/2010'::timest
这是问题的复制: 我通过 JavaScript 获取现在的时间戳 var ts = +new Date // 1368971991090 console.log( new Date(136897199
PySpark 在什么条件/标准下以 dd-MMM-yy 格式转换日期(01-JAN-40) 至 1940-01-01 00:00:00.000而不是 2040-01-01 00:00:00.000
我正在尝试格式化我的时间戳列以包含毫秒但没有成功。我怎样才能把我的时间格式化成这样 - 2019-01-04 11:09:21.152 ? 我查看了文档并遵循了 SimpleDataTimeForma
package testOnly; import java.sql.Timestamp; import java.text.SimpleDateFormat; import java.util.Dat
我有以毫秒为单位的 utc epocha,我希望我的 sql 以特定日期格式返回结果日期。 这行得通 SELECT to_timestamp(timestamp / 1000) as date
我正在尝试获取当前的 UTC 时间,并将其插入到 PostgreSQL 时间戳中。但它不能正常工作。 我正在使用以下命令: INSERT INTO public.rt_block_height VAL
我在 Postgresql 中查找,我想删除查询中的 +9 UTC 值。 例如:在to_timestamp列中,我想去掉+09,只保留2016-02-26 00:23:44 值(value)。 这是我
我有一个格式如下所示的 Pandas Dataframe: Month Count 2021-02 100 2021-03 200 其中“月份”列是使用 dt
尽管使用了 TO_TIMESTAMP 函数,但我的查询(由应用程序触发时)仍无法执行并出现此错误。 INSERT INTO MY_TABLE_NAME ( UPDATED_DATE, CREA
我通过流式 API 下载了 Twitter 数据,并希望将数据导入 Postgres(9.3 版)以进行一些地理分析。 解析 json 数据有效,但我无法将 Twitter 时间设置为正确的时间戳。这
导入脚本写得有点错误,导致时间戳被插入了 1000 倍。然而,将 to_timestamp 与 extract() 一起使用会导致大约一个月的日期,即使中间数字和转换看起来是正确的。 1) selec
我有一个 pg 数据库,其中包含以下数据: (yyyymmdd) hour (hh) minute (mm) and second (ss) 全部在单独的字符串类型列中。 我使用这样的函数将其转换为时
我有原始文本列,其值类似于“2012-07-26T10:33:34”和“2012-07-26T10:56:16”。在使用 Joda-Time 的 Java 中,我可以通过调用 轻松地将其转换为日期/从
我正在尝试从 python 数据框中绘制时间序列。代码如下。 import requests from bs4 import BeautifulSoup import pandas as pd imp
我想在一行中使用逗号分隔的唯一 from_date。 所以我在 TO_TIMESTAMP() 中使用 distinct() 函数,但出现错误。 SELECT string_agg(TO_CHAR(TO
如何将格式为 2014-09 的 date 列转换为格式为 2014-09-01 00:00:00.000 ?之前的格式由df['date'] = pd.to_datetime(df['date'])
我在 oracle 中有一个插入查询 --- Insert into sample (name,time) values ('RJ-valley',to_timestamp('12-10-18 12:
我是一名优秀的程序员,十分优秀!