gpt4 book ai didi

regex - 正则表达式在spark.read.json中

转载 作者:行者123 更新时间:2023-12-02 19:54:20 24 4
gpt4 key购买 nike

我想从hadoop目录中读取当前时间前一小时有时间戳的所有json文件。
文件名就像test_2020021418553333

import java.util.Calendar;

import java.text.SimpleDateFormat;

val form = new SimpleDateFormat("yyyyMMddhh");

val c = Calendar.getInstance();

c.add(Calendar.HOUR, -1);

val path ="/Test_"+form.format(c.getTime())+"*";

val test_df = spark.read.json(path)


当我运行此代码时:路径不存在错误即将到来。
谁能建议如何读取文件名称,例如Test_20200214 {Digit的任何可能组合}?

最佳答案

快速测试表明您有几分钟的时间
form.format(c.getTime())
res2: String = 2020021401
因此,删除最新的2辆车

问候

关于regex - 正则表达式在spark.read.json中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60226837/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com