gpt4 book ai didi

java - 使用 Spark(Spark 特定 API)从文件夹访问最新更改的文件

转载 作者:行者123 更新时间:2023-12-02 12:35:52 25 4
gpt4 key购买 nike

我尝试使用 Spark 的 sc.textfile('/home/sathya/location/*.txt') 访问示例位置中最新添加的文件但是,我需要获取最新添加的文件,而不是获取目录下的所有文件。

谢谢,萨蒂亚拉詹 M

最佳答案

可以从目录中获取最新修改的文​​件,并将其传递给sc.textFile()以在spark中读取。

以下是获取最新修改文件的方法

val directory = new File("/home/sathya/location/")
val allFiles = directory.listFiles
.filter(_.isFile)
.sortBy(-_.lastModified())
.toList

val latestFile = allFiles(0)

这里的latestFile是最新修改的文​​件,现在您可以将最新文件读入spark中

sc.textFile(latestFile)

希望这有帮助!

关于java - 使用 Spark(Spark 特定 API)从文件夹访问最新更改的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45151502/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com