gpt4 book ai didi

java - 在定义的时间间隔内运行 Spring 作业

转载 作者:行者123 更新时间:2023-11-30 04:24:42 25 4
gpt4 key购买 nike

我有一个包含表文档的数据库。该表定义了我将处理的文档的路径。
文件的处理量非常大,单个文件可能需要几分钟的时间。
我有超过 200 000 个文件需要处理。
这些文档托管在生产中的应用程序中。所以我必须每晚处理它们。
我的问题是:是否可以定义一个 spring-batch 作业,从数据库查询文档(未处理)并处理它们,然后安排该作业(使用 Quartz)在上午 8 点停止,然后在晚上 8 点重新启动一天?

编辑
我想我应该更清楚地表达自己:
我的问题是:我是否应该有一份工作来处理所有文档并使其每天停止并在一天结束时重新启动。或者我应该让工作每次只处理一份文档?

到目前为止,我只使用一项作业来迭代所有文档(因为我是 Spring Batch 文档),我找到的所有示例都在谈论读取整个表(使用阅读器)并处理数据。
如果这是好方法,那么我如何中断作业执行以在一天结束时继续执行。
或者我应该只使用一份文档的工作?

最佳答案

是的,这是可能的。

这个 cron 表达式类似于:

0 0/1 20-8 ? * MON-FRI

只需确认这一点(自从我查看 cron 表达式以来已经有一段时间了),但这应该在周一至周五 20:00 到 08:00 之间每分钟运行一次。

默认情况下,Quartz 作业不会在 Spring 中同时运行(请参阅: http://static.springsource.org/spring/docs/3.0.x/reference/scheduling.html ),因此您不必担心重叠。然后,您可以在每次运行中选择要处理的定义数量的文档(例如 10 个),如果前一个运行已完成,Quartz 会在上午 8 点之前的每分钟启动另一次运行。当最后一个处理作业在早上完成时,直到下午 5 点才会再次启动。

请注意,最后一个作业可能会在 7:59:59 开始,并持续到上午 8 点之后,因此您可能需要提前一点结束时间来进行补偿。

编辑:

我认为更细粒度的方法(不一定是单个文档,但可能是一个 block )更适合批处理和调度。这有效地使用quartz来执行您将在单个作业中执行的循环,但为您提供了不必担心调度元素的所有好处!

关于java - 在定义的时间间隔内运行 Spring 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16235199/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com