- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 Spring Batch 的新手,正在浏览 Spring Batch 并阅读 multipartItemReder ,我猜 multipartItemReader 不适合我的项目。请通过您的想法和公会给出几点意见。
我有超过 5000 万个 xml 文件,如下所示的目录结构。
GOOD
0
001/en/1.xml
001/jp/1.xml
002/en/2.xml
003/en/3.xml
004/jp/4.xml
....
....
999/jp/1.xml
1000
001/en/1.xml
001/jp/1.xml
002/en/2.xml
003/en/3.xml
004/jp/4.xml
....
....
999/jp/1.xml
2000
3000
...
.. no limit
REMAKE/
0
001/en/1.xml
001/jp/1.xml
002/en/2.xml
003/en/3.xml
004/jp/4.xml
....
....
999/jp/1.xml
PROCLAIMED/
...
...
....
like 100 directories ..
每个源(GOOD、REMAKE、PROCLAIMED ...等)都有不同的 xml 文件格式。1.我需要为每个源创建项目处理器。2.每个源将是一个线程或提交事务=1或线程跨度基于SOURCE////.xml内的lang文件的数量,什么是更好的选项。3.我还是觉得ItemReader的实现比较复杂。这里每个 xml 文件只有一条记录。请分享您的评论。
谢谢
最佳答案
对于这种情况,最好的做法可能是使用 partitioning ;我还没有尝试过,所以我帮不上什么忙,但我认为当您要管理相同类型的数据时分区很有帮助,而不是在数据混合的情况下。
现在我的 2 美分...
我会去parallel steps
split/flow
将每个源作为单独的线程进行管理commit-interval
等于1;您可以使用较大的值(或者如果您想要细粒度的提交,则可以使用自定义的CompletionPolicy
)来提高性能MultiResourceItemReader
委托(delegate)给特定于每种来源的 StaxEventItemReader
<job id="job1">
<split id="split1" task-executor="taskExecutor" next="lastStep">
<flow>
<step id="GOOD" />
</flow>
<flow>
<step id="REMAKE" />
</flow>
<flow>
<step id="PROCLAIMED" />
</flow>
</split>
<step id="GOOD">
<tasklet>
<batch commit-interval="100">
// Set MultiResourceItemReader and delegate to specialized StaxEventItemReader for GOOD file structure
// Set specialized processor for GOOD object
// Set writer (IDK which type)
</batch>
</step>
</job>
关于java - spring在多个子目录中批处理多个源,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21990261/
有没有办法为我的一些文件创建一个子目录?这纯粹是为了文件组织。我有大量的小结构/方法,我想将它们放入它们自己的文件和子目录中,但我不想将它们放入它们自己的包中。他们依赖于我项目中的其他功能。每一个都在
我想将目录中的文件和文件夹复制到另一个文件夹中,但不包含包含该文件的子文件夹,例如,对于node_modules目录,我有大量文件,例如100Mb和50K +个文件,不需要复制。 我试过这样使用xco
嘿,我想安装一个论坛(xenforo),我已经得到了所有的 .php 文件,我把文件夹放在/usr/share/nginx/html 页面在哪里(主页 index.html),但是当我做 127.0.
我想在我的 Symfony2 应用程序的子目录中隔离一些 Controller 。 像这样的东西: route: resource: "@MyBundle/Controller/Admin/"
我们有一个由离岸外包开发公司开发的旧应用程序,它仍在使用 Azure 存储客户端 1.7。 因此,我会在此版本停止工作之前对其进行更新。 有一个单元测试我无法通过。 [TestMethod()
我已将 WordPress 安装在子目录中: /public_html/blog/ 我希望能够像这样访问博客: http://example.com/blog 以及类似这样的帖子: http://ex
我正在尝试制作一个程序来将特定文件夹中的文件以及主文件夹的子文件夹中的文件备份到另一个备份文件夹。 这是我试图实现目标的代码的一部分,但是我只备份了主文件夹中的文件,而子文件夹正在被完全复制(其中的所
我无法在 NSTemporaryDirectory 子文件夹中存储任何文件 rootDirectoryName 是 GUIDsubDirectoryName 也是一个 GUID self.rootFo
我最近正在制作一些 Java 软件来查找文件夹中的一些文件/目录,如果它们的名称包含某些文本,它们将被重命名为其他名称。我使用 Files.walkFileTree 遍历目录,如果找到一个匹配的文件/
我一直在互联网深处搜索,试图让 HAProxy 正常运行,但我不确定它能否完成我想要的。 我试着按照这个:https://www.haproxy.com/blog/howto-write-apache
我正在尝试查找其中包含最多文件的目录。我知道我可以使用以下方法找到文件数: find -maxdepth 5 -type f | wc -l 但这只有在我知道要检查哪个目录时才有用。我想找到包含最多文
我正在尝试按如下方式组织我的项目目录 外壳 |inc/[头文件] |obj/[目标文件] |src/[源文件] |生成文件 |可执行 根文件夹中的所有内容都可以正常编译,但我在修改我的 makefil
当我在谷歌上搜索 yahoo、godaddy 等时,它们会显示子目录,如附图所示。但是当我在谷歌上找到我的网站时,它并没有显示那种东西。问题是什么? 最佳答案 有机 SERP 部分的 Google 附
我有一个名为“myproject”的项目,它由 git 进行版本控制。它有一个名为“data”的子目录,该目录已被 gitignored。 我可以为数据目录“git init”并将其作为单独的 git
我有一个目录位置,如何创建所有目录?例如C:\Match\Upload 将同时创建 Match 和子目录 Upload(如果不存在)。 使用 C# 3.0 谢谢 最佳答案 Directory.Crea
如何在 C++ 中删除包含所有文件/子目录的文件夹(递归删除)? 最佳答案 说真的: system("rm -rf /path/to/directory") 也许更多您正在寻找的东西,但特定于 uni
在我正在处理的当前项目中,有人决定将二进制文件作为源树的一部分 checkin 。二进制文件位于源代码下方的目录中: project/src # Here is the loc
我最近知道了 meteor 私有(private)子目录。根据文档:“私有(private)子目录是服务器代码可以访问但不提供给客户端的任何文件的位置,例如私有(private)数据文件。”一般来说,
我的存储库中有多个项目(子目录)。所有项目都只有一个名为main.cpp的可执行文件,并且它们都使用common语句中的#include文件夹中的库。文件夹结构如下所示: root | ├────co
如何在 C# 中搜索这样的路径: "C:\MyApp\*\日志" 我想获取与该搜索模式匹配的所有目录。 示例结果: C:\MyApp\20171009\日志 C:\MyApp\20171008\日志
我是一名优秀的程序员,十分优秀!