作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这个问题说明了一切。我怎样才能做以下事情之一:
我有一个 NIFI 集群和一个自行编写的专用处理器,它通过 JDBC 将大量数据加载到数据库中(每秒高达 20Mio 行)。它使用一些特定于数据库供应商的调优技巧,在我的特定情况下非常快。其中一个技巧需要为每个连接加载一个独占的空表。
目前,我的处理器为 NIFI 集群中的每个节点打开一个连接(它需要一个来自 DBCPConnectionPool
的连接)。集群中有大约 90-100 个节点,我将获得 90-100 个连接 - 所有这些连接都同时批量加载数据。
我正在使用 NIFI 1.3.0.0
非常感谢任何帮助或评论。很抱歉没有显示任何代码。大约 700 行并没有真正帮助解决这个问题。但我计划将其放在 Git 上,并作为开源项目 Kylo 的一部分。
最佳答案
在 NiFi 中分解任务的一种常见方法是在主节点上将流文件拆分为多个文件。然后其他节点将拉取其中一个流文件并对其进行处理。
在您的情况下,每个文件都将包含一系列要从表中提取的值。假设您有一百行并且只需要 3 个节点来提取数据。因此,您将创建 3 个流文件,每个文件都具有单独的属性值:
然后节点将从远程进程组或队列(例如 JMS 或 SQS)中获取流文件。只有 3 个流文件,因此从连接加载数据的节点不超过 3 个。
关于java - NIFI : limit number of concurrent tasks of a NIFI processor in a NIFI-Cluster,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45842643/
我是一名优秀的程序员,十分优秀!