- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 NiFi 数据流中,如果我想根据特定字段的值将单个流文件分成两组,就性能而言,按以下方式使用 QueryRecord 或 PartitionRecord 是否更快?
查询记录:
SELECT * FROM FLOWFILE WHERE WEIGHT < 1000;
分区记录
UpdateRecord
在 RecordPath 模式下填充新的“字符串”字段 greater_or_less
值为/weight
UpdateRecord
在文字值模式下更新greater_or_less
至${field.value:toNumber():lt(1000)}
PartitionRecord
在 greater_or_less
上对流文件进行分区在 PartitionRecord 方法中,我将有两个模式,一个是原始数据格式,另一个具有 greater_or_less
除了原始数据格式之外的字段。我们将从原始模式中的步骤 1 开始,在新模式中从步骤 1 输出,然后在原始模式中输出步骤 3。步骤 3 的输出应该是两个流文件,其中一个相当于 QueryRecord 方法的输出。
总而言之,虽然 QueryRecord
实现起来比较简单,我对NiFi的后端机制没有任何了解,也不了解这些处理器的开销如何比较,所以我不确定哪种方法是最佳的。我的直觉告诉我 QueryRecord
很昂贵,但我不确定它与 PartitionRecord
的类型切换和记录读写相比如何。方法。
最佳答案
我不知道哪个更快,但两者都在 Apache Calcite 上运行,速度非常快。
您是否考虑过使用GenerateFlowfile来生成测试数据并尝试一下?
我希望 PartitionRecord 是最好的,但使用 filter with a predicate而不是使用 UpdateRecord 在架构中生成新字段。
关于java - QueryRecord 与 PartitionRecord 以获得更好的性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51977615/
在 NiFi 数据流中,如果我想根据特定字段的值将单个流文件分成两组,就性能而言,按以下方式使用 QueryRecord 或 PartitionRecord 是否更快? 查询记录: SELECT *
我有以下流程: QueryDatabaseTable ->QueryRecord -> UpdateAttribute->MergeContent->PutelasticsearchHttp 想法是从
我正在尝试在我的 model 函数内进行 queryRecord 搜索,但似乎遇到了错误: 类型错误:无法将未定义或 null 转换为对象 我的 model() 如下所示: model() { r
我是一名优秀的程序员,十分优秀!