apache-flink - 如何处理 Apache Flink 中很少更新的大型查找表-6ren

apache-flink - 如何处理 Apache Flink 中很少更新的大型查找表

转载作者：行者123 更新时间：2023-12-04 20:35:07

25

4

处理数据的模式是我有一个记录流，其中包含一些信息 A。这些记录由某个 ID 分片。这个信息A依赖于当前记录、之前计算的结果和一个大的查找表。查找表不会经常更改并且更改很小。我知道我可以使用 mapWithState/flatMapWithState 进行有状态计算。但是，我应该如何处理查找表？惯用的方法是也将其作为状态处理(如 A)，但查找表的大小可能对性能/内存来说是可怕的(例如，当快照时)

我目前正在考虑使其成为受读/写锁保护的共享资源。有没有更好的方法来处理这种模式？

最佳答案

正如您提到的，现在唯一可能的方法是使用状态。我们正在研究另一种方法。以下是我们的一些想法:https://docs.google.com/document/d/1hIgxi2Zchww_5fWUHLoYiXwSBXjv-M5eOv-MKQYN3m4/edit?usp=sharing

关于apache-flink - 如何处理 Apache Flink 中很少更新的大型查找表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37448847/

25

4

0

文章推荐： abap - 作为 FM 参数的函数方法调用的语法？

文章推荐： rxjs - 在满足条件之前忽略流中的事件？

文章推荐： metrics - 每日活跃用户 (DAU) 的定义

文章推荐： elixir - 在 Elixir 中附加到文件的最佳方法是什么

windows - 如何在子进程中启动崩溃(很少)的应用程序
我有 python 应用程序，它需要每天执行大约 20 000 次专有应用程序(不时崩溃)。问题是当应用程序崩溃时，Windows 会自动触发 WerFault这将使程序挂起，因此 python's
php - 很少，我的数据库中的某些列中没有插入任何值。 PHP MySQL HTML
我弄清楚这里的问题是什么。很少(50 个数据中有 3 个)插入到数据库中的数据不完整，如下所示: 用于插入的 PHP 代码是正确的。数据库中没有值的所有值都来自 SELECT 标记 HTML(year
android - android 中的回收器 View 中的 header 很少
我有一个包含对象的列表，其中包含以下字段:完整、不完整、继续。我想根据这三个部分对我的列表进行排序。首先，我想添加 header: INCOMPLETE 和所有元素(如果此字段为真)。之后我想添加标题
Python 错误 - 我随机(很少)在 GAE 中遇到这个奇怪的错误
我们有一个名为模型的包在模型中，我们有一个 TopicM 模块，它定义了一个类 Topic我们将它导入同一个包中名为 GeneralM 的模块中。有时(很少)我们会收到此错误: 可能是什么原因？会不
android - 使用 ArrayIndexOutOfBoundsException 将 TextView 文本设置为静态文本崩溃(很少)
通过简单地将 TextViews 文本设置为在代码中定义的字符串(永远不能是 null)我有时会得到一个 ArrayIndexOutOfBoundsException，这只发生在我的实时应用程序中，我
javascript - 为什么 NodeJS/restify 服务器*很少*在接受时报告 EPERM？
我在 NodeJS 中运行一个 restify 服务器。在极少数情况下，大约 0.05% 的 HTTPS 请求会导致 net.js 报告以下错误: Error: accept EPERM at
Eclipse 更新(很少)有效 : No repository found containing -- many entries
我不明白，为什么Eclipse更新变得如此不可靠？大约每次使用它时，我都会遇到一些问题! 例如，现在我遇到下面一堆谵妄。禁用“联系所有软件站点”没有帮助。 An error occurred whil
swift - 在 spritekit 的 update() 中运行循环，很少，高效 : a way?
为了呈现一堆节点，每帧一个，直到它们都出现在屏幕上，我想在 update() 调用中做这样的事情。警告，伪代码接近: update(){ switch presentNodes_inOrderOfA
ios - CoreData 很少 'This NSPersistentStoreCoordinator has no persistent stores. It cannot perform a save operation.'
此 NSPersistentStoreCoordinator 没有持久存储。它无法执行保存操作。 NSInternalInconsistencyException(SIGABRT) This NSPe

首页

博学

6Ren·AI

商城

apache-flink - 如何处理 Apache Flink 中很少更新的大型查找表