kubernetes - 在 kubernetes 上持续部署有状态的 apache flink 应用程序-6ren

kubernetes - 在 kubernetes 上持续部署有状态的 apache flink 应用程序

转载作者：行者123 更新时间：2023-12-02 11:38:37

25

4

我想在 kubernetes 上运行 apache flink (1.11.1) 流应用程序。使用文件系统状态后端保存到 s3。到 s3 的检查点工作正常

args:
  - "standalone-job"
    - "-s"
    - "s3://BUCKET_NAME/34619f2862ce3e5fc91d80eae13a434a/chk-4/_metadata"
    - "--job-classname"
    - "com.abc.def.MY_JOB"
    - "--kafka-broker"
    - "KAFKA_HOST:9092"

所以我面临的问题是:

我必须手动选择以前的状态目录。有没有可能让它变得更好？
作业递增 chk 目录但不使用检查点。意味着我在第一次看到一个事件时抛出一个新事件并将其存储到 ListState<String>每当我通过 Gitlab 部署更新版本的应用程序时，它都会再次引发此事件。
当我已经将 state.backend 定义到文件系统时，为什么我必须在我的代码中显式启用检查点？ env.enableCheckpointing(Duration.ofSeconds(60).toMillis());和 env.getCheckpointConfig().enableExternalizedCheckpoints(RETAIN_ON_CANCELLATION);

最佳答案

您可能对 Ververica Platform: Community Edition 更满意，这将抽象级别提高到您不必在此级别处理细节的程度。它有一个专为 CI/CD 设计的 API。
我不确定我是否理解您的第二点，但您的作业在恢复期间倒带和重新处理一些数据是正常的。 Flink 不保证 exactly once 处理，而是 exactly once 语义:每个事件都会影响 Flink 管理的状态 exactly once。这是通过回滚到最近检查点中的偏移量，并将所有其他状态回滚到使用完这些偏移量之前的所有数据后的状态来完成的。
有一个状态后端是必要的，因为它可以在作业运行时存储作业的工作状态。如果不启用检查点，则工作状态不会被检查点，也无法恢复。但是，从 Flink 1.11 开始，您可以通过配置文件启用检查点，使用

execution.checkpointing.interval: 60000
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION

关于kubernetes - 在 kubernetes 上持续部署有状态的 apache flink 应用程序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63278123/

25

4

0

文章推荐： excel - 从 ExcelDNA 返回 #N/A 错误

文章推荐： asp.net - 路由 HTTP 错误 404.0 0x80070002

文章推荐： kubernetes - 从集群内部调用时的 503 响应代码

文章推荐： Kubernetes ingress 不工作，默认后端 404

firebase - 持续 session ？
如果我错了，但身份验证 session 有 30 天的最大限制，请纠正我？如果是这种情况，有没有办法让我的服务器节点应用程序永远监听经过身份验证的 dataRef？干杯，旅行。最佳答案自 on
build-automation - 持续/自动部署对桌面应用程序有意义吗？
我目前正在阅读 book Continuos Delivery由 Humble/Farley 撰写，虽然里面的很多东西都是有道理的，但有一件事让我烦恼: 似乎作者只针对基于服务器的(单客户端？)应用程
c++ - 密码管理器 - 持续/长期的事情
好吧，我非常了解每个人对自制密码管理器的看法，但我希望得到帮助。不用于实际使用，仅供学习。我想知道，在 C++ 中如何拥有长期变量。或者真的，有什么长期的。长期是什么意思？在下次运行 .exe
bash - 替换文本文件中的行(持续)bash
我在文本文件中有以下三行(最后 3 行): } } } 我想做的是做这样的事情: } } blablabla blablabla blabla
ios - 每日同时推送通知，持续 10 天
在 iOS 中，有没有一种简单的方法可以在每天的同一时间发送 10 天的推送通知？我不想向所有用户发送推送通知。我的应用程序的工作方式是，用户可以选择连续十天推送通知的时间。您有推荐的 API 吗？或
android - 持续、频繁更新通知的最先进方法 ("notification widget")
我正在努力寻找一种当前最先进的方法来处理频繁更新的通知(例如每 3 分钟一次)。似乎在较新的 Android 版本中内置了如此多的电源效率调整(幸运的是!)，我之前成功使用的方法(使用 Broadca
css - 从我的笔记本电脑将自定义 CSS(持续)应用到我经常查看的网站？
我不得不在一些糟糕的房地产网站上花费大量时间。我比较精通 CSS，并且可以(在 FireFox 中)“检查元素”并更改 CSS 以隐藏或缩小特定页面的华而不实的元素。但我想将此自定义 CSS 应用于特
c# - signalR 在 POST 后使用/持续
目前正在研究如何使用 signalR 在处理文件时向用户呈现文件的进度报告。我正在使用 asp.net MVC 4。通过 Ajax 进行发布/获取时，我可以轻松获取状态更改。因为我需要上传一个文件(
c# - 持续 15 分钟的 DotNet 舍入日期时间
这个问题在这里已经有了答案: How can I round up the time to the nearest X minutes? (15 个答案) Is there a simple fun
php - 仅运行脚本一次，持续 5 分钟 (Linux)
我有一个 php 脚本，我想运行特定的时间(例如 5 分钟)，但只能运行一次。对于 cron 作业，这将无限期地运行。还有别的办法吗？最佳答案处理这个问题的方法是: 当某些事件触发需要 cron
php - 如何使用户 session 持续 24 小时？
我弄乱了我的 apache 和 php.ini 文件，我网站的用户仍然提示该网站在很短的时间后或每次他们关闭并打开同一个浏览器时将他们注销。我正在运行 Apache 和 PHP。我应该进行哪些设置
mysql - (以今天计算)减去(以前一天计算)持续 1 个月
如何查询今天的总和需要减去前一天的总和，每天持续一个月。 SELECT COUNT(DISTINCT member_profile.memberProfileNumber) FROM member_p
Javascript 重复函数 x 次，持续 y 秒
这个问题在这里已经有了答案: How do I add a delay in a JavaScript loop? (32 个答案) 关闭 8 年前。我认为这个问题之前一定有人问过，但我找不到其他
php - 每 24 小时重新发送一次电子邮件，持续 3 天
用户在我的网站上注册后，我们会向他发送一封确认电子邮件。我想要的是 - 三天内每 24 小时为用户重新发送一次电子邮件。例如: user_table id , name, date_registere
php - Laravel Session Flash 持续 2 个请求
最近我从 Codeigniter 换到了 Laravel，一切都很顺利，除了我遇到了 Session::flash 的问题。当我创建新用户时，我收到成功消息，但它会持续 2 个请求，即使我没有通过验
Azure 监视器针对 CPU 使用率 > 80% 持续 30 分钟或更长时间发出警报
如果有人能帮助我解决这个问题，我将非常感激。我正在尝试针对 CPU 使用率 >= 80% 持续 30 分钟或更长时间创建 Azure 监视器警报我已附上警报规则条件的屏幕截图。在“评估依据”下，聚
Azure 监视器针对 CPU 使用率 > 80% 持续 30 分钟或更长时间发出警报
如果有人能帮助我解决这个问题，我将非常感激。我正在尝试针对 CPU 使用率 >= 80% 持续 30 分钟或更长时间创建 Azure 监视器警报我已附上警报规则条件的屏幕截图。在“评估依据”下，聚
java - 每天运行模型 8 小时，持续 3 天 (AnyLogic)
希望大家平安 1。我的目标我正在尝试模拟 3 天的真实情况。系统每天只能工作 8 小时。我的目标是模型运行 8 小时，持续 3 天，以获得足够的数据进行分析。 2。我的问题我有一个代理预约时间表
JavaScript/jQuery 每 5 分钟调用一次函数，持续 8 小时
我需要在 8 小时内每 5 分钟调用一次函数。问题是它必须是同一天。例如，如果用户在 3/29 晚上 11:59 登录系统，而现在是 3/30 凌晨 12:01，则不应再调用该函数。我知道如何每
javascript - 使用 Firebase 的 Firestore 高效(持续)更新聊天消息
我正在开发一个 React Native 应用程序，该应用程序使用 Firebase 的 Firestore 作为后端。现在，每次收到新消息时，我都会从 Firestore 获取所有消息并更新我的状态

首页

博学

6Ren·AI

商城

kubernetes - 在 kubernetes 上持续部署有状态的 apache flink 应用程序

所以我面临的问题是: