apache-spark - 如何使用 Trigger.Once 选项在 Spark 3 Structured Streaming Kafka/File 源中配置背压-6ren

apache-spark - 如何使用 Trigger.Once 选项在 Spark 3 Structured Streaming Kafka/File 源中配置背压

转载作者：行者123 更新时间：2023-12-04 13:28:15

24

4

In Spark 3 Behave of backpressure option on Kafka and File Source for trigger.once scenario was changed .
但我有一个问题。
当我想使用 TriggerOnce 时，如何为我的工作配置背压？
在 spark 2.4 中，我有一个用例，回填一些数据，然后启动流。
所以我使用了一次触发器，但我的回填场景可能非常大，有时会因为洗牌和驱动程序内存而在我的磁盘上创建太大的负载，因为 FileIndex 缓存在那里。
所以我使用 max maxOffsetsPerTrigger和 maxFilesPerTrigger控制我的 spark 可以处理多少数据。这就是我配置背压的方式。
现在你删除了这个能力，所以假设有人可以建议一个新的方法？

最佳答案

Trigger.Once现在忽略这些选项(在 Spark 3 中)，所以它总是会在第一次加载时读取所有内容。
您可以解决该问题 - 例如，您可以在触发器设置为定期的情况下启动流，使用一些值，例如 1 小时，并且不执行 .awaitTermination ，但有一个并行循环来检查第一批是否完成，并停止流。或者您可以将其设置为连续模式，然后检查是否有 0 行的批次，然后终止流。在初始加载之后，您可以将流切换回 Trigger.Once

关于apache-spark - 如何使用 Trigger.Once 选项在 Spark 3 Structured Streaming Kafka/File 源中配置背压，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66777031/

24

4

0

文章推荐： c - Linux 内核 flush_write_buffers() 如何在 x86 上工作？

文章推荐： scala - 如何将回溯算法转换为流？

triggers - Oracle Trigger 会导致性能问题吗
我的应用程序中有大约 100 多个表。大多数更新查询不会更新最后更新的时间列。有 100 多个查询，所以我有点怀疑修改所有查询以包括上次更新时间。我正在寻找的替代选项是为所有表创建一个 oracle
triggers - Oracle Trigger 会导致性能问题吗
我的应用程序中有大约 100 多个表。大多数更新查询不会更新最后更新的时间列。有 100 多个查询，所以我有点怀疑修改所有查询以包括上次更新时间。我正在寻找的替代选项是为所有表创建一个 oracle
trigger.io - trigger.io 是否支持黑莓？
trigger.io 是否支持黑莓？如果没有，是否有任何计划支持它。最佳答案在移动方面，他们目前支持: iOS 4+ (iPhone 和 iPad) 安卓 2.0+ window 电话* 我不知道
triggers - jQuery .trigger ('click' )在间隔函数内？
这是 here 中的一个改写的问题。经过一些测试后，我隔离了问题，但没有解决它的线索。无需阅读上一个问题，这是简化的代码: 问题 -> trigger('click')执行，但在循环(间隔)函数内时不
triggers - 如何为 redis 数据存储实现 "trigger"？
我有一个程序，它会从 redis 数据存储中轮询某个键，并在该值满足某个条件时执行某些操作。不过我觉得redis周期性的轮询效率很低，想知道redis有没有“触发”机制，当值发生变化满足条件时，触发
trigger.io - 如何将另一个协作者添加到我的 trigger.io 项目？
现在我的合作者收到这样的错误:[错误] Forge API call to app/f7617c848[...]adcbe/should_rebuild 出错:应用匹配查询不存在。最佳答案我们正在
trigger.io - 是否可以使用 trigger.io 删除推送通知徽章？
当用户在我的 trigger.io iOS 应用程序(使用 Parse.com)上收到推送通知并希望在用户打开应用程序时清除徽章时，我将徽章设置为 1。有谁知道如何做到这一点？谢谢! 最佳答案有几
trigger.io - 如何在 trigger.io 中指定启动图像持续时间？
iPhone 启动图像现在显示太短，我想延长持续时间。有没有办法在 config.json 中指定它？最佳答案更新 :从平台版本 v1.4.20 开始，您可以控制启动图像的可见性(http://
trigger.io - 如何将文件下载到我的 trigger.io 应用程序？
如何将文件下载到我的 trigger.io 应用程序？我的应用程序显示离线数据，但我需要我的应用程序如何从服务器下载和存储本地新鲜数据的方式。数据是一个带有项目数组和一些图像的 js 文件，每个图像都
wpf - DataTemplate.Triggers 与 Style.Triggers
为了根据条件更改 ListBoxItem 前景，我可以通过 DataTemplate.Triggers 来完成: ...
wpf - DataTemplate.Triggers 与 Style.Triggers
为了根据条件更改 ListBoxItem 前景，我可以通过 DataTemplate.Triggers 来完成: ...
trigger.io - Trigger.io Assets 的绝对路径？
我们正在构建一个以 Chaplin 为基础的 Trigger 应用程序。出于开发目的，如果我们可以使用 Assets 的绝对路径，那就太好了，比如: 是否可以在 Trigger 中执行此操作？
c# - Style.Triggers 与 ControlTemplate.Triggers
什么时候应该选择Style.Triggers，什么时候应该选择ControlTemplate.Triggers？使用一个比另一个有什么好处吗？假设我有实现相同结果的这些样式:
trigger.io - trigger.io 中是否有处理 OAuth 的好方法？
在我的情况下，我将有一个带有自定义 url 架构的重定向 URL，例如 myapp://oauth 所以首先我会转发到我的 oauth 登录 url，然后我需要为位置更改注册一个事件处理程序，以检查它
mysql - 我可以在 TRIGGER 中创建 MYSQL TRIGGER WITH 或条件吗
我可以创建一个带有 OR 条件的 MYSQL TRIGGER 创建或替换触发器 TIGGER 名称插入之前或更新或删除像这样(下面是 ORACLE TRIGGER): CREATE OR REPLA
c# - Framework.Triggers 和 Style.Triggers 之间的区别？
有两个相同类型但存在于不同类中的属性。 FrameworkElement.Triggers Property Style.Triggers Property 这让我很困惑，所以我很少有问题要寻找答案:
trigger.io - 有没有办法为 trigger.io 构建 native 插件？
我有兴趣为 trigger.io 编写 native 插件。这是否已经可能或在路线图上？最佳答案这绝对在路线图上:我们从一开始就不允许这样做的主要原因是我们最初的主要重点是创建一个尽可能平稳和快
trigger.io - 如何使用 Trigger.io 缓存 json 数据？
我知道如何缓存它，但我以后如何检索它。文档 ( http://docs.trigger.io/en/v1.4/features/cache.html ) 仅给出了使用图像的示例，要检索您需要做的就是获
Azure函数: A way to trigger other Azurefunction in a http-trigger azure function?
在 AzureFunction1 中收到简短通知后，我需要一种可靠的方法将其快速保存，然后触发另一个 Azurefunction 来分析数据并根据分析进行其他操作。我正在寻找一种向 azure fu
trigger.io - 如何使用 Trigger.io 在 iOS 中播放背景音频？
我正在尝试使用 Trigger.io 的框架构建一个流式音频应用程序。看到它的 API 目前没有任何与音频相关的方法，我用基本的 HTML5 audio 对其进行了测试。标签。在这种情况下流式传输

首页

博学

6Ren·AI

商城

apache-spark - 如何使用 Trigger.Once 选项在 Spark 3 Structured Streaming Kafka/File 源中配置背压