- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我遇到了一种情况,我尝试使用来自 kafka 的 Spark Streaming 进行流式传输。该流是直接流。我能够创建一个流,然后开始流式传输,还能够通过流式传输获取 kafka 上的任何更新(如果有)。
当我有新的流式传输新主题的请求时,就会出现问题。由于每个 jvm SparkStreaming 上下文只能有 1 个,因此我无法为每个新请求创建一个新流。
我想到的方法是
创建 DStream 并且 Spark Streaming 已经在进行中后,只需向其附加一个新流即可。这似乎不起作用,createDStream(对于新的 topic2)不会返回流并且进一步的处理被停止。流式传输继续处理第一个请求(例如主题1)。
其次,我想停止流,创建 DStream,然后再次开始流。我无法使用相同的流上下文(它会引发流停止后无法添加作业的预期),并且如果我为新主题(topic2)创建新流,则旧流主题(topic1)将丢失并且它会流只有新的。
这是代码,你看一下
JavaStreamingContext javaStreamingContext;
if(null == javaStreamingContext) {
javaStreamingContext = JavaStreamingContext(sparkContext, Durations.seconds(duration));
} else {
StreamingContextState streamingContextState = javaStreamingContext.getState();
if(streamingContextState == StreamingContextState.STOPPED) {
javaStreamingContext = JavaStreamingContext(sparkContext, Durations.seconds(duration));
}
}
Collection<String> topics = Arrays.asList(getTopicName(schemaName));
SparkVoidFunctionImpl impl = new SparkVoidFunctionImpl(getSparkSession());
KafkaUtils.createDirectStream(javaStreamingContext,
LocationStrategies.PreferConsistent(),
ConsumerStrategies.<String, String>Subscribe(topics, getKafkaParamMap()))
.map((stringStringConsumerRecord) -> stringStringConsumerRecord.value())
.foreachRDD(impl);
if (javaStreamingContext.getState() == StreamingContextState.ACTIVE) {
javaStreamingContext.start();
javaStreamingContext.awaitTermination();
}
不用担心 SparkVoidFunctionImpl,这是一个自定义类,它是 VoidFunction 的实现。
以上是方法1,我不停止现有的流媒体。当新请求进入此方法时,它不会获取新的流对象,而是尝试创建 dstream。问题是 DStream 对象永远不会返回。
KafkaUtils.createDirectStream(javaStreamingContext,
LocationStrategies.PreferConsistent(),
ConsumerStrategies.<String, String>Subscribe(topics, getKafkaParamMap()))
这不会返回 dstream,控件只是在没有错误的情况下终止。不会执行进一步的步骤。
我尝试了很多方法并阅读了多篇文章,但我相信这是一个非常常见的生产级别问题。任何流式传输都是在多个不同主题上完成的,并且每个主题的处理方式都不同。
请帮忙
最佳答案
事情是 Spark Master 向工作人员发送代码,尽管数据是流式传输,但底层代码和变量值保持静态,除非重新启 Action 业。
我能想到的几个选项:
Spark 作业服务器:每次您想要从不同的主题订阅/流式传输而不是接触已在运行的作业时,请启动一个新作业。您可以从 API 主体中提供参数或主题名称。如果您想停止特定主题的流式传输,只需停止相应的作业即可。它将为您提供很大的灵 active 和对资源的控制。
[理论]主题过滤:订阅您认为想要的所有主题,当拉取记录一段时间后,根据主题列表过滤掉记录。通过 API 操作此主题列表以增加或减少主题范围,它也可以是广播变量。这只是一个想法,我根本没有尝试过这个选项。
另一种解决方法是在需要时使用微服务将 Topic-2 数据转发到 Topic-1,如果不需要则停止。
关于java - 流启动后 Spark Stream 新作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51341461/
每当我运行命令以将 Virtualbox 驱动程序启动 Minishift 到操作系统主机时,它都需要一段疯狂的时间,而且它永远不会结束。有时我什至收到有关达到存储限制的错误消息。 不知道是不是描述h
您好,我正在使用 npm 运行一个基本的 React 项目,我正尝试在 docker 容器中启动它。但是我实际上无法让项目运行。我的 dockerfile 看起来像这样: FROM node:7.8.
所以我想从我的 SSH 终端开始游戏。 这真的很奇怪,当我直接从 Linux GUI 执行此操作时,它可以工作。但是当我使用 SSH 客户端进行远程连接时,它就崩溃了。似乎与我的显示驱动程序有关。 U
我有一个显示图像的动态壁纸。我在 Activity 中更改了该图像。然后我需要通知动态壁纸,以便它知道重新加载资源。 Intent 似乎是完美、简单的解决方案: Intent intent = new
我有一个似乎无法解决的问题。我在 Boot Dashboard 中使用 STS 3.9.2 从 Eclipse (Oxygen) 启动 Spring Boot 应用程序没有任何问题: 但是,当我尝试从
全新的 Python,在我开始摆弄东西之前先设置和安装东西。我的理解是 Python 2.7 和 Python 3.3 之间存在一些显着差异/不兼容,尽管这两个版本都得到了很好的使用,所以我认为最好安
在使用了很长时间的 jQuery 之后,我有一个问题,我正在使用 jQuery 模式(样式)编写一个简单的代码, (function(window, undefined) { var jQu
我正在尝试在 spring boot 应用程序下的非 spring 托管类中配置 Autowired。我在 tomcat 服务器下部署的 Web 应用程序下成功运行了这个。但是当我想在 spring
我对 xmonad 完全陌生,但我想开始使用它来提高我的工作效率。 这是我一直在使用的指南(我使用的是 Apple OS X Snow Leopard) http://xmonad.org/tour.
我试图将Spring Boot指南中的Managing Transactions示例扩展到两个数据源,但是@Transaction注释似乎仅对其中一个数据源有效。 在“Application.java
conEmu 有没有办法默认打开多个不同的选项卡? 我看到这个页面解释了如何使用 splits , 我意识到我可以按 Ctrl + T, 1, Enter,但我希望有一种方法可以自动执行此操作! "%
我正在寻找快速而肮脏的答案。我当时脑子一片空白,盯着屏幕看了 12 个小时以上,我想我中枪了。 我想做一个简单的 SignalR 应用程序作为教程。我找到了这个example ,但我不断收到票证未定义
我正在使用 Azure Powershell cmdlet 来启动/停止 VM。 Start-AzureVM [-ServiceName] [-Name] [ ] Stop-AzureVM [-S
我想使用Powershell脚本代码启动/停止iis和mssql 意味着当我运行ps脚本时,我想启动/停止iis和mssql 我在网上搜索了它,发现了一些代码,但按照我的要求无法正常工作 码: $ii
我在 liferay 工作。我们在我们的项目中使用一个模块来创建 liferay 主题。我使用命令 ant -Ddeploy.war=true 将它部署在服务器中。 war 文件在 liferay 部
我想在已安装 Python 2.7 的 Windows XP 计算机上运行 IPython(版本 0.12)。 我通过 Windows 二进制安装程序安装,但安装后 IPython 没有显示在菜单中,
我从创建了自己的简单图片。 FROM python:2.7.11 RUN mkdir /extra/later/ \ && mkdir /yyy 现在,我可以执行以下步骤: docker run
$(document).ready(function () { setTimeout(function() { window.location.reload(); }, 2000); // 2
我刚刚创建了一个帐户 OpenWeatherMap 我想通过城市 ID API 调用获取当前位置的天气: http://api.openweathermap.org/data/2.5/weather?
我注意到,如果我更改 xcasset 中的图像,启动 Storyboard不会更新。 例如,假设您的启动 Storyboard中有一个 UIImage View ,其中包含一个名为“logo”的蓝色图
我是一名优秀的程序员,十分优秀!