- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是一个征求有关实现选项想法的问题。
我们正在迁移当前使用 Spark Streaming 的系统。在设计新系统时,我们正在讨论两种实现方案:
我们的用例:我们有一个数据存储,它不断生成我们需要使用的更新。我们数据的规模和频率只会变得更大、更快。
我可以访问我们当前的 Spark 作业 Web UI,如果需要任何指标/数据来支持任一选项,请告诉我。
谢谢!
最佳答案
感谢您的评论。
如果您只需要捕获数据并将其移动到其他地方,基于守护程序的解决方案可能会起作用。尽管如此,您的数据源必须允许轻松添加新的消费者,就像 Apache Kafka 对消费者组所做的那样。在这种情况下,您可以简单地在任何您想要的地方部署一个新容器(Kubernetes、Mesos、ECS...),并让您的源将工作负载分配给新的使用者。看起来不错。
但是,如果您想要制作一些复杂的东西,例如有状态聚合、分组操作,则很难从头开始重新实现所有内容并在事后对其进行维护。在我看来,即使你现在知道你不需要它,也没有什么可以保证它会永远如此。除此之外,您还需要使自定义使用者适应每个新版本,而对于开源解决方案,大部分时间都由社区处理。
如果您关心扩展,Apache Spark 将根据底层数据存储分区分布进行相应扩展。因此,如果您在 Kafka 主题中添加新分区,Apache Spark 应该相应地进行扩展 - 我同意自动执行此操作并不是一件容易的事,但您仍然只关注 1 个问题(自动扩展)和上一个选项 auto - 扩展是需要实现的众多要点之一。
此外,您说您的团队拥有 Apache Spark 专业知识,因此保留它是有意义的。
希望它对您的决策过程有所帮助。
您能否稍后分享您所做的决定并简要解释一下?
关于java - Spark 还是传统的守护进程来处理流更新?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57246115/
一 点睛 线程可以设置为守护线程,ThreadGroup 也可以设置为守护 ThreadGroup,但是若将一个 ThreadGroup 设置为 deamon,也并不会影响线程的 daemon 属性,
我有一个 python 脚本需要在启动时作为守护进程运行。进程从 tty(和 pdb)分离,但代码不运行。 我已经将它缩小到一个最小的例子 import daemon from time import
reactjs isMounted API 的文档提到: You can use this method to guard asynchronous calls to setState() or fo
我正在开发一个需要嵌入 HTTP 服务器的守护进程。我正在尝试使用 BaseHTTPServer 来完成它,当我在前台运行它时,它工作正常,但是当我尝试将守护进程 fork 到后台时,它停止工作。我的
我正在尝试使用 Apache Commons Daemon 使用 Daemon 接口(interface)来守护我的应用程序。 Java 应用程序本身不执行任何操作,只是写入 stout。 我编译了j
我正在使用 Bootle Python Web Framework 在 Ubuntu 上开发网络应用程序。是否有任何有效的方法来守护启动默认 bottlepy 网络服务器的脚本? 谢谢。 UPD:现在
我一直使用 bluepill成功地守护简单的 Ruby 脚本。然而这一次,我有一个脚本,它也在加载 Rails 环境,因此我可以访问 Rails 应用程序及其各自模型的数据库连接。我使用的 bluep
我试图守护一些代码,但我遇到了一些麻烦。 如果我用 tklogger() 调用代码,它运行得很好。但是,如果我在守护程序上下文中调用它,我会得到以下跟踪信息: Traceback (most rece
我打算使用 systemd 将 celery 4.3.0 作为守护进程运行,但它给了我这个错误: 它会启动 worker 但会很快停止它们。但是,我可以通过键入以下命令手动运行工作人员: celery
我是一名优秀的程序员,十分优秀!