java - AWS 上的架构 : Running a distributed algorithm on dynamic nodes

转载作者：行者123 更新时间：2023-11-29 04:36:05

25

4

如图所示，我正在做的宠物项目有以下两个组件。

a) “RestAPI 层”(一组微服务)

b) “可扩展并行算法”组件。

我计划在 AWS 上运行它。我意识到我可以使用 ElasticBeanTalk 来部署我的 RestAPI 模块。(带有嵌入式 tomcat 的 Spring Boot JAR)

我正在考虑如何构建“可扩展并行算法”组件。以下是关于此的一些设计细节:

这由几个节点组成，它们共享存储在S3.
每个节点对一 block S3 数据执行“算法”。一个节点作为主节点，其余节点将部分结果发送到这个节点。(尴尬的并行，主从范式)。主节点被 RestAPI 层调用。
“节点”是一个 Spring Boot 应用程序，它通过 HTTP 与其他节点通信。
“节点”的数量是动态的，这意味着我应该能够根据 S3 不断增加的数据大小手动添加新节点。
Redis 上有一个“节点注册表”，其中包含所有节点的 IP。每个节点注册自己，并使用列表中的 IP注册表相互通信。

我的问题:

1) 我应该使用 EC2 来部署“节点”还是我也可以使用 ElasticBeanStalk 来部署这些节点。我知道使用 EC2 我可以根据 S3 数据的大小来管理节点数量，但是是否可以用 ElasticBeanStalk 做这个？

2)我可以使用

Inet4Address.getLocalHost().getHostAddress()

获取每个节点的IP？ EC2实例有多个IP吗？此 IP 应允许 RestAPI 层与“主”节点通信。

3) 我应该使用什么组件将我的 RestAPI 层暴露给外部世界？但我不想公开我的“节点”。

更新:我不能使用 MapReduce，因为节点有状态。即，在初始化期间，每个节点从 S3 读取其数据 block 并在内存中创建“vector 空间”。这是一个耗时的过程，因此这就是为什么它应该存储在内存中。此外，该系统需要近实时响应，不能使用像 MR 这样的“批处理”系统。

最佳答案

1) 我会研究 CloudFormation 以帮助您自动化和编排可扩展并行算法。阅读此常见问题解答

https://aws.amazon.com/cloudformation/faqs/

2) 关于问题 #2，EC2 实例可以有私有(private) IP 和公共(public) IP，具体取决于您如何配置它们。您可以从实例中查询 AWS EC2 元数据服务以获取如下信息:

curl http://169.254.169.254/latest/meta-data/public-ipv4

或

curl http://169.254.169.254/latest/meta-data/local-ipv4

EC2 实例元数据的完整引用:

http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ec2-instance-metadata.html

3) 检查 API 网关服务，它可能是您正在寻找的:

https://aws.amazon.com/api-gateway/faqs/

关于java - AWS 上的架构 : Running a distributed algorithm on dynamic nodes，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41454876/

25

4

0

文章推荐： mysql - sql选择问题(mysql)

文章推荐： php - 在 laravel 中使用 mysql 查询计算行数

文章推荐： java - Android ListView 无法滚动更多，自定义适配器不好？

Kubernetes 架构
是否可以简化在裸机上运行的这条链: 具有随时间变化的副本数的 StatefulSet 服务使用 proxy-next-upstream: "error http_502 timeout invali
Facebook 架构
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
MySQL产品存储-架构
我需要为应用程序制定架构。它专为销售产品而设计。系统每天将接受大约 30-40k 的新产品。它将导致在表 product 中创建新记录。系统应保留价格历史记录。用户应该能够看到产品 A 的价格在去
PHP 架构 : How do I do that?
我需要一些帮助来理解 PHP 的内部工作原理。还记得，在过去，我们曾经写过 TSR(Terminate and stay resident)例程(pre-windows 时代)吗？一旦该程序被执行，
让我一起浅析Nginx 架构
1.Nginx 基础架构 nginx 启动后以 daemon 形式在后台运行，后台进程包含一个 master 进程和多个 worker 进程。如下图所示： master与
.NETCore：架构、特性和优势详解
.NET Core：架构、特性和优势详解在软件开发领域，保持领先地位至关重要。随着技术以指数级的速度发展，开发人员不断寻求高效、可扩展且多功能的解决方案来应对现代挑战。.NET Core 就是这样
K8s技术全景：架构、应用与优化
本文深入探讨了Kubernetes（K8s）的关键方面，包括其架构、容器编排、网络与存储管理、安全与合规、高可用性、灾难恢复以及监控与日志系统。关注【TechLeadCloud】，
tensorflow - 如何为任何通用数据集确定卷积神经网络的结构/架构？
我知道 CNN 的工作原理，包括每一层的用途(Dropout、Pooling 等)。但是，在为新数据集设计 CNN 时，我不知道要使用多少个 Conv-Relu-Pool 层，在最终获得输出之前我应该
REST 架构 - 资源和方法
在基于 REST 的架构中，资源和方法之间有什么区别。有吗？最佳答案资源是您的应用程序定义的东西；它们与物体非常相似。方法是 HTTP 动词之一，例如 GET、POST、PUT、DELETE。它们
Json 架构 "not in"枚举类型？
我想用 oneOf仅在 xyType 的值上不同的模式属性(property)。我想要其中两个:一个是 xyType设置为 "1"第二个在哪里xyType是任何其他值 .这可以使用 json 模式完
PHP 架构，以及按引用传递与按值传递
寻求 PHP 架构师的建议! 我对 PHP 不是很熟悉，但已经接管了一个用该语言编写的大型分析包的维护工作。该架构旨在将报告的数据读取到大型键/值数组中，这些数组通过各种解析模块传递，以提取每个模块已
JavaScript 架构/应用程序结构最佳实践？
这些存在吗？多年来，我一直是大型强类型面向对象语言(Java 和 C#)的奴隶，并且是 Martin Fowler 及其同类的信徒。 Javascript，由于它的松散类型和函数性质，似乎不适合我习
Lambda 架构 - 这个名字的由来是什么？
我已经阅读了 Manning 的 Big Data Lambda Architecture ( http://www.manning.com/marz/BD_meap_ch01.pdf )，但仍然无法
xcode - 高级应用程序设计/架构
在过去的几年里，我做了相当多的 iOS 开发，所以我非常熟悉 iOS 架构和应用程序设计(一切都是一个 ViewController，您可以将其推送、弹出或粘贴到选项卡栏中)。我最近开始探索正确的 M
javascript - AngularJS 架构
我有以下应用程序，我在其中循环一些数据并显示它。 {{thing.title}} {{thing.description}}
c# - 架构/设计模式问题
昨天我和我的伙伴讨论了我正在开发的这个电子购物网站的架构。请注意，我为此使用 ASP.NET。他非常惊讶地发现我没有将添加到购物车的项目保留在 ArrayList 或其他通用列表中，而是使用 LINQ
tridion - 隐藏继承的内容/架构
我正在使用在 tridion 蓝图层次结构中处于较低位置的出版物。从蓝图中较高级别的出版物继承的一些内容和模式不适合我的出版物，并且永远不会被我的出版物使用。我将跟进添加这些项目的内部团队，并尝试说
java - Cassandra 架构
我目前已经在 Cassandra 中设计了一个架构，但我想知道是否有更好的方法来做事情。基本上，问题在于大多数(如果不是全部)读取都是动态的。我构建了一个分段系统作为应用程序服务，读取动态自定义查询(
Icinga2 IDO 架构
我正在按照 documentation 中给出的 icingaweb UI v 2.0 布局执行在服务器上设置 icinga 的步骤。。我成功进入设置页面，该页面要求您输入 token ，然后按照步
java - Mongodb 架构
我必须保存来自不同社交媒体的用户的不同个人资料。例如用户可能有 1 个 Facebook 和 2 个 Twitter 个人资料。如果我保存每个配置文件它作为新文档插入不同的集合中，例如 faceboo

首页

博学

6Ren·AI

商城

java - AWS 上的架构 : Running a distributed algorithm on dynamic nodes

1) 我会研究 CloudFormation 以帮助您自动化和编排可扩展并行算法。阅读此常见问题解答

2) 关于问题 #2，EC2 实例可以有私有(private) IP 和公共(public) IP，具体取决于您如何配置它们。您可以从实例中查询 AWS EC2 元数据服务以获取如下信息:

3) 检查 API 网关服务，它可能是您正在寻找的: