- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在考虑在 Amazon 上设置 ELK 堆栈,但我们真的不知道我们需要什么机器才能顺利处理它。
现在我知道如果它运行不顺利就会变得很明显,但我们仍然希望了解我们需要什么来应对我们的情况。
所以我们 4 个服务器以自定义格式生成日志文件。每天约 4500 万行日志,生成约 4 个 600mb(gzipped)文件,因此每天约 24GB 的日志。
现在我们正在研究 ELK 堆栈,并希望 Kibana 的仪表板显示实时数据,因此我考虑使用 syslog 将日志记录到 logstash。
4 服务器 -> Rsyslog(在这 4 台服务器上) -> Logstash (AWS) -> ElasticSearch (AWS) -> Kibana (AWS)
所以现在我们需要弄清楚我们在 AWS 中需要什么样的硬件来处理这个问题。
我至少在某处阅读了 3 个 ElasticSearch 大师和 2 个数据节点。
那么总共 5 台服务器 + 1 台服务器用于 Kibana,1 台用于 Logstash?
所以我总共需要 7 台服务器才能开始,但这似乎有点矫枉过正?
我想将我的数据保留 1 个月,所以最多 31 天,所以我在 Elastic Search 中有大约 1.4TB 的原始日志数据(~45GB x 31)
但是,由于我真的不知道最佳设置是什么,因此欢迎提供任何提示/提示/信息。
此外,可以为我处理此问题的系统或工具(节点故障等)可能很有用。
提前致谢,
黑暗之城
最佳答案
以下是我构建云集群的方式:
3 个主节点 - 这些节点协调集群并保留其中三个有助于容忍故障。理想情况下,这些将分布在可用区中。这些可以相当小,理想情况下不接收任何请求——它们唯一的工作是维护集群。在这种情况下设置 discovery.zen.minimum_master_nodes = 2
以维持法定人数。这些 IP 和仅这些 IP 是您应该提供给 discovery.zen.ping.unicast.hosts
中的所有集群节点的内容。
索引:您可能应该利用每日索引 - 参见 https://www.elastic.co/guide/en/elasticsearch/guide/current/time-based.html这在下面会更有意义,但如果您开始扩大规模也会有好处 - 您可以随着时间的推移增加分片数量而无需重新编制索引。
数据节点:根据您的规模或性能要求,有几个选项 - i2.xlarge 或 d2.xlarge 可以很好地工作,但 r3.2xlarge 也是一个不错的选择。确保保持 JVM 堆 <30GB。将数据路径保留在实例本地的临时驱动器上 - EBS 对于此用例并不是很理想,但根据您的要求可能就足够了。确保您有多个数据节点,以便副本分片可以跨可用区拆分。随着您的数据需求的增加,只需扩大这些需求即可。
热/暖:取决于用例 - 有时将数据节点拆分为热/暖(快速 SSD/慢速 HDD)是有益的。这主要是因为所有写入都是实时的,并且大部分读取发生在过去几个小时内。如果您可以将昨天的数据移动到更便宜、速度更慢的驱动器上,那将大有帮助。这有点复杂,但您可以在 https://www.elastic.co/blog/hot-warm-architecture 阅读更多内容。 .这需要每晚添加一些标签并使用 curator,但通常是值得的,因为将大部分未搜索的数据从更昂贵的 SSD 上移走可以节省成本。
在生产中,我为热层运行 ~20 r3.2xlarge,为热层运行 4-5 d2.xlarge,复制因子为 2 - 这允许每天摄取 ~TB 和相当数量的保留。我们将 Hot 扩展为容量,将 Warm 扩展为保留。
总的来说 - 祝你好运!一旦一切顺利运行,就可以构建和运行一个有趣的堆栈。
PS - 根据您可用的时间/资源,您可以在 AWS 上运行托管的 elasticsearch 服务,但上次我认为它比在您自己的实例上运行它贵约 60%,而且 YMMV。
关于amazon-web-services - ELK 在 AWS 上的良好设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38138132/
我想知道 Amazon CloudSearch 和 Kendra 之间的主要区别是什么?为什么同一家公司的产品有两种不同的工具相互竞争?两者看起来都一样,我不确定功能有何不同。它是如何相互区分的。 A
我在一家小型电子商务网站工作,我们希望迁移到所有 Amazon 托管服务,但我不确定 RDS 和 SimpleDB 的确切区别。 RDS可以用MySQL,SimpleDB不行吗? 最佳答案 RDS 基
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 7年前关闭。 Improve t
任何人都知道如何 ELB如果我注册多个 EC2 将分发请求不同大小的实例。说一 m1.medium , 一 m1.large和一个 m1.xlarge . 如果我注册EC2会不会不一样相同大小的实例?
Amazon EventBridge 使开发人员能够将第 3 方事件驱动的应用程序与 Amazon 服务连接起来。 Amazon AppFlow 还提供与第 3 方应用程序的事件驱动集成。 对于事件驱
我想通过电子邮件或短信向特定用户(只有一个)发送验证码。我已经通过 Amazon SES 成功地做到了。但我没有尝试通过Amazon SMS然而。我发现自己陷入了调查的兔子洞AWS Pinpoint
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
我想使用 Amazon Glacier 镜像 S3 存储桶。 Glacier FAQ状态: Amazon S3 now provides a new storage option that enabl
我正在尝试在 Amazon RDS 上托管数据库,而数据库将存储信息的实际内容(视频)将托管在 Amazon S3 上。我对这个过程有一些疑问,希望有人能帮助我。 Amazon RDS 上托管的数
我刚刚开始使用 AWS EC2。我知道 EC2 就像一台远程计算机,我几乎可以在其中完成我想做的所有事情。后来我知道了ECS。我知道它使用 Docker,但我对这两者之间的关系感到困惑。 ECS 只是
什么时候我会使用 SNS 和 SQS,为什么它们总是耦合在一起? 最佳答案 SNS是一个分布式发布-订阅系统。当发布者将消息发送到 SNS 时,消息就会被推送给订阅者。 SQS是分布式排队系统。消息不
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我计划在 amazon EC2 中拥有一个多服务器架构,其中服务器需要相互通信。这些服务器需要位于不同的亚马逊地区(不同的数据中心)。我可以只使用亚马逊ec2的内部网络吗?有哪些安全问题?我是否应该在
我在帐户 B 中有 S3 存储桶“跨存储桶”。现在我希望帐户 A 中存在的 EC2 访问帐户 B 中的此存储桶“跨存储桶”。 我需要使用 IAM 角色来实现此目的,因为我们不允许创建用户。 我已使用以
我有使用 Backbone.js 构建的单页应用程序。 我在 Amazon S3 上托管应用程序(应用程序仅包含静态文件)。 我使用 CloudFront 作为 Bucket CDN。 应用程序通过
我可以连接到 ElastiCache来自 EC2 实例 的 VPC 中的 Redis 实例。但我想知道是否有办法连接到 Amazon EC2 实例之外的 ElastiCache Redis 节点,例如
我有几个微实例可以正常工作数周。两者都在运行WordPress博客。在过去的24小时内,其中一个已经停止。即使重新启动,我也无法插入。另一个实例工作正常。 ssh: connect to host e
我尝试了以下方法: SELECT * FROM generate_series(2,4); generate_series ----------------- 2
如何使用PHP API将包含子文件夹和文件的文件夹复制/复制到S3存储桶中的另一个目录中? $s3->copy_object仅复制文件夹,而不复制其中的文件和子文件夹。 我是否必须使用$s3->lis
我是一名优秀的程序员,十分优秀!