- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
所有IT部门都在面临这个问题。当服务器,网络和应用出现问题时,他们必须尽快做出反应。这些情形往往具有破坏性和高压性,并可能引发影响整个组织运营(和利润)的停机时间。根据去年的报告,平均IT停机损失高达155万美元。更严重的问题是,暴力事件导致每年545小时的员工产能损失。
出于这些原因,企业越来越多地投资于应用性能监视(APM)和服务器监控软件以及其他解决方案。由于“基础设施监控是否是企业所需的解决方案”已经不再是问题,因此问题就变成了应该使用哪些监控工具。
最佳IT基础设施监控工具评估
服务器和网络监控工具的目标是确保IT服务 24x7 小时全天候稳定运行,并在出现任何问题时告警给IT支持人员。这样,我们可以最大化正常运行时间并制定更好的灾难恢复计划。
一般来说,所有工具都有共性,但又不尽相同。以下列出了我们认为最佳的工具列表。
1. Zabbix
Zabbix可以说是市场上最流行和健壮的实时监控解决方案之一。Zabbix是开源的,它具有一套简洁的特性,拥有完善可靠的文档,并且由活跃的社区用户更新和支持。其他好处还包括它有良好的易用性,当然,它提供了一个不受制于任何供应商锁定的解决方案。
Zabbix 的众多亮点之一是它能够预测流量趋势并根据收集历史数据来提供系统行为预测。
主要特点:
主动监控
容量规划
内置Java应用服务器监控功能
硬件监控
网页服务
虚拟机监控
Zabbix 可以配置为各种行业提供监控解决方案 —— 从航空航天到金融和零售,同样也适用于大中型企业。Romexsoft 团队依靠此工具为客户提供24x7全天候IT支持。
2. Prometheus
这是我们团队最喜欢的另一个开源监控工具,它基于时间序列数据提供详细的基础设施洞悉能力。它是监控高动态环境(如AWS上的容器)的可靠选择。
从本质上讲,Prometheus 爬取(scrape)指标,在本地存储所有采样数据并在数据之上运行其“规则”(rule)来聚合或生成告警。
Prometheus 的主要优势包括:
它既适用于以机器为中心的架构的监控,又适用于面向服务的架构的监控;
它是服务中断期间“首选”的完美工具,因为它使得用户能够快速诊断问题;
即使在故障情况下,用户也始终可以查看系统的统计信息(每个Prometheus服务器都是独立的)
3. Grafana
Grafana 是一款用于时间序列的、免费的、出色的分析和监控工具。它使我们能够创建有吸引力的、一目了然的全局数据可视化图像。特别是我们可以可视化系统CPU,内存,磁盘和 I/O 利用率等指标。
Grafana这个工具比较万能,我们可以创建来自不同数据源的自定义仪表板和特征数据,并将它们展示为曲线图,单一状态图,表格,热图或自由文本。
Grafana可以轻松的与 Prometheus、Graphite、InfluxDB、MySQL、PostgreSQL 和 Elasticsearch 集成,还可以通过插件与更多的其他数据源连接。虽然Grafana 不是一个独立的解决方案,但它是一个值得考虑进监控体系的优秀插件。我们团队利用Prometheus与Grafana集成来作为作为许多客户的解决方案。
4. ManageEngine OpManager
ManageEngine OpManager 是一款综合全面的性能监控工具,可提供服务器监控,并允许我们主动管理网络,执行网络配置和网络流量分析,它还有一个应用性能管理插件。但它必须安装到每个目标节点上才能正常使用。
为了满足我们的需求,我们可以设置可自定义的仪表板来监控不同组件的网络和指标。我们还可以将其用于 LAN/WAN 监控,并接收详细的流量路径可视化,查看带宽流量监测并运行各种网络系统性能指标的测定。
与前面的几个工具不同,ManageEngine 属于收费工具,它将会根据业务需求提供定制性报价。
5. Amazon CloudWatch
Amazon CloudWatch 可以为我们提供更好的应用性能、资源利用率、整体云基础设施监控状况的可视化能力,并帮助我们识别和纠正问题。
CloudWatch 使我们能够以日志、指标和事件的形式收集运维数据。该工具在AWS和本地服务器上运行,这意味着我们可以真正获得所有资产的统一视图。其仪表板是可配置的,允许管理员指示AWS根据预定义事件采取特定操作。
如果我们最近将基础设施迁移到AWS云,应考虑使用此云基础设施管理软件,至少应该用到某些容量的规划上。
6. WhatsUp Gold 2017
其中一些亮点包括以下内容:
它最新的“plus”版本包括混合云监控,实时性能,自动和手动故障转移,以及分布式网络的可视化;
高度可定制的告警系统,可包括电子邮件,文本,松弛告警,IFTTT推送,服务重启和Web警报;
自动发现和整个网络映射;
伴随移动应用可以随时洞察应用监控;
WhatsUp Gold 可为不同的用户提供完全可定制且极其友好的仪表板。
缺点?只有一个——它仅对Windows操作系统提供支持。
7. Icinga
Icinga 是最好的免费监控工具之一,它企业和初创公司的热门选择。它的优势在于适应于各种规模组织的灵活性,它致力于监控基础设施和服务。
而且,它提供了很好的阈值分析和清晰的报告和告警。这些都可以友好的显示在仪表板上,并可以通过邮件,短信或其他消息应用进行分发。
此外,它还可以连接到许多流行的 DevOps 工具,为我们的业务需求创建更加个性化的监控解决方案。这些包括 Chef,Puppet,Graylog,Ansible 等。
8. Datadog
Datadog 被设计成一个为混合云生态系统提供监控的服务,它也可以配置为网络、服务和应用性能提供监控。实际上,它附带了业内最大受支持应用的集成列表,我们可以安插这些集成来获得整个生态系统的统一视图。
该工具可以聚合以下指标和事件:
SaaS和云提供商
自动化工具
数据库和通用服务器组件
监控和仪表工具
源代码控制和错误跟踪解决方案
用户根据一系列可选的图形、指标和警报来轻松自定义可视化仪表板和报告。拥有最多五台主机的小公司,可以免费获得Datadog。专业版和企业版则要按每主机定价收费。
我有一个 asp .net 应用程序,它使用 infragistics Ultrachart 作为雷达图。现在图表如下图 是否可以在弧度和级别旁边添加文本,如下所示?有什么例子吗? 最佳答案 是的。有
如果我想创建一个相对较小的网站的移动友好版本,最好有一个子域重定向到一个带有单独标记和样式的全新 url,还是在代码中检测用户代理会更好并以编程方式更改为不同的移动友好样式表,或者他们是我忽略的更好的
我创建了一个可以正常打开的侧选项卡(基本上将 UltraGrid 变成了选项卡,而不是带有 UltraGrid 的表单),但是当固定侧选项卡时,它的大小会位于主窗体的后面。 如何设置固定标签布局以根据
我正在寻找 WPF 网格控件的供应商,它可以与 MVVM 很好地配合使用;这允许通过拖动列进行分组。我一直在环顾四周,乍一看,我目前的选择似乎是 Telerik。 如果有人对一个或多个供应商有经验,我
我在一家小型初创公司工作,该公司仅托管在 Azure 中,我想知道保护一切的最佳方法。 我使用以下服务 网络应用(面向公众) 虚拟机 - 运行应用和服务 Sql 服务器 服务总线 存储帐户。 网络应用
我有一个 C++ 应用程序,目前使用简单的 TCP/IP 客户端/服务器模型在其自身的 2 个实例之间进行通信。这在本地网络上运行良好,但我希望它能在外部网络上使用。目前,可能由于防火墙问题,它无法跨
我在 aws 中有一个实验室设置,有一个 vpc、一个 IGW、几个不同的子网和一些 ec2 实例,没什么可疯狂的。 我正在尝试将这个 VPC 与里面的所有东西一起导出,但不知道如何去做。 我尝试了
我过去经常使用 Dojo,并且非常喜欢它提供的小部件基础结构。您可以轻松地分离代码和 html 内容,它与 dojo 使用的 require-system 很好地链接在一起,最后但并非最不重要的一点是
我认为我的问题很简单,但我仍然没有找到适合我的答案,无论是在这里还是在那里..所以如果有人能帮助我,我会很高兴,不管是提供有用的链接还是其他什么... 我想要达到的目标:我有一个 Ignite UI
Map Reduce 是一种最近似乎受到很大关注的模式,我开始在我的一个专注于事件处理管道(iPhone 加速度计和 GPS 数据)的项目中看到它的体现。我需要为这个项目构建大量的基础设施,事实上它超
如何最好地设置我的 PHP (LAMP) 开发环境,以便我拥有开发、暂存和生产服务器。一键式部署到其中任何一个,以及一键式回滚到任何修订。回滚还应该将数据库模式和数据回滚到源代码是最新时的状态。 现在
我一直在用Infragistics几年来,UltraWebGrids 出现在多个产品中,但与它们一起走到了十字路口。我一直在调查Telerik产品,它们似乎比演示中的 Infragistics 网格表
有人能告诉我如何使这个 viewModel 中的 getMovies 函数可测试吗?我无法让单元测试正确地等待协程.. (1) 我很确定我必须创建一个 test-CoroutineScope 和一个正
在iggrid上进行Excel风格的过滤过程中,我想在显示网格后隐藏一些自定义过滤条件。 我已经看到了:http://infragistics.com/community/forums/t/97384
我们正在为客户制作一个大型 Web 表单,它有六个日期字段,为此我们使用了 Infragistics WebDatePicker 控件(在 asp.net 4.6 中)。它们工作正常(尽管向它们应用验
目前我们在单个云服务器上设置了所有内容,包括: 数据库服务器 Apache celery redis 作为 celery 和其他一些任务的代理 等等 现在我们正在考虑将主要组件分解为单独的服务器,例如
将领域层的所有接口(interface)(模块、模型、实体、领域服务等)全部归入基础设施层是否有意义?如果没有,创建一个“共享”项目/组件将所有这些组合到一个共享库中是否有意义?毕竟,“基础设施层”的
我知道这个问题已经被无数人问过。但是,我没有找到任何适合我的解决方案。 我有一个 .NET 网站项目,并且正在使用 Entity Framework 6。在本地,该项目没有任何问题,一切都运行得很好。
我已将 UltraGrid 放在 WinForms 用户控件上。我调整了一些设置,以便可以将网格用作只读多行选择表。但有一个问题:默认情况下,第一行似乎被选中。 但是 Selected.Rows 属性
我是 IOS 开发的新手。我想知道每个人都使用哪种语言/框架来为高流量、可扩展的 IOS 应用程序后端创建 RESTFUL Web 服务。 解决方案需要:1. 安全登录2. Restful 网络服务(
我是一名优秀的程序员,十分优秀!