gpt4 book ai didi

Nagios 使用 check_ping 监控主机

转载 作者:行者123 更新时间:2023-12-04 15:43:20 36 4
gpt4 key购买 nike

我已经通过 EPEL 存储库在全新安装的 CentOS 7 上部署了一个新的 Nagios 实例。所以 Nagios Core 版本是 3.5.1。

安装 nagios 和 nagios-plugins-all(通过 yum)后,我创建了许多主机和服务定义,并使用 nagios -v /etc/nagios/nagios.cfg 测试了我的配置。 ,并启动并运行 Nagios!

不幸的是,我的主机检查失败了(尽管我的服务检查工作得很好)。

在 Nagios Web GUI/仪表板中,如果我深入到带有“主机状态信息”的主机页面,我会看到报告的“状态信息”(已删除 IP 地址):

Status Information: /usr/bin/ping -n -U -w 30 -c 5 {my-host-ip-address}

CRITICAL - Could not interpret output from ping command

enter image description here

所以在我的故障排除中,我深入到 Nagios 插件目录 (/usr/lib64/nagios/plugins),并使用与 check-host-alive 运行命令的方式一致的 check_ping 插件运行测试(见下文)对于我的 check-host-alive 命令定义):

./check_ping -H {my-ip-address} -w 3000.0,80% -c 5000.0,100% -p 5

此 check_ping 命令返回以下输出:

PING OK - Packet loss = 0%, RTA = 0.63 ms|rta=0.627000ms;3000.000000;5000.000000;0.000000 pl=0%;80;100;0

我没有更改 check_ping 如何工作的定义,并且可以确认只要命令以与 check-host-alive 运行命令相同的方式运行,我就会收到“PING OK”,所以我无法确定看看发生了什么!

以下是 check-host-alive 和 check_ping 的命令定义。

# 'check-host-alive' command definition
define command{
command_name check-host-alive
command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5
}

{snip}

# 'check_ping' command definition
define command{
command_name check_ping
command_line $USER1$/check_ping -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 5
}

关于如何修复我的 check-host-alive 命令定义以正常工作并正确评估 check_ping 的输出有什么建议吗?

编辑

下面是我正在使用的完整定义主机 {} 模板:

define host     {
host_name myers ; The name of this host template
alias Myers
address [redacted]
check_command check-host-alive
contact_groups admins
notifications_enabled 0 ; Host notifications are enabled
event_handler_enabled 1 ; Host event handler is enabled
flap_detection_enabled 1 ; Flap detection is enabled
failure_prediction_enabled 1 ; Failure prediction is enabled
process_perf_data 1 ; Process performance data
retain_status_information 1 ; Retain status information across program restarts
retain_nonstatus_information 1 ; Retain non-status information across program restarts
notification_period 24x7 ; Send host notifications at any time
register 1
max_check_attempts 2
}

最佳答案

对于遇到此问题的任何其他人,除了更改 ping 权限之外,还有另一种选择。只需将主机检查命令更改为使用 check_host 而不是 check_ping。虽然在功能上肯定存在一些差异,但总体最终结果是相同的。

有些人会说这不是一个好的选择,因为它能够调整 check_ping 命令的范围,但应该记住,直到所有服务检查都不会执行主机检查对于给定的主机失败了。无论如何,如果您对测试吞吐量感兴趣,有比依赖 ICMP 更好的方法,后者是网络上优先级最低的流量类型。

我确信 OP 现在已经很好地处理了其他事情,但希望遇到此问题的其他人会受益。

关于Nagios 使用 check_ping 监控主机,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26746404/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com