CentOS 7下安装配置Nagios监控图文详解

序言(必备知识)

一、Nagios简介

Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

  Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

主要功能

  Nagios原名为NetSaint,由Ethan
Galstad开发并维护至今。NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist
On Sainthood" Sainthood
翻译为圣徒,而"Agios"是"saint"的希腊表示方法。Nagios被开发在Linux下使用,但在Unix下也工作得非常好。

(1)网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)

主要功能

(2)主机资源监控(CPU load、disk usage、system
logs),也包括Windows主机(使用NSClient++ plugin)

  • 网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)

  • 主机资源监控(CPU load、disk usage、system
    logs),也包括Windows主机(使用NSClient++ plugin)

  • 可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)

  • 可以通过配置Nagios远程执行插件远程执行脚本

  • 远程监控支持SSH或SSL加通道方式进行监控

  • 简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell
    scripts、C++、Perl、ruby、Python、PHP、C#等)

  • 包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)

  • 可并行服务检查

  • 能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查

  • 当服务或主机出现问题时发出通告,可通过email, pager, sms
    或任意用户自定义的plugin进行通知

  • 能够自定义事件处理机制重新激活出问题的服务或主机

  • 自动日志循环

  • 支持冗余监控

  • 包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等

(3)可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)

二、Nagios工作原理

(4)可以通过配置Nagios远程执行插件远程执行脚本

  Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。

(5)远程监控支持SSH或SSL加通道方式进行监控

  启动Nagios后,它会周期性的自动调用插件去检测服务器状态,同时Nagios会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首开始读取信息,并进行处理后,把状态结果通过web显示出来。

(6)简单的plugin设计允许用户很容易的开发自己需要的检查服务,支持很多开发语言(shell
scripts、C++、Perl、ruby、Python、PHP、C#等)

  Nagios提供了许多插件,利用这些插件可以方便的监控很多服务状态。安装完成后,在nagios主目录下的/libexec里放有nagios自带的可以使用的所有插件,如,check_disk是检查磁盘空间的插件,check_load是检查CPU负载的,等等。每一个插件可以通过运行./check_xxx
–h 来查看其使用方法和功能。

(7)包含很多图形化数据Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)

  Nagios可以识别4种状态返回信息,即
0(OK)表示状态正常/绿色、1(WARNING)表示出现警告/黄色、2(CRITICAL)表示出现非常严重的错误/红色、3(UNKNOWN)表示未知错误/深黄色。Nagios根据插件返回来的值,来判断监控对象的状态,并通过web显示出来,以供管理员及时发现故障。

(8)可并行服务检查

四种监控状态

(9)能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查

图片 1

(10)当服务或主机出现问题时发出通告,可通过email, pager, sms
或任意用户自定义的plugin进行通知

  再说报警功能,如果监控系统发现问题不能报警那就没有意义了,所以报警也是nagios很重要的功能之一。但是,同样的,Nagios
自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其他相关开源项目组去完成的。

(11)能够自定义事件处理机制重新激活出问题的服务或主机

  Nagios
安装,是指基本平台,也就是Nagios软件包的安装。它是监控体系的框架,也是所有监控的基础。

(12)自动日志循环

  打开Nagios官方的文档,会发现Nagios基本上没有什么依赖包,只要求系统是Linux或者其他Nagios支持的系统。不过如果你没有安装apache(http服务),那么你就没有那么直观的界面来查看监控信息了,所以apache姑且算是一个前提条件。关于apache的安装,网上有很多,照着安装就是了。安装之后要检查一下是否可以正常工作。

(13)支持冗余监控

  知道Nagios
是如何通过插件来管理服务器对象后,现在开始研究它是如何管理远端服务器对象的。Nagios
系统提供了一个插件NRPE。Nagios
通过周期性的运行它来获得远端服务器的各种状态信息。它们之间的关系如下图所示:

相关文章

Comment ()
评论是一种美德,说点什么吧,否则我会恨你的。。。