Проверяем какой RAID стоит на сервере
# lspci -v | grep RAID 02:0e.0 RAID bus controller: Dell PowerEdge Expandable RAID controller 4 (rev 06) Subsystem: Dell PowerEdge Expandable RAID Controller 4e/Di
Мониторить Perc 4e/Di будем с помощью megarc
**********************************************************************
MEGARC MegaRAID Configuration Utility(LINUX)-1.11(12-07-2004)
By LSI Logic Corp.,USA
**********************************************************************
Скачиваем архив ut_linux_megarc_1.11.zip
Распаковываем, переносим и делаем файлы исполняемыми
# unzip ut_linux_megarc_1.11.zip # mv megarc megarc.bin /usr/lib64/nagios/plugins # cd /usr/lib64/nagios/plugins # chmod +x megarc megarc.bin
Посмотреть информацию о контроллере
# /usr/lib64/nagios/plugins/megarc -ctlrInfo -a0 ********************************************************************** Information of Adapter-0 (#Adapter(s) on system: 1) ********************************************************************** Firmware Version : 516A BIOS Version : H418 Logical Drives : 01 DRAM : 256MB Rebuild Rate : 30% Flush Interval : 4 secs Number Of Chnls : 2 Bios Status : Enabled Alarm State : Absent Auto Rebuild : Enabled FW : SPAN-8, 40-LD BIOS Config AutoSelection : USER BIOS Echos Mesg : ON BIOS Stops On Error : ON Initiator Id : 7(Clustered Firmware) **********************************************************************
Состояние дисков и RAID
# /usr/lib64/nagios/plugins/megarc -dispCfg -a0 Logical Drive : 0( Adapter: 0 ): Status: OPTIMAL --------------------------------------------------- SpanDepth :01 RaidLevel: 5 RdAhead : Adaptive Cache: DirectIo StripSz :064KB Stripes : 6 WrPolicy: WriteBack Logical Drive 0 : SpanLevel_0 Disks Chnl Target StartBlock Blocks Physical Target Status ---- ------ ---------- ------ ---------------------- 0 00 0x00000000 0x1113e000 ONLINE 0 01 0x00000000 0x1113e000 ONLINE 0 02 0x00000000 0x1113e000 ONLINE 0 03 0x00000000 0x1113e000 ONLINE 0 04 0x00000000 0x1113e000 ONLINE 0 05 0x00000000 0x1113e000 ONLINE
Детальная информация о физических дисках
# /usr/lib64/nagios/plugins/megarc -phys -chAll -idAll -a0
Добавим в Nagios проверку RAID при помощи nrpe и вот этого скрипта check_megaraid
Сделаем файл исполняемым и перенесем в папку
/usr/lib/nagios/plugins для 32-битных систем /usr/lib64/nagios/plugins"для 64-битных систем
# chmod +x check_megaraid # mv check_megaraid /usr/lib64/nagios/plugins
Проверим скрипт
# /usr/lib64/nagios/plugins/check_megaraid RAID OK: All arrays OK [1 array checked on 1 controller]
Добавим на хост машине в /etc/nagios/nrpe.cfg
command[check_megaraid]=sudo /usr/lib64/nagios/plugins/check_megaraid
Проверяем от какого пользователя работает nrpe
# ps waux | grep nrpe nagios 293884 0.0 0.0 39972 1040 ? Ss 12:26 0:00 nrpe -c /etc/nagios/nrpe.cfg -d
Добавим пользователя nagios в sudoers, для этого пропишем, командой visudo, строчку в /etc/sudoers, вместе с #
#includedir /etc/sudoers.d
# tail -n 2 /etc/sudoers #includedir /etc/sudoers.d
Создаем директории и файл со следующим содержанием
# mkdir /etc/sudoers.d # touch /etc/sudoers.d/nrpe # cat /etc/sudoers.d/nrpe Defaults:nagios !requiretty nagios ALL=(ALL) NOPASSWD: /usr/lib64/nagios/plugins/
Перестартуем nrpe
# service nrpe restart Shutting down Nagios NRPE daemon (nrpe): [ OK ] Starting Nagios NRPE daemon (nrpe): [ OK ]
На сервере Nagios в /etc/nagios/hosts/TEST.cfg пропишем проверку сервиса
define service{ use generic-service host_name TEST service_description RAID is_volatile 0 check_period 24x7 max_check_attempts 3 normal_check_interval 1 retry_check_interval 1 contact_groups admins notification_interval 120 notification_period 24x7 notification_options c,r check_command check_nrpe!check_megaraid }
Перестартуем Nagios
# service nagios reload nagios (pid 30941 20004) is running... Reloading nagios: [ OK ]
Результат