Проверяем какой RAID стоит на сервере
# lspci -v | grep RAID
02:0e.0 RAID bus controller: Dell PowerEdge Expandable RAID controller 4 (rev 06)
        Subsystem: Dell PowerEdge Expandable RAID Controller 4e/Di
Мониторить Perc 4e/Di будем с помощью megarc
**********************************************************************
 MEGARC MegaRAID Configuration Utility(LINUX)-1.11(12-07-2004)
 By LSI Logic Corp.,USA
**********************************************************************
Скачиваем архив ut_linux_megarc_1.11.zip
Распаковываем, переносим и делаем файлы исполняемыми
# unzip ut_linux_megarc_1.11.zip # mv megarc megarc.bin /usr/lib64/nagios/plugins # cd /usr/lib64/nagios/plugins # chmod +x megarc megarc.bin
Посмотреть информацию о контроллере
# /usr/lib64/nagios/plugins/megarc -ctlrInfo -a0
**********************************************************************
        Information of Adapter-0 (#Adapter(s) on system: 1)
**********************************************************************
        Firmware Version : 516A         BIOS Version : H418
        Logical Drives : 01             DRAM : 256MB
        Rebuild Rate : 30%
        Flush Interval : 4 secs
        Number Of Chnls : 2             Bios Status : Enabled
        Alarm State : Absent            Auto Rebuild : Enabled
        FW : SPAN-8, 40-LD              BIOS Config AutoSelection : USER
        BIOS Echos Mesg : ON            BIOS Stops On Error : ON
        Initiator Id : 7(Clustered Firmware)
**********************************************************************
Состояние дисков и RAID
# /usr/lib64/nagios/plugins/megarc -dispCfg -a0 Logical Drive : 0( Adapter: 0 ): Status: OPTIMAL --------------------------------------------------- SpanDepth :01 RaidLevel: 5 RdAhead : Adaptive Cache: DirectIo StripSz :064KB Stripes : 6 WrPolicy: WriteBack Logical Drive 0 : SpanLevel_0 Disks Chnl Target StartBlock Blocks Physical Target Status ---- ------ ---------- ------ ---------------------- 0 00 0x00000000 0x1113e000 ONLINE 0 01 0x00000000 0x1113e000 ONLINE 0 02 0x00000000 0x1113e000 ONLINE 0 03 0x00000000 0x1113e000 ONLINE 0 04 0x00000000 0x1113e000 ONLINE 0 05 0x00000000 0x1113e000 ONLINE
Детальная информация о физических дисках
# /usr/lib64/nagios/plugins/megarc -phys -chAll -idAll -a0
Добавим в Nagios проверку RAID при помощи nrpe и вот этого скрипта check_megaraid
Сделаем файл исполняемым и перенесем в папку
/usr/lib/nagios/plugins для 32-битных систем /usr/lib64/nagios/plugins"для 64-битных систем
# chmod +x check_megaraid # mv check_megaraid /usr/lib64/nagios/plugins
Проверим скрипт
# /usr/lib64/nagios/plugins/check_megaraid RAID OK: All arrays OK [1 array checked on 1 controller]
Добавим на хост машине в /etc/nagios/nrpe.cfg
command[check_megaraid]=sudo /usr/lib64/nagios/plugins/check_megaraid
Проверяем от какого пользователя работает nrpe
# ps waux | grep nrpe nagios 293884 0.0 0.0 39972 1040 ? Ss 12:26 0:00 nrpe -c /etc/nagios/nrpe.cfg -d
Добавим пользователя nagios в sudoers, для этого пропишем, командой visudo, строчку в /etc/sudoers, вместе с #
#includedir /etc/sudoers.d
# tail -n 2 /etc/sudoers #includedir /etc/sudoers.d
Создаем директории и файл со следующим содержанием
# mkdir /etc/sudoers.d # touch /etc/sudoers.d/nrpe # cat /etc/sudoers.d/nrpe Defaults:nagios !requiretty nagios ALL=(ALL) NOPASSWD: /usr/lib64/nagios/plugins/
Перестартуем nrpe
# service nrpe restart Shutting down Nagios NRPE daemon (nrpe): [ OK ] Starting Nagios NRPE daemon (nrpe): [ OK ]
На сервере Nagios в /etc/nagios/hosts/TEST.cfg пропишем проверку сервиса
define service{
               use                           generic-service
               host_name                     TEST
               service_description           RAID
               is_volatile                   0
               check_period                  24x7
               max_check_attempts            3
               normal_check_interval         1
               retry_check_interval          1
               contact_groups                admins
               notification_interval         120
               notification_period           24x7
               notification_options          c,r
               check_command                 check_nrpe!check_megaraid
}
Перестартуем Nagios
# service nagios reload nagios (pid 30941 20004) is running... Reloading nagios: [ OK ]
Результат
