Category Archives: RAID Monitoring

Dell PowerEdge 2850 Perc 4e/Di RAID monitoring Nagios

Проверяем какой RAID стоит на сервере

# lspci -v | grep RAID
02:0e.0 RAID bus controller: Dell PowerEdge Expandable RAID controller 4 (rev 06)
        Subsystem: Dell PowerEdge Expandable RAID Controller 4e/Di

Мониторить Perc 4e/Di будем с помощью megarc
**********************************************************************
MEGARC MegaRAID Configuration Utility(LINUX)-1.11(12-07-2004)
By LSI Logic Corp.,USA
**********************************************************************

Скачиваем архив ut_linux_megarc_1.11.zip
Распаковываем, переносим и делаем файлы исполняемыми

# unzip ut_linux_megarc_1.11.zip
# mv megarc megarc.bin /usr/lib64/nagios/plugins
# cd /usr/lib64/nagios/plugins
# chmod +x megarc megarc.bin

Посмотреть информацию о контроллере

# /usr/lib64/nagios/plugins/megarc -ctlrInfo -a0
**********************************************************************
        Information of Adapter-0 (#Adapter(s) on system: 1)
**********************************************************************
        Firmware Version : 516A         BIOS Version : H418
        Logical Drives : 01             DRAM : 256MB
        Rebuild Rate : 30%
        Flush Interval : 4 secs
        Number Of Chnls : 2             Bios Status : Enabled
        Alarm State : Absent            Auto Rebuild : Enabled
        FW : SPAN-8, 40-LD              BIOS Config AutoSelection : USER
        BIOS Echos Mesg : ON            BIOS Stops On Error : ON
        Initiator Id : 7(Clustered Firmware)
**********************************************************************

Состояние дисков и RAID

# /usr/lib64/nagios/plugins/megarc -dispCfg -a0
Logical Drive : 0( Adapter: 0 ):  Status: OPTIMAL
---------------------------------------------------
SpanDepth :01     RaidLevel: 5  RdAhead : Adaptive  Cache: DirectIo
StripSz   :064KB   Stripes  : 6  WrPolicy: WriteBack
Logical Drive 0 : SpanLevel_0 Disks
Chnl  Target  StartBlock   Blocks      Physical Target Status
----  ------  ----------   ------      ----------------------
0      00    0x00000000   0x1113e000   ONLINE
0      01    0x00000000   0x1113e000   ONLINE
0      02    0x00000000   0x1113e000   ONLINE
0      03    0x00000000   0x1113e000   ONLINE
0      04    0x00000000   0x1113e000   ONLINE
0      05    0x00000000   0x1113e000   ONLINE

Детальная информация о физических дисках

# /usr/lib64/nagios/plugins/megarc -phys -chAll -idAll -a0

Добавим в Nagios проверку RAID при помощи nrpe и вот этого скрипта check_megaraid

Сделаем файл исполняемым и перенесем в папку

/usr/lib/nagios/plugins для 32-битных систем
/usr/lib64/nagios/plugins"для 64-битных систем
# chmod +x check_megaraid
# mv check_megaraid /usr/lib64/nagios/plugins

Проверим скрипт

# /usr/lib64/nagios/plugins/check_megaraid
RAID OK: All arrays OK [1 array checked on 1 controller]

Добавим на хост машине в /etc/nagios/nrpe.cfg

command[check_megaraid]=sudo /usr/lib64/nagios/plugins/check_megaraid

Проверяем от какого пользователя работает nrpe

# ps waux | grep nrpe
nagios    293884  0.0  0.0  39972  1040 ?        Ss   12:26   0:00 nrpe -c /etc/nagios/nrpe.cfg -d

Добавим пользователя nagios в sudoers, для этого пропишем, командой visudo, строчку в /etc/sudoers, вместе с #

#includedir /etc/sudoers.d
# tail -n 2 /etc/sudoers
#includedir /etc/sudoers.d

Создаем директории и файл со следующим содержанием

# mkdir /etc/sudoers.d
# touch /etc/sudoers.d/nrpe
# cat /etc/sudoers.d/nrpe
Defaults:nagios !requiretty
nagios      ALL=(ALL)   NOPASSWD:   /usr/lib64/nagios/plugins/

Перестартуем nrpe

# service nrpe restart
Shutting down Nagios NRPE daemon (nrpe):                   [  OK  ]
Starting Nagios NRPE daemon (nrpe):                        [  OK  ]

На сервере Nagios в /etc/nagios/hosts/TEST.cfg пропишем проверку сервиса

define service{
               use                           generic-service
               host_name                     TEST
               service_description           RAID
               is_volatile                   0
               check_period                  24x7
               max_check_attempts            3
               normal_check_interval         1
               retry_check_interval          1
               contact_groups                admins
               notification_interval         120
               notification_period           24x7
               notification_options          c,r
               check_command                 check_nrpe!check_megaraid
}

Перестартуем Nagios

# service nagios reload
nagios (pid 30941 20004) is running...
Reloading nagios:                                          [  OK  ]

Результат