Мониторинг жестких дисков через smartd +

st3500418as

S.M.A.R.T. (англ. Self-Monitoring, Analysis and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Задумался тут давеча, что необходимо бы мониторить свой единственный жесткий диск и знать, когда готовиться к покупке замены. Самодиагностика для этого самое оно.

Для анализа нам понадобится всего лишь один пакет:

$ sudo apt-get install smartmontools

Теперь проверим что нам скажет SMART:

$ sudo smartctl -i /dev/sda

Нас интересует самое главное:

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Если SMART отключен, то включаем его:

$ sudo smartctl -s on /dev/sda

Теперь настраиваем автоматический мониторинг. Для этого нужно добавить строчку в файл /etc/smartd.conf:

/dev/sda -a -I 194 -W 4,45,55 -R 5 -m dmitriy@lyalyuev.pp.ua -o on -S on -s (S/../.././22|L/../../6/23)

По указанным ключам я расскажу немного позже, а пока включаем демон smartd. Делается это очень просто, необходимо раскомментировать строчку в файле /etc/default/smartmontools:

start_smartd=yes

Запускаем демона:

$ sudo /etc/init.d/smartmontools start

и проверяем подцепил ли он наш диск:

$ sudo tail -100 /var/log/syslog | grep smartd

Нас интересует одна строка:

Device: /dev/sda, is SMART capable. Adding to "monitor" list.

Диск добавлен в список мониторинга. Чего мы и добивались. А теперь самое интересное — ключи мониторинга и реагирования:

-d TYPE Тип устройства: ata, scsi, marvell, removable, 3ware,N, hpt,L/M/N
-T TYPE допустимое отклонение: normal, permissive
-o VAL Включает/выключает автоматические оффлайн тесты (on/off)
-S VAL Включает/выключает автосохранение атрибутов (on/off)
-n MODE Не проверять. Один из режимов: never, sleep, standby, idle
-H Мониторить SMART статус, уведомлять только при ошибках.
-l TYPE Мониторить SMART логи. Режимы: error, selftest
-f Монитор отказа для любых атрибутов ‘Usage’
-m ADD Письмо с варнингами на ADD для -H, -l error, -l selftest, and -f
-M TYPE Изменение поведения отсыла е-майлов (см. ман)
-s REGE Запустить тест когда дата совпадает с регулярным выражением (см. ман)
-p Сообщать о изменениях в ‘Prefailure’ атрибутах
-u ообщать о изменениях в ‘Usage’ атрибутах
-t Эквивалентно -p и -u директивам
-r ID Также сообщать ‘RAW’ значения атрибутов ID с -p, -u или -t
-R ID Следить за изменениями в атрибуте ID ‘Raw’ значения -p, -u or -t
-i ID Игнорировать атрибут ID для -f директивы
-I ID Игнорировать атрибут ID для -p, -u или -t директивы
-C ID Рапортовать если счётчик `ждущих` секторов не равен нулю
-U ID Рапортовать если счётчик `некорректируемых` секторов не равен нулю
-W D,I,C Monitor Temperature D)ifference, I)nformal limit, C)ritical limit
-v N,ST Mодифицировать метку для атрибута N (для нестандартных атрибутов)
-a Дефолт: эквивалентно -H -f -t -l error -l selftest -C 197 -U 198
-F TYPE Для ошибок в прошивке. Значения: none, samsung
-P TYPE Предустановки для диска: use, ignore, show, showall
# Комментарии: текст после него игнорируется
\ Продолжения строки
Идентификатор атрибута является десятичное целое число 1 за исключением -C и -U, где ID = 0 выключает их.
Все биты -d, -m и -M директивы реализуются только для устройств ATA.

Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

6 комментариев(я)

(Обязательно)
(Обязательно, не публикуется)

Яндекс.Метрика beget