Использовании S.M.A.R.T. для диагностики здоровья HDD в видеонаблюдении

16 мая 2022, 13:42

Для оценки работоспособности жестких дисков в видеонаблюдении и не только, используется технология S.M.A.R.T. (от англ. self-monitoring, analysis and reporting technology — технология самоконтроля, анализа и отчетности) — технология оценки состояния жесткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Посмотреть значение S.M.A.R.T.  в видеорегистраторах Tantos можно в Главное меню – Обслуживание – Диск – S.M.A.R.T.

Система S.M.A.R.T. использует пять значений, по которым можно определить состояние жесткого диска:

ID - идентификатор

Атрибут - имя атрибута

Значение - идентификатор атрибута

Худший - текущее значение атрибута

Порог - минимальное пороговое значения атрибута

RAW значение - абсолютное значение атрибута

Для разных дисков набор атрибутов может меняться, но основные атрибуты присутствуют всегда.

01 Raw Read Error Rate — (188818081) количество ошибок, возникших при чтении. Существует некоторые отличия в формировании значения данного атрибута разными производителями. Диски Seagate и Toshiba могут иметь гигантское значение RAW этого атрибута, реально будучи в хорошем состоянии, а диски Western Digital могут иметь его нулевым, имея критические показатели по другим характеристикам. Неоднозначный показатель.

03 Spin-Up Time — (92) время раскрутки шпинделя до рабочих оборотов. Чем быстрее раскручивается шпиндель, тем лучше — значит, двигатель и механическая часть в порядке. Малоинформативный показатель.

04 Start/Stop Count — (767) количество полных остановок и раскручиваний шпинделя. Этот параметр позволяет определить количество включений и отключений диска (767 раз) и косвенно оценить стабильность электропитания.

05 Reallocated Sector Count — (10955) количество переназначенных секторов. Современные жесткие диски имеют довольно большую (тысячи секторов) резервную область поверхности накопителя для использования ее в случае ухудшения характеристик секторов из основной зоны. Если диск обнаруживает проблемы с записью/считыванием какого - либо сектора, то он автоматически перемещает эти данные в резервную область, а данный сектор помечается как "переназначенный". Часто этот процесс называют remapping. Поле RAW значение содержит общее количество переназначенных секторов. Если это значение ненулевое и вы замечаете стабильный рост значения этого атрибута — жесткий диск требует замены.

07 Seek Error Rate — (965483183) частота появления ошибок позиционирования блока магнитных головок (БМГ). Накопитель контролирует правильность установки головок на требуемую дорожку поверхности. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Существует некоторые отличия в формировании значения данного атрибута разными производителями. Накопители Seagate и Toshiba могут иметь гигантское значение RAW этого атрибута, реально будучи в хорошем состоянии, а накопители Western Digital могут иметь его нулевым, имея критические показатели по другим характеристикам. Неоднозначный показатель.

09 Power-On Time Count — (38998) общее количество времени наработки накопителя (в часах).

Чем больше наработка, тем больше вероятность выхода HDD из строя.

010 Spin Retry Count — (0) количество повторных попыток старта шпинделя. После включения питания, накопитель раскручивает диски и контролирует достижение рабочей скорости вращения для данного устройства (например, 5400, 7200 об/мин.) за определенное время. В случае неудачи - увеличивается счетчик повторов и повторяется попытка старта. Малоинформативный показатель.

12 Power Cycle Count — (203) почти то же самое, что и Start/Stop Count, обозначает количество полных включений/выключений устройства.

184 End-to-End error — (0) отображает количество ошибок, возникающих во время передачи данных через кэш диска. Малоинформативный показатель.

187 Reported Uncorrectable Error — (37) характеризует количество ошибок, которые не были исправлены микропрограммой накопителя. Малоинформативный показатель.

188 Command Timeout — (1966116) количество прерванных операций в связи с отсутствием ответа от диска. Обычно это значение атрибута должно быть равно нулю, и, если значение гораздо выше нуля, то, возможными причинами могут быть проблемы с питанием или при использовании некачественных кабелей, несовместимости с контроллером.

189 High Fly Writes — (0) значение, отображающее количество зафиксированных процессов записи при скорости движения головки выше рассчитанной. Вызывается чаще всего внешними воздействиями, например, вибрацией. Малоинформативный показатель.

190 Airflow Temperature – Температура внутри корпуса жесткого диска. Указаны минимальное (24), текущее (41) и максимальное значения (76), а также рекомендуемый порог (45), который желательно не превышать.

191 G-Sensor Shock Count – (0) количество механических ударов.

192 Power-off retract count – (216) в зависимости от того HDDкакого производителя вы используете, может отображать один из следующих параметров: либо суммарное количество парковок блока магнитных головок в аварийных ситуациях, либо суммарное количество циклов включения и выключения питания HDD.

193 Load Cycle Count – (776) количество циклов перемещения блока магнитных головок в зону парковки. Ели значение параметра ненулевое, можно утверждать, что парковка включена. Малоинформативный показатель.

194  Temperature Celsius– температура самого накопителя(а не температура внутри корпуса HDD, как в 190 Airflow Temperature). В данном атрибуте хранятся показания встроенного температурного датчика, которым обычно служит одна из магнитных головок (как правило - нижняя ). Данные, записанные в полях атрибута отображают текущую (24), минимальную (24) и максимальную (59) температуру.

197 Current Pending Sector – (28189) текущее количество нестабильных секторов. Поле Raw значение этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает кандидатами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка кандидатов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped). Если это значение ненулевое и вы замечаете стабильный рост значения этого атрибута — жесткий диск требует замены.

198 Offline Uncorrectable – (28189) счетчик некорректируемых ошибок. Это ошибки, которые не были исправлены внутренними средствами коррекции оборудования накопителя. Может быть вызвано неисправностью отдельных элементов или отсутствием свободных секторов в резервной области диска, когда возникла необходимость переназначения. Если это значение ненулевое и вы замечаете стабильный рост значения этого атрибута — жесткий диск требует замены.

199 UltraDMA CRC Error Count – (3923) отображает количество ошибок, возникших во время передачи данных по кабелю в режиме UltraDMA от контроллера платы до контроллера диска. Рост значения данного параметра в большинстве случаев говорит о плохом качестве шлейфа передачи данных

Скачать данную статью в формате pdf