Hardware ecc recovered что это




Купил винт samsung hd080hj и в смарте постоянно растёт hardware ecc recovered параметр (c3). Это опасно? Всё остальное в норме. Стоит ли сходить в сервис на тестирование? Когда включаю режим передачи sata1, количество этих значений существенно меньше, но всё равно десятки тысяч за каждые пару минут. Можно было бы игнорировать, но если смарт пишется на диск, то значит вскоре служебная область будет с бэдами при такой активной записи смарта. Что делать?

пару слов о матплате.
были случаи с кривыми контроллерами. винчи мерли как мухи

(812)764-49-31 с 11 до 20ч
(с)Eurocomp
Михаил

А смарт вообще насколько часто эти значения в служебку пишет? Если иногда под несколько тысяч в секунду набегает этих значений, они ведь никак не могут постоянно дописываться. Может он их вообще не вписывает и хранит временно, ведь они сбрасываются при перезагрузке. У кого спросить?

BorisV_ писал(а): А смарт вообще насколько часто эти значения в служебку пишет? Если иногда под несколько тысяч в секунду набегает этих значений, они ведь никак не могут постоянно дописываться. Может он их вообще не вписывает и хранит временно, ведь они сбрасываются при перезагрузке. У кого спросить?

(812)764-49-31 с 11 до 20ч
(с)Eurocomp
Михаил

BorisV писал(а): Купил винт samsung hd080hj и в смарте постоянно растёт hardware ecc recovered параметр (c3). Это опасно? Всё остальное в норме. Стоит ли сходить в сервис на тестирование? Когда включаю режим передачи sata1, количество этих значений существенно меньше, но всё равно десятки тысяч за каждые пару минут. Можно было бы игнорировать, но если смарт пишется на диск, то значит вскоре служебная область будет с бэдами при такой активной записи смарта. Что делать?

У меня тоже такое есть, но я не волнуюсь, т.к. диск наработал более 20000 часов и ни каких проблем не было с ним.

afonja
Житель форума Сообщения: 2193 Зарегистрирован: 11-08-2003 01:43 Откуда: Ленинград Конфигурация ПК: ASRock Z68 EXTREME7 GEN3/ i5-2500K/ Archon rev.A/16Gb 1600MHz G.SKILL Ripjaws X Series/ HD6950@6970 Sapphire 2048Mb CF/ HDD: 2Tb, 1.5Tb, 1Tb, 500Gb, 320Gb / SSD 120Gb Intel/ Tt Grand 1050W/ X-Fi Titanium Fatal1ty Champion/ LG L245WP
  • Профиль
  • Сайт

Узверь
Винт пробовал переформатировать (до использования hutil) и в винде (winxp) и из доса, без разницы. Сандра написала про деактивированный смарт (случайно наткнулся), остаётся грешить на hutil, типа он вырубил запись смарта и сбросил (а может сандра сглючила, но зависимость после hutil слишком заметна), хотя в биосе он типа включен, ну выключил и включил снова, так сразу опять при тестах поверхности возникают Raw Read Error Rate примерно в тех же областях, что и раньше.
Подскажите, чем бы отловить эти области, чтоб попробовать на них своп кинуть для стресс теста?

И еще маленький вопросик, правда ли, что своп надежнее кидать на край блинов винта (в ущерб скорости) из-за меньшей плотности?

forum.lissyara.su

собсно стоит сабж валит в лог от такую весчь

Oct 1 02:04:36 smartd#91;2022#93;: Device: /dev/sda, SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 73 to 71
Oct 1 02:04:36 smartd#91;2022#93;: Device: /dev/sda, SMART Usage Attribute: 194 Temperature_Celsius changed from 27 to 29
Oct 1 02:04:36 smartd#91;2022#93;: Device: /dev/sda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 82 to 75


с температурой еще понятно, а вот со 195 статусом чето не ясно.
мб подскажет кто?

ну по идеи это изменяются атрибуты смарта

Нефиг_чем_заняться проходил мимо

smash_necros писал(а): с температурой еще понятно, а вот со 195 статусом чето не ясно.
мб подскажет кто?

Жестяки всегда записывают на блины информацию с избыточностью, чтобы автоматически корректировать ошибки. Параметр Hardware_ECC_Recovered как раз за это и отвечает. С другой стороны не стоит особо опираться на этот параметр, т.к. для современных винтов самовосстановление данных - это нормальный режим работы, а во вторых - отсутствие жесткой спецификации на этот параметр, в результате чего, на разных производителях показания могут разница на несколько порядков. (Пример: двухмесячный сигейт-2ТБ кажет - аж 239169261, но работает как часики).

Самые страшные параметры за которыми следует пасти:

№ 5 (Reallocated_Sector_Ct)
№ 187 (Reported_Uncorrect)
№ 197 (Current_Pending_Sector)


Особенно 5-й параметр, если там начали появляться циферки и стабильно расти, то винтяра готовиться переходить в мир иной.
Если же там циферки появились, но долгое время не ползут вверх, то это как правило результат варварства - когда включенную машину пытаются: двигать, переставлять, ронять.
Это говорит о том, что головка чиркнула по блину и поцарапала ее до такого состояния, что CRC уже не может восстановить данные в этом месте, ШДД в этом случае отбраковывает этот сектор и заменяет резервным.

Кстати, чтобы не засирать лог беспонтовыми данными, как то температура поднялась на 5 градусов, потом опустилась(т.е. нормальные изменения) есть ключик -W которому надо сказать, чтобы смарт начинал орать только тогда, когда температура вышла за стремный барьер.

According to Steve Gibson of Spinrite fame, SMART values have to be taken over time, not as instantaneous readings. That means, a value of 47 isn't necessarily bad if the value has been 47 for months. However if the value was 42 an hour ago, and its climbing rapidly, then that means the drive is experiencing difficulty accessing part of the data and may soon be unable to read the sector at all. Depending on the value of the data on that drive you may wish to replace it.

answered Jun 26 '09 at 6:56

First, lower values are worse for SMART, not higher values (notice how the threshold column is always lower than the current value). So, a value increasing is no cause for worry. (This rule does not apply to the raw values, however.)

SMART values tend to oscillate a bit (yours might be in the edge between 46 and 47, for instance, so even small changes could cause it to flip to the other value).

Your smartctl -a output shows the worst this value has been is 45, so it oscilating slightly above it is normal.

For more information, take a look at Wikipedia: ATA S.M.A.R.T. attributes .

Keep in mind that even the extensive study that Google conducted found that a large number of drive failures were not predicted by SMART errors. It's possible what you see is perfectly normal, but as each manufacturer has different metrics for converting the raw values into the reported values it is hard to say for sure if your drive is experiancing a lot of errors or not. However, a raw number that large does strike me as odd.

I would recommend reading all of the drive (dd or rsync'ing to a new drive) and check the SMART values as it goes along. If you see that raw number, or the reported values, change a lot I'd start looking to replace the drive.

answered Jun 26 '09 at 17:28

IIRC Hardware ECC recovered is error correction on disk reads, which isn't unusual for a disk, and they encode the data with error correction mechanisms for precisely this reason. Some controllers also support redundant information in disk sectors and add another layer of error correction.

As Dave Cheney states the figures should be monitored over time. Radical changes in these statistics are an indication of a failing drive. Also, keep an eye on grown defect lists - if the grown defect list starts to grow or the SMART statistics start to change significantly then you should prophylactically replace the drive.

answered Jun 26 '09 at 10:55

lol, prophylactically – Dave Cheney Jun 26 '09 at 17:27

A high value for this attribute is actually pretty good:

Hardware ECC Recovered S.M.A.R.T. parameter indicates time between ECC-corrected errors.

Источники: http://phorum.key.ru/viewtopic.php?t=40231, http://forum.lissyara.su/viewtopic.php?t=28791, http://serverfault.com/questions/32027/should-i-be-concerned-about-a-high-smart-hardware-ecc-recovered-value




Комментариев пока нет!

Поделитесь своим мнением