S.M.A.R.T. - Když disk něco bolí...

S.M.A.R.T.

S.M.A.R.T. je zkratka pro Self-Monitoring Analysis and Reporting Technology. Do češtiny bychom to mohli velmi volně přeložit jako samokontrolní mechanismus. Ten je integrován ve všech moderních pevných discích, přičemž "moderní" zde znamená cca. od druhé poloviny devadesátých let. Nečekejte S.M.A.R.T. na discích kapacit v řádu stovek MB či prvních "gigových" discích. Ale již třeba některé 4GB disky ho mají.

Úkolem S.M.A.R.T. je nezávisle na operačním systému či jiném hardware monitorovat stav pevného disku. Hlídají se některé základní ukazatele, jejichž pravidelným sledováním lze předpovědět problémy pevného disku. I některé těžko předvídatelné problémy se mohou projevit změnou některých vlastností - S.M.A.R.T. je dobré cca. jednou týdně zběžně prohlédnout, zda se něco nezměnilo a pokud ano, problém vyhodnotit.

Význam položek

Co je důležité sledovat? Některé položky jsou více méně informativní, jiné klíčové.

 

Raw Read Error Rate Počet chybných čtení dat z plotny. Disk běžně má problémy se čtením dat, což koriguje pomocí ECC a opakovaného čtení. U některých disků (typicky Seagate) se počítá celkový počet chybných čtení (tedy hodnota rychle roste), u jiných disků pouze počet čtení, které nebylo možné opravit (v takovém případě by měla být Raw hodnota rovna nule, v opačném případě rychle zálohujte).
Spin Up Time Čas potřebný k roztočení ploten. S časem se zhoršuje, avšak poměrně pomalu. Náhlá změna značí poškození motorku otáčejícího plotny.
Start/Stop Count Počet startů plotny, hodnota v Raw udává kumulovaný součet. Motorek by měl vydržet cca. 50 tisíc startů.
Reallocated Sector Count Počet přemapovaných sektorů z původní do záložní oblasti disku. Ideální hodnota je nula. Při rychlých nárůstech či vysokých hodnotách zálohujte.
Seek Error Rate Počet chybných seeků (přemísťování hlavy nad stopu plotny). U většiny disků by mělo být rovno nule, jinak potřeba zálohovat.
Seek Time Performance Rychlost seekování. Neobvyklé změny hodnoty značí problémy se čtecí / zapisovací hlavou.
Power On Hours Count Počet odpracovaných provozních hodin. V Raw je počet uběhnutých časových jednotek, což u některých disků bývá počet hodin (v hex), u jiných to ale mohou být např. pětiminutové intervaly.
Spin Retry Count Počet opakovaných pokusů o roztočení ploten. Pokud není rovno nule, zálohujte.
Calibration Retry Count Počet opakovaných pokusů o rekalibraci. Mělo by být rovno nule.
Power Cycle Count Obdoba Start/Stop Count. U některých disků stejná hodnota, u jiných rozdílná v závislosti na různých faktorech (např. odlišováno vypnutí a Suspend-to-RAM).
Temperature Teplota disku (ve Value). Raw má někdy stejnou hodnotu jako Value, jindy neidentifikovatelné číslo. Worst udává nejvyšší kdy dosaženou teplotu.
Hardware ECC Recovered Počet opravených chybných čtení (viz. Raw Read Error Rate). Obvykle rychle roste, což ale není na škodu.
Reallocated Event Count Počet sektorů k přealokování (1 sektor = 512 byte). Jakákoliv hodnota vyšší než nula značí problémy.
Current Pending Sector Počet sektorů, jejichž stav je podezřelý. Po spuštění diagnostických utilit bývá obvykle použití sektoru zakázáno a tento nahrazen jiným sektorem ze záložní oblasti. Current Pending Sector se proto vynuluje a o stejnou hodnotu vzroste Reallocated Sector Count.
Offline Correctable Počet problémových sektorů, které je možné nahradit ze záložní oblasti. Pokud hodnota není stejná jako Reallocated Event Count, značí to závažné problémy disku, které nelze ošetřit ani diagnostickými utilitami. V takovém případě je třeba disk reklamovat.
UltraATA CRC Error Rate Počet chyb v komunikaci s řadičem. V Raw je kumulováno počet těchto chyb. Pokud není nula, značí to problémy s kabelem (poškození vodičů, přílišné rušení atp.) či problémy řadiče samotného - například při přetaktování.
Soft Read Error Rate ???. Hodnota rozdílná od nuly značí problémy.