在硬盘规格中,有一项常见的指标“MTTF”,即“平均无故障时间”,或者说“失效前平均时间”。一般来说,这一时间能达到上百万小时,不过卡内基梅隆大学在旧金山的第五届USENIX Conference大会上指出,对大约10万块硬盘进行研究后的结论是:硬盘产品的实际失效几率是MTTF指标的15倍之多。
如果按照MTTF为100-150万小时计算,那么即使在最坏的情况下,硬盘每年的失效率不过0.88%,但卡内基梅隆大学的研究人员在研究了各种大型生产系统、互联网服务网站等地的硬盘后发现,实际数字一般都会超过1%,通常在2-4%左右,在某些极端情况下甚至高达13%以上,甚至24%。
研究还发现,更快、更贵的光纤通道硬盘并不一定就比普通SATA硬盘更可靠。另外,大概50%之多的返修硬盘实际上都没有任何问题,分析人士和硬盘厂商也有类似观点。
研究人员之一Garth Gibson指出,他们这份报告的目的不仅是敦促硬盘厂商改进产品设计,更希望他们能同时改善产品测试。他还表示,他们并非要区分各家硬盘厂商的质量高低,也不是追踪硬盘的实际故障率,而是给用户一个参考,让大家明白硬盘可能会在什么时候出现问题。
大会上的另一项报告则提出,对Google数据中心硬盘的研究发现,温度因素对硬盘可靠性的影响看起来微乎其微。
注:
Failure:失效
Fault:故障
MTBF:平均失效间隔时间,定义为失效或维护中所需要的平均时间。
MTTF:失效前平均时间,定义为随机变量、出错时间等的“期望值”。
MTTR:平均恢复前时间,定义为随机变量恢复时间得期望值。
MTBF = MTTF + MTTR (MTTR通常远小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代)