backblaze 2019年硬盘故障率统计报告

  • 2020年3月15日
  • 2020年3月15日
  • 杂谈

截至2019年12月31日,Backblaze拥有124,956块机械硬盘。其中有2229个系统盘和122658个数据存储盘。
这篇统计着眼于backblaze数据中心中运行的数据硬盘型号的硬盘硬盘故障率,以及新加入的12TB,14TB及16TB型号的性能。

2019年按制造商和制造商分类的硬盘故障率

2019 backblaze drive stats

有151个硬盘(122,658减去122,507)未包括在上面的列表中。这些硬盘要么用于测试,要么在2019年第四季度总运行时间没有达到5000硬盘日。5000硬盘日的标准是为了消除偶然情况对统计的影响。

唯一在2019年没有出现故障的硬盘是东芝4TB,型号:MD04ABA400V。但是数据样本仍然很小,假如一年中只有1个该型号硬盘发生故障,那么这款硬盘的年故障率(AFR)将从0变成0.92%,这是一个不算低的数值。
东芝14TB硬盘(型号MG07ACA14TA)表现良好,AFR为0.65%,与一直以来表现最优秀的HGST硬盘的故障率相似。
希捷6TB和10TB硬盘仍然表现出色,年故障率分别为0.96%和1.00%,低于平均值。
所有硬盘2019年的总体AFR为1.89%,远高于2018年。我们将在本文的后面部分讨论。

希捷16TB硬盘

在2019年第四季度,backblaze开始对型号为ST16000NM001G的Seagate 16TB硬盘进行测试。截止到第四季度末,一共有40个该型号硬盘投入运行,总共有1,440个硬盘日(远低于我们第四季度的5,000个硬盘日阈值,因此他们没有进入2019年排行榜)。直到12月31日这批硬盘的故障率为0%,目前为止看上去很好。如果这批硬盘最终能通过测试,那么它们将会在2020年用于替换以前的12TB型号。

东芝8TB硬盘

在2019年第四季度,有20个东芝8TB硬盘,型号:HDWF180。这些硬盘已经安装了将近两年。在第四季度,他们只有1,840个硬盘日,低于报告阈值。但是整个生命周期中共有13,994个硬盘日,只有1个硬盘故障,因此AFR为2.6%。该型号硬盘数量极少的原因是当东芝开始批量供货时,12TB硬盘的单位容量价格已经降到和这款8TB相同,所以backblaze选择了密度更高的产品。之后backblaze会向16TB硬盘迁移,所以很可能不会再购买这些小容量硬盘。

HGST 10TB硬盘

运行中的20个HGST 10TB硬盘,型号:HUH721010ALE600。这些硬盘已经使用了一年多。它们与Seagate 10TB盘位于同一存储节点中。自安装以来,HGST硬盘一共运行了8,042个硬盘日,没有发生任何故障。但是与东芝8TB一样,以后不太可能再购买这些10TB硬盘。

东芝16TB硬盘

backblaze在2019年投入了20块东芝16TB硬盘,型号:MG08ACA16TA。目前仍然在测试中,所以没有出现在这次的统计数据里。

与之前年份的比较

比较2017年,2018年和2019年的硬盘硬盘统计信息
下表比较了过去三年中每年的年度故障率(AFR)。

2017-2019年年度硬盘故障率
backblaze 3year drive stats

2019年AFR总体上升

2019年的总AFR显著上升。从2018年到2019年,大约75%的不同硬盘型号的AFR有所增加。这一增长背后有两个主要驱动因素。

首先,随着年龄的增长,8TB硬盘作为一个群体似乎正面临中年危机,每种型号都表现出最高的故障率。而且这些硬盘数量庞大,占到了所有硬盘的1/4,所以它们故障率的提高对总体AFR也有较大的影响。

第二个因素是问题比较大的Seagate 12TB硬盘,从12TB向更大密度迁移的计划将会解决这个问题。

推动多元化

2019年,各个硬盘品牌的制造商多样性略有增加.

2018年,希捷硬盘在运营中的硬盘中占78.15%,到2019年底,该百分比已降至73.28%。 HGST从2018年的20.77%增至2019年的23.69%,东芝从2018年的1.34%增至2019年的3.03%。

终身硬盘统计

比较多年来硬盘硬盘的年故障率是发现趋势的一种好方法,backblaze还统计了硬盘硬盘的终生年度故障率。
下表显示了截至2019年12月31日生产中所有硬盘型号的年化故障率。
backblaze hdd lifetime stats

数据出自backblaze官方博客https://www.backblaze.com/blog/hard-drive-stats-for-2019/

Ads