CPU 能用多久?会不会因为老化而变慢?
老狼,UEFI固件、服务器、嵌入式产品、开源硬件从业者
电脑和手机用久了,都会越来越慢。“电脑老旧了。”大家都是这样认为的。就像人一出生就无可避免的滑向命运的终点,儿时的玩具会随着我们长大而变旧和破损,CPU 作为手机和电脑的心脏和大脑,会不会随着我们使用而越来越慢,进而完全停止工作呢?相信我们很多人在脑海中偶尔会飘过类似的疑问。这是真的吗?我们先来看看 CPU 的寿命是如何决定的。
浴缸曲线模型(Bathtub Curve Model)
和大多数半导体设备一样,CPU 的可靠性我们可以通过失效率来衡量。如果我们以时间为 x 轴,y 轴为失效率。CPU 的失效率曲线如下:
失效率曲线
蓝色的曲线叫做早期失效期(Infant Mortality),表明 CPU 在开始使用时,失效率很高,但随着产品工作时间的增加,失效率迅速降低。它的原因是由于制造和原材料带来的缺陷。
红色的直线叫做随机失效期(Random Failures),它是质量缺陷、材料弱点、环境和使用不当等因素引起的。它是个常数,它在 CPU 整个生命周期是个常数。
绿色曲线是耗损失效期(Wear-out),它在前期极低,后期开始错误后极具提高。是老化失效的原因。
综合上面三种曲线,综合失效率是紫色曲线,它呈现两头高,中间低的特征,形状像个浴缸,我们把它叫做浴缸曲线(Bathtub)模型。CPU 在生命周期中的这种特点,表现在开始时故障率很高,如果没有问题,则可以稳定工作很久,到最后开始老化失效,故障率急剧升高。
Burn-in
许多人看到这里都会大吃一惊:“什么,CPU 早期失效率这么高?是不是我刚买的 CPU 马上就要坏了?”CPU 制造厂商并不希望大规模的退货发生,毕竟所有 CPU 至少都有 3 年的质保期。CPU 厂商会封测期间,把 CPU 放入高温的环境下洗个澡(heat soaking),并加上高压。这样几个小时就相当于过了好几周。在把 CPU 拿出来测试,不好的淘汰掉,好的就可以进入浴缸曲线的底部稳定期,才能出货。这个工序叫做老化(Burn-in)。如图:
这样挑选后 CPU 直接跳过早期失效期,进入了稳定期。大家的 CPU 才会有 3 年质保。
3 年之后呢,CPU 会降速吗?
就像超市里的牛奶写的保质期 3 天,实际上 5 天之后大多数牛奶还是可以喝的一样。3 年质保只是最小值,实际上大部分 CPU 用上 7 年以上都是没有问题的。那么多年后进入耗损失效期(Wear-out)后 CPU 会怎么样呢?首先,CPU 的速度是恒定的,都是一个基频乘以一个比例(Ratio)出来的。基频现在 Intel CPU 一般是 100MHz,我们用的 3G CPU,Ratio 就是 30,下来刚好 3GHz。而基频和 Ratio 在整个生命期是不变的,从而 CPU 运算速度是不变的。Wear out 的后果是出错而不是降频,而很多种出错都会被 CPU 的错误检测发现并报告或者纠正,详情请参阅本专栏的另一篇文章计算机硬件出错了会发生什么?,如果发现出错,就是 CPU 开始进入失效期,以后错误会越来越多。
CPU 为什么会失效?
实际上 CPU 失效的原因有好几个,我们今后会专门撰文介绍。它们的统一特点就是高温高电压会加速失效。如图:
失效与电压的关系(来源 anandtech)
粉色的曲线是高温曲线,黄色是正常温度,而蓝色则是配备了好的散热系统。可以看出高温和高电压严重影响了 CPU 的失效率。这也是为什么超频后不再享受质保的原因。
结论
CPU 使用长了并不会降频,如果我们把电脑和手机变慢的罪魁祸首归咎于 CPU,那真是错怪它了。那么为什么电脑手机会越用越慢呢?原因很多,软件原因是安装软件越来越多等等;硬件原因也许就是风扇脏了,转速慢了,造成温度过高而降频(CPU 风扇停转后会发生什么?CPU 凭什么烧不坏);或者 SSD 的空间满了 / 没有启动 Trim(杂说闪存番外:手机为什么越用越卡和闪存写放大)造成速度极大降低等等。
最后强调一下 CPU 的 Wear-out 是随着使用时间进行的。如果你把电脑放上几年不动,CPU 并不会老化,反倒是 SSD 的内容丢失了(杂说闪存番外:我们的数据存在固态硬盘上安全吗?)
-
其他 CPU 相关文章:
CPU 制造的那些事之一:i7 和 i5 其实是孪生兄弟!?
CPU 制造的那些事之二:Die 的大小和良品率
为什么 CPU 的频率止步于 4G?我们触到频率天花板了吗?
为什么晶圆都是圆的不是方的?
为什么"电路"要铺满整个晶圆?
欢迎关注微信公众号:UEFIBlog
查看知乎原文