最近,在工作中,我有时会遇到解释CPUTurbo频率的问题,以及温度和功耗的控制问题。我发现同行业的一些朋友对这个领域的理解有一些误解。这并不是说它在技术原理上有多困难,但可能是因为他们对英特尔近年来的CPU性能/热设计了解不够。
我碰巧在散热领域有一些肤浅的经验,在测试工作中也积累了一些经验。所以我整理了两张图表,顺便分享一下。欢迎读者发表评论和更正。
Turbo的短时散热设计策略
首先,我评估了四个技术指标维度:
-Turbo(超过TDP)时间;
-峰值功耗/性能;
-温度控制;
-风扇静音
在下表中,我列出了三种比较模型a/B/C,它们可能来自真实的产品或一类产品,但我不想按照数字坐下来。同时,我还假设您配置了相同的CPU(如corei7-10700或11700)和散热器硬件。
注:图表中的分数为1-3。数量越多,项目的绩效越好。
第一模型a属于典型商用计算机的静音散热策略,同时,它遵循英特尔Pl1和pl2的功耗设计。例如i7-11700的65WTDP(热设计功耗,通常等于Pl1),短时Turbo的自动超频的功耗可以达到200W以上,接近pl2规格。
有关功率限制1和2的定义,请参阅下表:
在短期的Turbo阶段,a型CPU散热器风扇转速不会立即升高很高。如果是连续的全堆芯压力测试,将达到或接近100℃,触发CPU本身的AndyLau频率节流机制。在这里,我想解释三点:
小贴士1,100℃的规格是从哪里来的?
上图引述:https://ark.intel.com/content/www/us/en/ark/products/212279/intel-core-i711700-processor-16m-cache-up-to-4-90-ghz.html
它是去年写的《Xeon Scalable CPU跑到90℃了:为什么风扇转速还不提高?》年,我介绍了T结的温度值。它是指CPU内部传感器的核心温度读数,高于金属顶盖的表面温度。
小贴士2你需要担心达到或接近100摄氏度会触发Throttling吗?
我们使用一些软件来查看相同的温度。一些朋友认为8-90℃已经很高了。事实上,早在十多年前,笔记本电脑CPU就支持100℃的最高温度。然而,功耗/频率控制技术没有今天那么成熟,所以我们习惯于认为Throttling是频率降低保护。当然今天Throttling保护机制仍然是为了避免过热,但是它已成为传统冷却控制行动的一部分对
点击后,上图可以放大,引自:https://www.intel.com/content/www/us/en/support/articles/000005597/processors.html
小贴士3全核心Turbo的频率合理吗?
如下表所示,corei7-11700的基频为2.5GHz,Turboboost3.0的最大频率为4.9ghz(指单芯)。英特尔似乎没有正式宣布像Xeon服务器CPU那样的全核Turbo频率。当然,从测量的情况来看,如果温度在散热方面始终可以控制,那么它可以在pl2功耗时间限制内(英特尔默认为28/56秒)运行到更高的全内核频率。
扩展阅读:《推荐一款Linux下监控CPU温度、频率、功耗的工具:s-tui》
一旦Pl1运行到65W的稳定状态,整个核心频率就不能再这么高了。一般来说,i7-10700不低于2.5GHz是正常的。如果在压力测试期间运行avx-512浮点计算,或同时运行集成图形卡测试,在某些情况下,频率低于基本频率是正常的。这样的“耗电墙”在15WTDP的情况下,笔记本电脑CPU上有更多功能。
相比之下,125wtdp的i7-11700k基频远高于3.6ghz。如果它是一个应用程序的全核心和满负荷计算或渲染很长一段时间,11700k必须远远优于11700在正常情况下(没有手动超频)。
让我们回到模型a的后续操作:当Throttling发生时,CPU风扇将在稍后适当加速。随着CPU功耗逐渐降至65WPl1,风扇转速将降至相对安静,因为我们只需要保持一个合理的温度——如果我们看到CPU核心温度在80℃左右,这也是正常的。
综上所述,在短期的Turbo阶段,a型具有良好的静音设计和基本全峰值功耗/性能设计,而Turbo(尤其是高功耗Turbo)的时间相对较短,温度控制合格(本项目1分为合格)。
在这里,我还想添加一个提示4:CPU风扇能否即时响应CPU的温度变化(如二级)?
表面上看,这可以有效地抑制高温,但从噪音控制的效果来看,Turbo在短时间内的长度以及是否保持高功耗对于商用PC和工作站来说并不十分重要。第一单线程应用CPU内核时,Turbo的功耗一般在TDP范围内;如果每次出现满堆负载几秒钟,CPU风扇将以高速运行,这通常是不必要的。
服务器和其他数据中心设备的考虑方式有所不同。Xeon可扩展中高端机型的TDP本身的功耗高于台式CPU。在密度更高的1U/2U机箱中,风道前后还有其他附件。在这种情况下,为了满足TDP运行的基本条件,并且温度不超过标准,风冷散热不太可能像台式PC那样安静(本文不讨论液体冷却)
扩展阅读:《PowerEdge15G服务器的风冷散热“新花样”》
《冷板式液冷标准化:PowerEdge 15G服务器散热杂谈》
现在让我们看看B型,它在Turbo(超过TDP)时间、峰值功耗/性能、温度控制和风扇静音方面有2个点。它看起来相对平衡。事实上,这其中有一些方法(或权衡)。
首先是B型CPU的pl2有一些限制,例如,65WTDP的i7-11700在初始满芯时只能运行到120-150w(可以在主板的EC中设置),因此温度上升缓慢。CPU风扇转速上升后,如果允许的噪声水平稍高,则在短期Turbo期间,CPU自身的Throttling频率控制可能不会触发。
这种设置的结果是,B的峰值性能不如a高,但B保持全芯高主频的时间将比a长。表面上看,B是低CPU温度控制,但实际上,A型B的设计中没有散热问题风扇的噪音可能高于风扇的噪音。
和模型C完全是性能优先级为了考虑Turbo(超过TDP)的时间和峰值功耗/性能,在使用相同(性能/成本)的CPU散热器时风扇转速长时间过高。这样做的代价是静音效果相对较差,在Turbo的高功耗下很容易在短时间内触发Throttling,尤其是在环境温度较高的情况下。但是本文讨论的AndyLau仅在当前散热条件下将CPU降低到合理的频率/功耗水平,不会导致性能异常,毕竟,Pl1是常态。因此,我们认为C型的温度控制也是合格的。
稳态Pl1散热设计策略
在讨论下一部分时,我重新比较了三种模型a',B'和C',因为它们的行为与上面的模型a,B和C没有绝对的联系。
注:图表中的分数为1-3。数量越多,项目的绩效越好。
让我们先看看A’模型,当i7-11700CPU的功耗运行到英特尔官方的稳态Pl1-65WTDP时,风扇静音性能优异,温度控制适中。至于“成本/失败率”的因素,我们将在以后讨论C’模型时讨论。
B’模型它也是65W,区别是保持风扇转速相对较高,与a型相比,静音效果稍差,所以CPU温度将很低(如60-70℃)。
至于C’模型,从某种意义上说提高了CPU的Pl1功耗限制,例如,让65WTDP的i7-11700在80-95w下长时间运行相当于人工“超频”。为了使温度保持在合理范围内,需要相同级别的CPU风扇只能在更高的速度下工作,因此静音性能相对最差。
还有一个”成本/失败率”比较维度。该成本可能涉及主板的电源(散热)设计,或后期服务的相关费用。如果让CPU长时间以高于Pl1(即TDP)功耗的水平运行,英特尔不保证故障率不会上升。当然,根据三年保修的商用PC,CPU本身的设计寿命通常不低于5-10年(人们说它很少坏)。C’模型的故障率会提高多少?我没有确切的数字。
用户手动干预设置选项
前面的讨论是关于主机BIOS/EC中的默认设置。以下是手动冷却和超频的两种方法:
1.提高BIOS中的风扇速度:它确实可以冷却,甚至使CPU在短时间内以更高的主频/性能运行,但代价是噪音。没有具体原因。不建议对此进行修改。
2.在操作系统下,有几种类型可以用于调整Pl1和pl2功耗点以及pl2持续时间的软件。它可以用于超频某些型号(不保证支持所有主机),甚至可以调整CPU电压。但是这种手术可能会影响系统的稳定性,操作不当,甚至造成硬件损坏,所以我不推荐软件名。我相信一些爱好者和朋友已经对这方面很熟悉:)
注:本文仅代表作者个人观点,与任何组织无关。如果有错误和不足之处,请在留言中予以批评和纠正。如果你想在这里公众号分享您的技术干货,欢迎联系我:)
尊重知识,转载时请保留全文。感谢您的阅读和支持!
最新评论