欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

2021年度巨献:10款中高端主流CPU横评

2023-04-05 13:36:52 367

摘要:Intel已经发布了第11代酷睿处理器,不过评测要等到30号才解禁,在这个时间点我们可以先看下目前Intel与AMD在售的主力处理器状况。2020年Intel推出了第十代酷睿桌面处理器,不过依然是换汤不换药的产品,内核架构依然是Skylak...

Intel已经发布了第11代酷睿处理器,不过评测要等到30号才解禁,在这个时间点我们可以先看下目前Intel与AMD在售的主力处理器状况。2020年Intel推出了第十代酷睿桌面处理器,不过依然是换汤不换药的产品,内核架构依然是Skylake,今晚发布的Rocket Lake终于换了内核架构,但它不在本文讨论的范围之内。AMD这边呢,年中推出了制程改良版的锐龙3000XT系列,频率有小幅度的提升,到了10月全新的Zen 3架构出来了,IPC与Zen 2相比又有了大幅提升,更重要的是它的游戏性能比Intel的十代酷睿更强,把Intel手上的最后优势也夺过来了。

相比大家都迫不及待的相看两家桌面CPU的年度大战了,不过在测试之前我们先来回顾一下Intel和AMD在2020年的一些重要历程。

Intel 2020年回顾

其实2020年Intel在桌面主流市场只推出了第十代酷睿处理器Comet Lake,而HEDT平台甚至没有更新,Comet Lake的内核架构依然是基于Skylake,所以也没啥太大的惊喜,主要是提升了频率,最高8核16线程,制程仍然是改进版的14nm。


第十代酷睿Comet Lake的核心

第十代酷睿桌面处理器全系列都获得了超线程能力,顶级的酷睿i9系列处理器又多了两个核心,现在最多可以有10核,加入了源自于HEDT平台的Turbo Boost MAX 3.0,另外还获得了来自移动端的睿频能力——Thermal Velocity Boost。支持的内存频率也得到了提升,酷睿i9和i7处理器的内存支持提高到了DDR4-2933,而其他处理器的内存支持保持或提高到了DDR4-2666。

新的LGA 1200接口

新的处理器采用全新的LGA1200接口,该接口不仅在电气性能方面做了提升,还为下一代处理器Rocket Lake-S做了预留的触点,用于新的功能,包括PCI-E 4.0以及多出来的4条PCI-E通道,以及更高的DMI带宽,当然这些东西在Comet Lake-S上是没有的。


LGA1200(左)与LGA1151(右),触点数量多了49个,变动地方如上图所示

芯片更薄了

Comet Lake与Coffee Lake的另一个变化就是芯片用了更薄的封装方式,使用薄芯片焊接散热材料,官方表示这样做可以提升散热性能,不过并没有给出能具体能提升多少。

此外这次的Comet Lake-S处理器,酷睿i9/i7全部都是用钎焊导热的,i5的话酷睿i5-10600K/KF就肯定是用钎焊,其他的酷睿i5如果是用十核Die屏蔽下来的就是用钎焊,原生6核的话就是硅脂,酷睿i3以下则全部是硅脂导热。

Turbo Boost Max 3.0

第十代酷睿与第九代酷睿相比虽然架构没变,不过功能性的东西还是有增加的,比如这个Turbo Boost Max 3.0,当然这并不是什么新技术,玩过Intel HEDT平台的玩家应该很熟悉才对,它早在Broadwell-E上就有了。

Turbo Boost Max 3.0虽然延续了Turbo Boost 2.0的版本编号,但两者实际上并不构成继承关系,而更是两种并列的技术。我们知道,没有两片CPU的体质是完全一样的,而就算是在同一片CPU上,不同内核的体质也是不一样的,在普通情况下,内核之间的差别并不大,不过一旦进入到超频状态,体质差别就会体现出来,具体来说就是相同电压下某个内核可以达到更高的频率。为了充分榨干CPU的每一分利用价值,Intel开发出了专注于提升单核频率的Turbo Boost Max 3.0技术,在CPU的测试环节中,CPU的内核特性就会被写入到CPU内部,BIOS或特定的软件可以读取出这个信息,体质最佳的核心可以被自动超频到一个更高的频率去(比最高单核睿频频率还要高200MHz左右),配合上相应的驱动和应用程序,用户可以手动将某些程序指定到运行频率更高的核心上去,从而更快地完成工作。当然,现在的操作系统也会自动地调用这项特性。

初代的Turbo Boost Max 3.0只能加速一个核心,到了Skylake-X的时候,这项技术可以支持到同时给两个核心加速,而Comet Lake-S,也就是十代桌面酷睿上面,就增加了对这项技术的支持。

Thermal Velocity Boost

相比起桌面平台,移动平台的散热条件可以说是非常的……苛刻了。在很多笔记本上面,CPU甚至不能维持满标称的睿频时间就会回落到基础工作频率甚至出现降频情况。但对于散热设计非常好的机型来说,普通的睿频不太能够满足需求,于是Intel在第八代移动版酷睿处理器上面引入了新的Thermal Velocity Boost,直译过来的意思就是根据温度决定的高速睿频。顾名思义,要触发这项睿频技术,首先要满足的条件就是处理器当前的温度,其次要满足的条件是处理器还有睿频所需要的功耗“预算”。

当同时满足两个条件的时候,Thermal Velocity Boost就会被触发,它能够让处理器的频率瞬间上到比最高睿频更高的地步,对于Coffee Lake-H来说,这个值是200MHz,而它在移动低压平台也有被使用,不过频率提升的幅度就只有一半,也就是100MHz了。不过由于它有温度的限制,在有较大负载的时候,CPU的频率很快就会掉下来。

Thermal Velocity Boost也是一项尽可能榨干处理器潜力的技术,在全新的第十代桌面版酷睿上,它终于离开了一直呆着的移动平台,来到了桌面平台,不过只有最高级的酷睿i9系列处理器支持这一特性,这也是让新一代处理器达成单核5.3GHz频率的法宝。

说到底Intel这几年桌面平台处理器都没换架构的原因主要还是10nm工艺的难产,如果当年Canon Lake进展顺利的话甚至可能不会有8核Coffee Lake出现。在2019年推出的Ice Lake已经用上10nm了,但由于产能的原因只用在超低功耗移动平台上,频率上不去估计也是一个原因。去年推出的Tiger Lake处理器用了改良版的10nm SuperFin工艺,频率是上去了,但产能无法同时满载桌面与移动平台的需求,所以即使是今年的Rocket Lake依然是用14nm。

AMD 2020年回顾

相比于Intel,AMD这边就给力多了,趁着Intel自身一堆毛病的时候发力,夺回了不少市场份额,当然了Intel这座居然依然巨大。

AMD在6月份发布了锐龙3000XT系列处理器,锐龙9 3900XT、锐龙7 3800XT和锐龙5 3600XT,依然是Zen 2架构,本质上和锐龙9 3900X、锐龙7 3800X和锐龙5 3600X没太大差别,但由于采用了改良版的7nm工艺,所以拥有更高的加速频率与更好的超频能力,大家可以把他们当成特挑官超版,与此同时这也有可能是AMD在量产Zen 3处理器之前的一个试验,用来试试台积电的改良版7nm工艺,因为后来的Zen 3处理器和锐龙3000XT处理器用的是同一个工艺,频率都有很明显的提升。

此外AMD在7月份还推出了锐龙4000G与锐龙PRO 4000G系列处理器,他们其实就是2020年初发布的Renoir APU的桌面版,全部具备超线程特性,最高具备8核16线程,和移动版相比其实就是功耗与频率都提上去了,是标准版酷睿i7/i5/i3的有力竞争型号。但这些处理器都只通过OEM整机出货,目前都没有出现在零售市场, 不在本文讨论范围内。

10月份的Zen 3架构处理器可以说今年桌面处理器最重磅的产品了,Zen 3的IOD部分没改,对CCD内的CCX进行了大幅改动,把CCD内的两个4核CCX融合成一个8核CCX,L3缓存也整合成一整块,这有效降低了CPU核心之间的通信延迟,L3缓存的利用也变得更为高效,核心内部也进行了各种改动,我们测出来单线程性能比Zen 2提升了12%之多。

Zen 3较Zen 2的重大改进

Zen 3与Zen 2架构的对比如上图所示,主要改进地方包括:前端功能增强,能更快地获取代码,尤其是对于分支代码和大尺寸代码;执行引擎减少延迟并扩大结构以提取更高的指令级并行度(ILP);加载/存储有更大的结构和更好的预取,以支持增强的执行引擎带宽。

最大的变化是单个CCX的核心数量从4个增加到8个,现在每个CCD内都只有1个CCX,L3缓存也从两组16MB的统合成单个32MB,减少对主内存访问的依赖性,减少核心到核心的延迟,减少核心到缓存的延迟。这对于PC游戏尤其有用,因为PC游戏往往具有频繁使用L3缓存的特性,现在这些游戏现在能直接访问32MB的L3缓存,而不是16MB。

而19%的IPC提升,是缓存预取、执行引擎、分支预测器、微操作缓存、前端、加载/存储等多个地方改良叠加起来的结果。

前端改进

Zen 2架构的前端采用了更快的TAGE分支预测器,每个时钟周期能获得更多的预测,可在操作缓存和指令缓存之间更快地切换,并且能够更快的从错误预测中恢复,分支预测器准确性也进行了调整。

取指令与指令解码系统方面,分支目标缓冲器也有所变化,重新分配各级BTB以获得更好的预测延迟,L1 BTB数量从512条目翻倍到1024条目,L2 BTB数量从7000条目减少到6500条目,ITA也从1000增加到1500,缩短了流水线管道,所以发生预测变量错误时能够更快的恢复,“无气泡”预测功能可更快地预测并更好地处理分支代码。

L1指令缓存依然是32KB 8-Way,但对预取和利用率都进行了改良优化,操作缓存则进行了简化,效率会比Zen 2更高。

执行引擎

执行引擎在整数与浮点方面都进行了改进

整数单元方面,Zen 3的整数调度器从Zen 2架构的92个条目增加到96个条目,现在有四个24条目的ALU/AGU调度器。物理寄存器文件从180增长到192,从而提供了更大的操作窗口。重排序缓存从224条目增加到256条目。每个内核依然拥有四个整数ALU单元和三个AGU地址生成单元,增加了一个专用分支单元和两个st数据选择器,现在每周期可并行处理10个事件。

Zen 3内核与Zen 2内核的ALU执行单元是相同的,但Zen 3的调度器允许不同工作负载之间均衡共享使用ALU和AGU,这种共享调度制度可提供更大的吞吐量。

浮点执行单元从4个增加到6个,增加了独立的F2I/存储单元,用于存储和把浮点寄存器文件搬到整数单元,现在MUL和ADD不用在兼顾这些操作了,能够专注自己的工作了,每周期的运算能力更强了,FMAC周期从5缩短到4,使用了更强的调度器,减少了选择浮点和整数操作的延迟。

读取与存储系统

Zen 3内核的存储队列从48个增加到64个,L2 DTLB的数量依然是2K,L1数据缓存依然是32KB 8-Way,但与Zen 2架构的相比,每时钟周期的读取和存储次数都加了一,现在每时钟周期能进行三次读取操作和两次存储操作,但如果是浮点数据的话每周期操作数会减一,读取/存储操作更具灵活性 。

Zen 3架构的CCX进行了改动,现在每个CCX的L3缓存翻了一倍,所以预取算法进行了改动,能更高效的利用更大的L3缓存。使用了新技术缩短了存储-读取这样的转发操作的延迟。整个读取与存储系统有更高的带宽 ,可以满足更大更快的执行资源的需求。

8核心CCX

与内核的改动相比,CCX的改动才是最大的,Zen与Zen 2架构每个CCD内都有2个CCX,而每个CCX内包含4个核心,并且有各自独立的8MB或16MB L3缓存,到了Zen 3架构AMD修改了CCX的设计,每个CCX内有8个核心,L3缓存现在也是全部核心共享的32MB,这样能够有效降低CPU核心之间的通信延迟。Zen 2架构即使同一芯片内的CCX之间通信也是要走IOD上的SDF的,延迟非常大,Zen 3架构这一的改动大幅降低了同一芯片内核心通信的延迟,并且能够有效降低内存延迟,随着缓存与内存效能的提升,Zen 3架构能获得更好的游戏性能。

此外由于单个CCX的核心数量从4个增加到8个,CCX的内部总线也一同变了,AMD放弃了一直沿用的XBAR总线,改用了环形总线,毕竟4核互联只需要6条XBAR就足够了,但8核的话需要28条,复杂度大幅增加,改用环形总线确实是更好的选择。

不变的MCM封装与IOD

Zen 3的CCD依然是使用台积电7nm工艺生产的,芯片面积是80.7mm2,晶体管数量是41.5亿,而Zen 2的CCD面积是74mm2,内部有39亿个晶体管。IOD依然是那个没换,用GF的12nm工艺,芯片面积125mm2,内部有20.9亿个晶体管。

封装方面这个其实和Zen 2是一样的,一个CPU内包含一或两个CCD合一个IOD,相互之间采用Infinity Fabric总线连接,上行带宽32B每周期,下行带宽16B每周期,所以同样会出现Zen 2那样的单CCD处理器内存写入速度只有双CCD的一半的这种情况。

由于IOD没换,所以内存控制器也是那样有内存频率和IF总线存在1:1或1:2分频的现象,但锐龙5000系列的fclk能跑到2000MHz,所以内存能够跑到DDR4-4000并采用1:1分频,但目前BIOS还有些问题,只有体质好的处理器能跑到2000MHz的fclk,等以后更新到AGESA 1.1.8.0之后就大部分都能达到了。

目前Intel/AMD在售主流处理器

目前Intel在售处理器的主流是第十代酷睿处理器,基本上从酷睿i3到酷睿i9的出货都已经是第九代酷睿的天下, 上两代产品虽然还能买到,但由于接口不相容所以除了升级已经没有购买的必要。而AMD这边虽然说有最新的锐龙5000处理器 ,但仅有4款产品,产品线覆盖不完全,所以锐龙3000依然占据了大部分市场。

我们整理了一份在售的Intel第十代处理器和AMD锐龙5000/3000处理器的规格表,价格取自京东,采样日期是2021年3月15日。

主流平台处理器核心上限早已变成16核,当然了16核的锐龙9处理器价格太贵,高端的用10核酷睿i9或12核锐龙9还是比较多的,主流市场基本上以8核或者6核为主,四核处理器桌面处理器在我们眼里早就成为入门级的东西,现在的游戏也非常的吃线程数,当然4核8线程的处理器性能还是可以的 ,但除非预算有限否则不太建议选购

我们这次横评只测六核以上的处理器,囊括第十代酷睿i9/i7/i5以及锐龙5000/3000系列的锐龙9/7/5处理器。

测试平台与说明

这次测试一共包含10款处理器,包括Intel第十代酷睿i9-10900K、酷睿i7-10700K、酷睿i5-10600K, 比较火热的酷睿i9-10850K没有入选的原因是我们手头没有,而且它性能与酷睿i9-10900K相近,可以直接参考它的性能,而酷睿i5-10600KF的性能直接参照酷睿i5-10600K就好了,两者就有无核显之分,至于酷睿i5-10400F,直接上酷睿i5-10600KF不香吗。

AMD这边则包括锐龙5000和锐龙3000两代产品,包括锐龙9 5900X、锐龙7 5800X、锐龙5 5600X、锐龙9 3900X、锐龙7 3800XT、锐龙7 3700X和锐龙5 3600,两个16核的规格与价格都超出了主流范畴,其他的由于型号众多我们只选择了当中比较有代表性的来测试。

测试平台使用两款微星最顶级的主板,MEG X570 Godlike与MEG Z490 Godlike,他们的供电与规格都是非常强大的,非常适合用来做此次CPU横评的座驾。为了避免显卡上的瓶颈,采用了NVIDIA GeForce RTX 3090 Founder Edition显卡。内存采用两条8GB的芝奇焰光戟DDR4-3600 CL16,散热器使用芝奇上古水神ENKI 360一体式水冷。

需要特别注明的是,Intel处理器是根据主板默认设置全部解除功率限制的,CPU可以不管TDP长时间运行在全核最高睿频,这种设置在Z系列主板一般都是默认帮你开启的。

基准性能测试

Sandra 2020的处理器计算测试可以测试出处理器的运算能力,一般来说核心数量和线程数量多会更占优势,当然实际结果也得看处理器的频率。这软件版本更新后处理器计算的整数测试结果变得非常有趣,Intel处理器在这项测试里面全面超越AMD,即使是核心数少两个的酷睿i9-10900K在这里都要比锐龙9 5900X要强,当然其他测试项目就正常多了。

总的来说锐龙9 5900X与锐龙9 3900X的计算能力是强于酷睿i9-10900K的,酷睿i7-10700K比锐龙7 3800XT强但弱与锐龙7 5800X,锐龙5 5600X在某些项目里面可以追平或超过锐龙7 3700X,但总体还是不如,酷睿i5-10600K性能基本与锐龙5 3600相同。

SuperPi是一个完全比拼CPU频率的测试,是单线程的测试,最强的依然是酷睿i9-10900K,毕竟它的最高频率放在这里,但AMD凭借着Zen 3架构已经追上来了,锐龙9 5900X与锐龙7 5800X其实和酷睿i9-10900K相差无几了,与Zen 2相比Zen 3确实强了许多,用上概率版7nm工艺的锐龙7 3800XT与老款锐龙3000处理器相比也要强一些。

wPrime的算法和SuperPi不一样,而且算法有点神奇,Zen 2的效率甚至比Zen 3还高,锐龙9 3800XT居然是单线程最快的,多线程也差不多,酷睿i7-10700K比两个Zen 2的八核慢,但比锐龙7 5800X快,不过6核的酷睿i5-10600K则比锐龙5 5600X慢。

国际象棋这测试最多只能测试16线程,并不适用于这次的全部受测产品,所以我们只用它来测试CPU的单线程性能,这项测试里面三款Zen 3架构处理器直接领跑,接下来才是酷睿i9-10900K和酷睿i7-10700K,锐龙7 3800XT的单线程性能要高于酷睿i5-10600K。

7-zip适用内置的Benchmark测试,AMD的锐龙处理器在这项测试中表现相当出色,不论Zen 2还在Zen 3都领先同核心数量的十代酷睿。而且锐龙5 5600X在压缩测试里面比8核的Zen 2处理器还要快一些,但解压缩就要慢些。

3DMark的物理测试,三个测试都有些不同,FireStrike测试里锐龙5 5600X跑得甚至比锐龙7 3800XT还高,锐龙7 5800X也要高于锐龙9 3900X,TimeSpy测试里的话酷睿i9-10900K则要胜过核心数量更多的两个锐龙9,不过在TimeSpy Extreme测试里面锐龙9 5900X则要比它高得多。

创作能力测试

x264以及x265是两个老牌开源编码器,应用相当广泛,这次我们使用了新版本的Benchmark,它能更好的支持AVX 2指令集。其中X264的测试还是比较正常的,基本上就是核心数量越多优势越大,剩下的就是频率与IPC的区别了,可见Zen 3的性能比Zen 2要高太多了,酷睿i9-10900K的性能要低于两个锐龙9处理器,酷睿i7-10700K的性能介于锐龙7 3700X与锐龙7 3800XT之间,而酷睿i5-10600K性能略低于锐龙5 3600。

x265的测试里面Zen 2架构的明显拉胯了,而Zen 3架构的处理器表现也太强了点,锐龙7 5800X的性能超甚至超过了酷睿i9-10900K,而锐龙5 5600X都差不多要追上锐龙7 3700X了。而且酷睿i9-10900K的表现也要优于锐龙9 3900X,酷睿i7-10700K要优于锐龙7 3800XT。

Corona Renderers是一款全新的高性能照片级高真实感渲染器,可以用于3DS Max以及Maxon Cinema 4D等软件中使用,有很高的代表性,这里使用的是它的独立Benchmark,线程数在这个测试中比较重要,所以测试结果基本上都是按线程数量和频率一直排下来的,核心数量相同情况下Comet Lake的要强于Zen 2,但Zen 3要远强于他们两个。

POV-Ray是由Persistence OF Vision Development开发小组编写的一款使用光线跟踪绘制三维图像的渲染软件,其主要作用是利用处理器生成含有光线追踪效果的图像帧,软件内置了Benchmark程序。单线程方面,三颗Zen 3的排在最前面,接着是两颗频率极高的Comet Lake,锐龙7 3800XT正好夹在酷睿i7-10700K和酷睿i5-10600K之间。多线程就不一样了,排最前面的当然了两个12核的锐龙9,但8核的锐龙7 5800X几乎追上了10核的酷睿i9-10900K,而且8核处理器中酷睿i7-10700K垫底,锐龙5 3600的表现也要优于酷睿i5-10600K。

Blender是一个开源的多平台轻量级全能三维动画制作软件,提供从建模,雕刻,绑定,粒子,动力学,动画,交互,材质,渲染,音频处理,视频剪辑以及运动跟踪,后期合成等等的一系列动画短片制作解决方案,我们使用的是2.90版本,现在只用测试工程来测试CPU的单线程性能,多线程测试使用官方的Benchmark工具。这项测试里面酷睿i9-10900K排第一,但锐龙9 5900X与锐龙7 5800X其实不比它差多少,比较有趣的是酷睿i5-10600K的速度相当快。

多线程测试只测试了Benchmark里面的bmw27与classroom两个项目,上表是两个项目的总耗时,这项测试倒是没啥特别,结果基本和上面的多线程测试一样,核心多就占优势。

CINEBench使用MAXON公司针对电影电视行业开发的Cinema 4D特效软件的引擎,该软件被全球工作室和制作公司广泛用于3D内容创作,而CINEBench经常被用来测试对象在进行三维设计时的性能,R20与R23的差别其实不算大,主要区别是R20的默认测试是只渲染一次,而R23则是最低渲染10分钟。两者跑出来的结果差别也不明显,基本上就是单线程Zen 3完全领先,多线程则看核心数量,Comet Lake的表现基本上不如Zen 2。

游戏性能测试

游戏测试全部都是在1080p分辨率下进行的,全部开启预设最高档的画质设置,均使用游戏内置Benchmark。

本文地址:http://www.zhizunbi.cn/471133.html
版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网