导航菜单

AMD Zen2架构详解:对Intel从追赶到超越

不知不觉中,AMD的瑞龙处理器已经上市两年半了。 2017年诞生的禅宗建筑也发展了两代。现在它是瑞龙的第三代瑞龙Ryzen 3000系列。当我看到它时,我发现当前主要的Rare Dragon Ryzen 7 2700X开始发布,正如许多人不记得Reyan 7 1800X处理器一样。

管理层有一句名言。从优秀到优秀,这句话用于描述当前的AMD。

基于7nm工艺,第三代瑞龙,相信很多人都非常感兴趣,它的频率,核心,性能都有很大提升落后,是结构的创新和调整,今天用AMD官方PPT,为大家让我们来谈谈它以一种简单的方式。

本文内容很长,涉及的专业术语和术语很多。阅读有一定的门槛,但我已尽可能简短地解释。对于喜欢DIY并对半导体技术感兴趣的粉丝,我不妨找一个安静的地方。好好看看它,它应该是更有价值的。

在过去几年中,AMD一直在开发更高性能和更节能的Zen架构,因此,当Sharp处理器于2017年推出时,AMD震惊了全球52%的IPC性能提升。与Everyone荒谬的英特尔相比,这种架构水平有所提升风格牙膏升级过于凶猛,从性能到能效都有质的变化。

1de908cbdd704d618e657878a633ddc5

从这一点来看,两年前第一代瑞龙1000系列可以说是一鸣惊人,让AMD已经落后多年,获得了高性能CPU市场的新门票。从那以后,这个市场不再是英特尔的单人秀,DIY玩家都在期待双重霸权的局面回归,而且CPU市场结构也发生了变化。在过去两年中,英特尔从4核升级到6核到8核,不再升级牙膏。这确实是AMD的功劳。

但是,目前的两代Ara Dragon处理器仍然存在严重短缺,单核性能不足,导致部分AMD游戏和专业应用程序都不如英特尔。

从第一代瑞龙到第二代瑞龙,AMD将CPU架构从14nm Zen改进为12nm Zen +,但这仍然是一个小修复,缩短了与英特尔的单核差距,但在这种技术下没有任何质的变化和建筑。已挖掘出更高频率的可能性。

463f2e6e8bc14d2b973d4494eaa2e7d8

管理科学中有一句名言从优秀到优秀,这句话用来形容目前的AMD并不是更好,14/12nm公司的AVerMedia处理器是一款出色的处理器,但仍有一些插槽可以解决,而现在7nmm Zen 2架构的目标是卓越,AMD从追逐者到领导者的使命取决于它。

a6dda49b19c04e50bb1dd4500df6bfb5

以前,AMD对CPU路线图中Zen 2架构的概述是Zen架构的多维增强。从官方定性的角度来看,我们可以使用Zen 2作为Zen的深度改进版本。基本的CPU结构变化不大,但过程和包装。单核和多核的综合改进。

90d8417580b3430895e1fb616185303f

AMD对Zen 2架构的官方优势主要集中在三个方面:性能,进程和并行性,我们的介绍主要集中在这三个部分。

瑞龙第三代采用7nm工艺:AMD CPU历史上首次引领英特尔

对于CPU等极其先进的逻辑芯片,任何重要的进步都离不开工艺技术的升级。关于14/12nm瑞龙的一些缺点,如CPU单核频率不够高,AMD目前尚不清楚。但他们别无选择,GF的14/12nm工艺确定了上限,而不是提高频率。

走路的AMD决定将所有7nm的CPU和GPU订单交给台积电。

对于AMD而言,从原来的两家代工厂到代工厂的转变实际上风险更大,而台积电以前没有制造高性能X86处理器的经验,但最终,台积电技术丰富,成熟。它比GF好得多,AMD的7nm CPU和GPU终于大规模生产。

d95cc42bea2547adb60e253e05c8ec81

此外,AMD的瑞龙3000系列处理器采用7nm工艺,而台积电则与华为和苹果OEM移动处理器不同。它是一种7nm HPC工艺,针对高性能IP核进行了优化,但AMD和TSMC除外。 7nm HPC工艺的公开介绍并不多。

c0c447e11e5646c7ae9c4071cc923a64

根据AMD公布的数据,7nm工艺带来了显着的计算效率,包括2倍晶体管密度,50%功耗降低(在相同性能下)和25%性能改进(在相同功耗下)。

考虑到AMD与14nm工艺相比,密度和功耗的变化并不差,但25%的性能提升并不令人满意。还可以看出,在摩尔定律达到10nm节点后,芯片的性能提升并不那么容易。

30b7d2d588d74256990bde4b592b8c6e

只要取消处理器流程,英特尔无论如何都无法通过它。公平地说,英特尔的10nm工艺技术并没有过时,晶体管密度甚至比台积电的7nm工艺更具优势。在这个问题上,即使AMD非常清醒,他们也只是说7nm工艺已经赶上了与朋友的差距。

当然,总的来说,AMD仍然领先于7nm节点。虽然它在技术上可与英特尔的10纳米相媲美,但AMD赢得了时间表。英特尔的10nm处理器首次出现在第10代核心处理器Ice Lake的移动版本中。另一方面,高性能台式机和服务器版本将等到明年,AMD现在将推出采用7nm技术的高性能台式机处理器。 64核EYPC罗马处理器也将在今年下半年发货。

正因为如此,华尔街分析师称赞AMD在7nm瑞龙3000处理器上实现了转机。这是AMD十多年来首次在技术和性能方面超越英特尔。这绝对是一个历史性的时刻。

第三代瑞龙的Chiplets设计:CPU/IO核心分离解决延迟是关键

09001e4caa45478f9fe542806574f539

虽然AMD在瑞龙3000处理器上成功使用了7nm工艺,但是它说它是7nm芯片有点不准确。事实上,瑞龙3000是一种7nm混合12nm工艺,与其模块化设计有关。

92c20f12770a4b6c84365d0764b62c62

在7nm节点,设计芯片的成本高达3亿美元。 AMD的成本非常高。这要求制造商采用更好的方法来确保芯片的良率。芯片越高,产量越低。产量越小,概率越高。

在Zen 2架构处理器上,AMD使用Chiplets小芯片设计来模块化不同的核心处理器。小芯片设计与以前的胶水包装不同。实质上,根据需要匹配不同工艺和不同架构的芯片电路,这比简单的胶包更复杂,复杂。

在去年推出的第一款Zen 2架构处理器 EPYC Rome中,AMD率先采用了这种设计方法。八个CPU核心和一个IO核心堆积了一个64核处理器。在瑞龙3000上,桌面版不需要这么多内核,使用2组CPU核心层,1组IO核,最多16个核和32个线程。

cc63406bb3ae4324bbaa32f09f969d82

具体而言,上述两个CPU内核采用7nm工艺制造。由于CPU内核具有高性能要求且对功耗敏感,因此提升过程有利于CPU内核。刀片上应使用优质钢材。

以下IO内核集成了IO单元,如内存控制器和PCIe控制器。电路的这些部分的性能和功耗不是很高,并且IO单元不易随工艺收缩,因此使用相对低端的工艺。以前据称是14nm,但瑞龙3000上的IO核心是12nm工艺的修改版本。

06257ea3bb7e436c83ceeda25e87962c

AMD在Zen2上采用这样的设计无疑是非常智能的,配置也非常灵活,CPU内核可以通过增加CPU内核的数量来堆积,因此Acer处理器可以轻松改变以前的8核16线程到16核心32.线程。此外,AMD还需要生产小型内核,提高产量,降低成本,而IO内核采用更成熟的12nm工艺,进一步降低成本。

20b4129e5bf24b16964c50ae9d39c580

当然,还有一定的损失。 Chiplets设计的好处很多,但缺点是显而易见的。这就是如何处理核心之间的连接。特别是在存储器主机分离之后,理论上应该增加存储器延迟。它绝对不如原版。多核,AMD如何解决这个问题?

首先是改进Infinity Fabric总线(IF)。 IF总线是Zen架构的基本技术之一。它连接Zen体系结构中的CCX模块,现在用于链接不同的CPU和IO核心模块。

在瑞龙3000处理器上,IF总线发展到第二代,并行性,延迟和能效方面的整体改进。总线宽度从256b升级到512b以支持PCIe 4.0,而Fclk和Uclk频率被解耦以解锁内存超频性能,以及多种方式来减少内存延迟并提高缓存速度以减少延迟的影响。

b7066eac0b0a4f11b4482d3167cc3c02

除了IF总线的改进之外,AMD还发布了一个大动作 L3缓存加倍,每个CCX单元的L3缓存容量从之前的8MB增加到16MB(7nm工艺的密度优势是故意的),所以延迟敏感的应用程序可以拥有更多的L3缓存,AMD表示已将等效内存延迟降低了33ns,游戏性能降低了21%。

455e4e8cf8fe4d01a0fa2380d4066a22

此外,AMD的IO核心分离也增加了内存的频率。之前的Veron支持的内存频率仅为2933MHz,现在它可以轻松达到4000+,声称一键超频到4200MHz,而较高的可以达到DDR4-5133Mhz。

对于内存频率,如果追求极低的延迟,频率不一定好,这也与IF总线的工作模式有关,虽然它与内存频率分开,但延迟仍然最低在1:1的情况下,分界点是DDR4-3733,此时内存延迟最低,而AMD正式推荐DDR4-3600 CL16模式,这个频率和时序可以轻松实现当前内存。

第三代瑞龙Zen2架构详细介绍:一切都是为了提高吞吐量

d19cfd978f0044508f7b014f39a998ec

如果您还记得瑞龙7 1800X发布时的情景,那么应该对Zen架构SMT多线程,CCX单元,IF总线等的创新有所印象,瑞龙3000的Zen2架构继承了这些优势但是Zen2在IO相关的分离中,CPU核心变得更加纯净,而整体方向是增加核心数量,使多线程性能翻倍,同时最大化单核性能。

在瑞龙3000中,CPU和IO核心分离后,可以有多种组合,例如1组CPU和1组IO核心,最多8个核心和16个线程,以及2组CPU核心具有1组IO核,最多16个核和32个线程,这是当前瑞龙9 12核和16核处理器实现的基础。

232b4b91f68e43848efc08c6d8a2cd10

在14nm Zen架构中,CCX单元的总面积为60mm2,其中CPU核心为44mm2,8MB L3缓存为16mm2。计算其他IO,内存主机,IF和其他单元,8核处理器的核心区域是213mm2。

在Zen 2架构中,小芯片芯片的总面积仅为74平方毫米,CCX + 16MB三级缓存的核心面积仅为31.3平方毫米,与去年同期相比下降了47% 。一方面,由于7nm工艺的密度优势,另一方面,它也与Zen2有关。 CCX仅与CPU内核相关,从而减少了IO单元。

这也是为什么为了减少AMD敢于使L3缓存加倍的延迟,CCX核心区域在每个CCX加倍到16MB L3缓存之后仍然减少了大约一半。为什么不?

693451c2b0f34056990c5eea1463fd6b

对于整个Zen2架构,它继承了SMT多线程技术,并对分支预测,缓存系统,整数,浮点等单元进行了改进,并增加了新的指令,目的是进一步减少延迟的影响。

ad861cc2a6a74d918ac547e54695e458

在缓存系统上,Zen 2的L3缓存加倍,L2缓存维持512KB 8-Way不变,L1缓存调整,指令缓存容量64KB减少到32KB,但相关性从4-Way变为8-Way和Micro- Op缓存增加了一倍,AMD显然正在努力在性能和节能之间取得平衡。

f1c4708aff294251b9c239b828510836

在预取单元中,AMD提高了分支预测的准确性,增加了BTB(分支目标缓冲区)的容量,优化了32KB L1缓存,最重要的是增加了TAGE分支预测器,最终使分支预测丢失。速率降低了30%,从而提高了命中率,从而降低了能耗并提高了性能。

2943839539a8421297ce40c78963b242

在解码单元中,主要改进了微操作微操作缓存,并且容量从2K加倍到4K,这可以支持更多的解码操作。

fbfff9f119df4aea98e21f3a7760fe2f

浮点单元是Zen 2架构中相对较大的一部分。在去年的EPYC罗马处理器中,AMD将浮点性能吞吐量提高了一倍。原因是完全支持AVX2指令,并且位宽从128位增加到256位。这消除了将先前的256位指令拆分为两个指令并在两个周期内执行它的需要,从而实现了浮点性能的两倍。

882fb9e05d064baba3b9920c10efc5db

在整数执行单元中,调度器的数量从84增加到92,物理寄存器从168增加到180,并且传输的数量从6增加到7。一般而言,该领域的改进更加定量,进一步优化。执行单元效率和执行速度。

16ea5622685a47a58c9002b2a783e673

在加载/存储单元中,队列的深度也增加,TLB缓存容量增加,带宽增加,并且延迟减少。最重要的因素是带宽从每周期16B加倍到32B字节。

26e4377066844c65bad4bed66699f0b4

在高速缓存一致性方面,已经引入了L1,L2和L3高速缓存的变化。 L2缓存未更改,L3缓存加倍,L1指令缓存减半,但相关性加倍。

233d5192d4dd4127a348a0ba8d7cf61d

Zen2架构还增加了一些新的指令,如CLWB,WBNOINVD,QOS等,这些都没有详细说明。这些指令主要与内存和缓存有关。主要目标是提高缓存性能并减少延迟。它们主要用于EPYC处理器。准备好了,瑞龙3000消费者处理器支持这些说明主要是染色。

23b65d1c1e4647278ec6efc9386cd834

最后,值得一提的是处理器的安全性。由于后来者的优势,Zen2架构在安全性和漏洞保护方面具有优势。 Zen体系结构已经对Spectre Ghost和Meltown Fuse等多种变体进行了免疫接种。 Zen2架构上对Ghost Vulnerability变体的进一步硬件免疫力对消费者处理器几乎没有影响,但对企业用户来说非常重要。

第三代瑞龙的最终目标:多核和单核,更节能,低温

无论是7nm工艺还是Chiplets设计,还是Zen 2微核架构,AMD在Snapdragon和瑞龙处理器上的目标只不过是性能和能效,再加上以前处理器的优势和插槽。换句话说,它是继续保持多核性能优势,提高单核性能,提高能效,降低功耗和散热,降低成本,但价格与市场有关,具体取决于具体产品,这里不是谈论它。

d4d43e2074de43469f7128056b757c38

在性能方面,AMD正在追求7nm Zen2的性能提升。首先,IPC性能。从推土机架构到Zen架构,AMD实现了52%的IPC性能提升,但这有一个特别的好处,但从Zen到Zen2,AMD表示他们也实现了15%的IPC性能提升,这毕竟非常有价值,当前的高性能CPU架构越来越难。过去,英特尔产品提升5%,IPC性能也不错。

d66aaadd0d1b41f0915121fc5ef35560

其次,AMD仍需要达到更高的频率。瑞龙的第一代和第二代处理器在这方面遭受了损失,加速频率也是4.3GHz。它远不是英特尔实现的5GHz加速频率,导致AMD在单核性能和游戏性能方面遭受了很多损失。

在7nm Zen2上,AMD终于突破了。瑞龙9 3900X 12核处理器的加速频率也达到了4.6GHz。 16核瑞龙9 3950X达到了4.7GHz的频率,AMD表示他们的加速频率。不仅追求单核的最高频率,而且更有可能允许多核达到加速频率,这将带来更好的性能。

f9bccc95d79946379da7511cf3dc1f0c

随着IPC性能和频率的提高,AMD终于在瑞龙3000的单核性能上取得了很大的进步。官方数据显示,考虑到第一代和第一代的单核性能,单线程性能提高了21%。第二代瑞龙和英特尔酷睿。处理器中最大的差距只有20%左右。这一增长足以让AMD在单核性能方面与英特尔酷睿相媲美。

de58fd3437c94561bf1f31a109b54373

与此同时,AMD始终保持多核性能的优势将继续保持,瑞龙3000的最大核心数量翻倍至16核32线程,随着核心增加,多核性能基本保持线性增长,6核12线程处理器CINBEBCN R20多核运行得分为3678,12核24线程瑞龙3000为7248点,这基本上是同步增长。

81a7318f653748d9afe7844c45a8ed61

更重要的是,在性能不断提高的同时,AMD降低了处理器的功耗。每瓦性能比目前的瑞龙7 2700X和英特尔酷睿i7-9700K处理器高出50%至70%。瑞龙7 3700X的绝对功耗从前两个的195W和157W降至135W,能效表现令人印象深刻。

a68509d2519549d4bb373cfe5e1cf6d8

考虑到瑞龙7 2700X和英特尔酷睿i7-9700K处理器都是14nm工艺级别,7nm瑞龙3000处理器在能效方面存在两代差距。该官员表示,在相同性能下,功耗降低了50%。能效可以说是一次维度攻击。

961812b517804e2483cfa38aac9650b8

AMD的瑞龙3000处理器在热效率方面也非常受欢迎。英特尔的6核和8核酷睿处理器升温让很多玩家感到不满,但瑞龙7 3700X更为平静。瑞龙第一代和第二代的优势已经相同。

a585a231e423417d83b0e3440ba4f055

除硬件改进外,AMD还跟着优化,瑞龙3000处理器一直得到微软的支持,在最新的Windows 10月更新(1903版)中,它还支持AMD处理器状态切换功能的快速CPU,当它到了一些突然的工作量,瑞龙3000处理器的频率增加时间从30毫秒减少到1-2毫秒。简单地说,频率可以在需要时更快地增加,因此为了提高应用程序的响应能力,AMD表示PCmark 10的启动时间减少了6%,而火箭联盟的游戏启动时间减少了15%。

043ff3a6e9cb4b789380e92d0a958756

第三代瑞龙的完美搭配:X570芯片组+ PCIe 4.0带宽

5a030d78208d425baeb4e70927475295

除了处理器之外,还有全新一代的X570芯片组。与之前的芯片组相比,它是由翔硕设计的。这次X570是AMD个人,为了实现PCIe 4.0技术支持,以及14nm工艺技术的代价。

dc34220b73a34f2d95d91578555b4cf7

与PCIe 3.0相比,PCIe 4.0速率从8GT/s增加到16GT/s,带宽增加了一倍。主要优点如下:

1速度更快,x16双向带宽达到32GB/s,是PCIe 3.0的两倍。

2向后兼容,PCIe 4.0也兼容PCIe 3.0设备。

另外3个连接PCIe可以连接更多设备而无需担心性能下降。

eee077d218044258a6f44f36fe0fbda5

PCIe 4.0仍然是消费者平台上AMD X570 /瑞龙3000的独家功能。因此,Qunlian和汇融等公司的PCIe 4.0主机和PCIe 4.0硬盘是首选。将SSD的读写性能提升至5GB/s,并在未来进一步提升至6.5GB/s。

此外,除了PCIe 4.0,X570平台,其他SATA,USB 3.1 Gen2,NVMe等标准都优于英特尔的Z390平台,更多扩展接口,更加灵活,因此在X570平台上,AMD和主板厂商充满信心创建一个顶级平台,这也是与之前的300,400系列芯片组最大的区别,拥有先进的技术可以任性。

3c48c72e9e3c4d6f8aa482f447d84d0c

当然,考虑到PCIe 4.0目前支持较少,并且您没有追求极致性能,您可以选择X470,B450和其他平台。 AMD之前也证实了这一点。除了PCIe 4.0支持外,瑞龙3000处理器在其他平台上的性能。情况也是如此,不会受到影响。

总结:从优秀到卓越,瑞龙第三代的所有优势“我要全部”

从AMD的7nm Zen2架构设计来看,AMD可以说在这一代处理器上雄心勃勃,无论是单核还是多核性能,还是能效,温度,成本,AMD的目标都简单如下图所示。

1194e93db64a436d99f132b3b6a54a46

没错,AMD在瑞龙3000处理器上表明各种优势都已经耗尽,并且没有给朋友留下活着的感觉。它采用先进的7nm工艺,独特的Chiplets芯片和全面改进的Zen2架构。性能和能效的同步增长以及过去最弱的单核性能也迎头赶上。

45922b6ae70b4726a97dad16fe9c3176

对于瑞龙3000处理器的性能,AMD的官方测试显示了很多,但我们不打算在此详细列举,上面的图片是一个全面的代表,单核,多核性能比英特尔酷睿i9处理器强。

AMD的官方PPT并不代表实际的性能。最终的表现如何取决于测试? AMD能达到“一切必须”的目标多少?全面评估也将于7月7日晚上9点解除。来太平洋电脑网打开详细的比较数据。