英伟达和神奇怪兽打牌,没想到对方有双王(AMD显卡的逆袭)
最近更新时间:2021-04-26 发表时间:2021-04-26
前言
英伟达找神奇怪兽(注1)打牌,两人斗地主,英伟达甩出四个2,没想到神奇怪兽用双王炸。
注1:神奇怪兽,AMD公司名称为Advanced Micro Devices,Inc ,站长为其取了一个别号:Amamzing Monster Digital, Inc(神奇怪兽公司)
英伟达有些懵:“运气这么好?”
神奇怪兽嘿嘿一笑:“是啊,一张是刚摸到的,一张是到新规中心领的,怎么,你没去领啊?”
原来打牌还有这个操作,可以先去“领”一张王。
神奇怪兽摸到的这张王,是“Infinity Cache(无限缓存)”技术,而领的这张王,是“SAM”,正是凭借双王炸,在最新一代的显卡能耗比大战中,击败了老牌劲旅英伟达。
此文就扯扯这双王是咋回事。
正文
RDNA2的研发面临着带宽严重不足,要么用功耗成本都高的HMB2、GDDR6X,要么就另辟蹊径。
第一张王牌(大王)——无限缓存(INFINITY CACHE)技术,既凭实力,也有运气成分。
AMD同时拥有CPU和GPU事业部,不知道是哪位天才的建议,把EPYC霄龙处理器上的L3缓存(高密度SRAM)加以改进,用来作GPU的缓存,同时把锐龙处理器的“Infinity Fabric”总线技术应用进来,双剑合璧后可以提升带宽,但提升的比例在设计之初并不明朗。这有点类似我们改进了学习方法,都知道能提分,但提升的幅度多少?并不清楚。
最终的成绩让人惊喜,256bit GDDR6 显存加128MB无限缓存,等效带宽相当于384-bit GDDR6显存的2.17倍,同时功耗仅为对方的90%。
下面大概算笔账。
根据公式:
显存带宽(GB/s)=显存速率(Gbps)x 显存位宽(bit)/8
GDDR6 位宽384-bit,速率16Gbps的带宽=768GB/s
对比:无限缓存技术配合256bit的GDDR6显存,其等效带宽可达到768X2.17=1666GB/s,要注意2.17倍是对比的384bit显存,相比256bit实际为3.25倍!
英伟达这边,GPU倒是厉害,但显存带宽不够,RTX3090无奈采用成本和功耗更高的GDDR6X,384bit,速率19.5Gbps,带宽只有384X19.5/8=936GB/s,假设不惜血本强上512bit和21Gbps显存,带宽也只有1344GB/s,而对手只用了128MB缓存,就达到等效1666GB/s。
这效果太恐怖了!一个平时只能考45分的普通生,换了种学习方法,原以为能考80、90分就不错了,竟然直达146分!一个学霸开着跑车遥遥领先,只听得耳边“嗖”得一声,有人坐着火箭超了过去,在现实中就类似这么个情况。
一石二鸟
无限缓存不仅大幅度提升了带宽,还提升了能耗比。
据美光提供的数据,同为8颗显存,GDDR6X能效比较GDDR6的每比特能耗要低15%,与此同时多35%的显存带宽。
因为其速率更高,GDDR6X的“能效比”更出色并不等于功耗更低。19.5Gbps的GDDR6X显存的功耗大约比14Gbps的GDDR6高18.4%。由此,RTX3090和RX6900XT对比,抛开GPU功耗不说,RX6900的仅显存功耗就比对手低一截。
第二张王牌(小王)——SAM(Smart Access Memory智能寻址显存)
在普通windows计算机中,处理器一次只能访问一小部分显存 ,因此限制了系统性能。
通过 AMD SAM技术,扩展了数据通道,利用 PCI-E带宽消除性能瓶颈,可以充分发挥GPU和显存的潜力。
开启SAM之前,处理器通只能直接访问显存的一小部分(256MB),开启后可以识别和使用显卡的全部显存,不少游戏的帧数均有明显提升,官方数据是平均6%。
SAM并非万能药,目前只对部分游戏有明显疗效。不过,由于这项性能的提升是“白捡”,白捡的永远是“最好的”,用户关注度极高,主板工厂深谙此道,纷纷推出新版BIOS来支持,以博取消费者的垂青。
1、CPU:AMD Ryzen 5000系列的处理器
2、主板:X570/B550的主板(400系列主板看工厂心情,有些品牌已经提供新BIOS支持)
3、显卡:AMD Radeon RX 6000系列显卡。
这张牌是从PCI-E规范那里领出来的
SAM并非AMD独家秘笈,是PCI-E规范“ resizable Base Address Register(可变大小基址寄存器)”的应用。
锐龙5000系列处理器增加了一个新的物理层(full-rate_pdep_u32/64)以支持SAM,之前的4000、3000、2000等老系列则无法支持。(注:有传言ZEN2也可以,但未经证实,估计效果不佳)
让人吃惊的是,Intel 从第四代酷睿Haswell(对应主板为Z97/Z87/B85/H81),就已经支持Resizable-BAR,换句话说,如果主板厂家大发慈悲,i5-4590/i7-4770等处理器同样可以开启SAM。(当然,没有人会有闲心去给老大爷打生长激素)
现在,华硕、技嘉、微星等厂商,为其Z590/Z490/Z390、B560/B460等主板提供新版本BIOS,以支持智能显存寻址。
因此,intel平台+RX6000系列显卡,同样可以领取到这张小王牌。
N卡能否开启SAM?
目前,NVIDIA这边已经发布了新驱动来支持Resizable Bar,但暂时只有RTX3000系列能享受这一待遇。
与此同时,有些厂商开始提供新BIOS,让AMD主板支持RTX3000系列开启SAM(下图)
综上,我们可以得出以下结论,在符合相关条件的基础上,
1、AMD主板+AMD显卡
2、AMD 主板+NVIDIA显卡
3、intel 主板+AMD显卡
4、intel 主板+NVIDIA显卡
这四大平台,均有资格领取SAM这张小王牌。
总结
对英伟达来说,拿到SAM(小王牌)并无多大难度,困难的是要摸“大王”这张牌,需要开发类似无限缓存的技术,这不仅有较高的壁垒,同时还需要避开AMD的相关专利。
AMD这几年的进步确实让对手冒冷汗,RDNA和RDAN2,基因突变的力量,隔着屏幕都能体会到。
站长你好,马上618了,我想升级下CPU换张[降]显卡。本来想看看锐龙5000G带核显的U,一个是没货一个是核显还是Vega8的,想想还是算了。现在用的是华硕B550M-PLUS、R5-2600、蓝宝石RX5600XT。请问CPU升级是3700/x3800x还是5600x好呢,希望价位控制在2000上下吧,再就是显卡想把5600xt出掉回血换一个能玩实况足球2021、帝国时代2决定版、皇牌空战7、信长之野望这类游戏的就行。不玩网络游戏,这些全是下载的破解单机版的,不是steam上玩。请站长帮忙。
很老的gtx750也得用,前段刚收了一张花了200块,手里的rx470卖了两千块。现在矿卡也是有钱买不到。
我看店里A卡 580 20484G那款 999块 现在有货么
站长你好,请问amd的无限缓存技术想要实现需要什么条件?
希望多一些vega核显示的内容,每一代amd核显对比,和同级显卡的对比
虫哥,麻烦你一下,问个问题,现在CAD画图,用GTX1650能不能行?代替专业显卡用。
amd一个季度的研发支出只有几亿美元,却已经能跟英伟达打得有来有回,压制英特尔,还有余力跟三星搞手机GPU。现在就差台积电的产量了
明年该换电脑了,硬件性能较今年不提升不要紧,关键是价格要降下来啊