关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

NVIDIA RTX 30系列架构详解(五)

2020.9.28

安培GPU架构详解之:第三代Tensor Core、8K游戏成为可能

Tensor Core是伏特GPU引入的一种新核心,现在也是SM单元的三大子核心之一,不过在数据中心GPU上,AI加速功能非常重要,所以A100大核心的Tensor Core占据了相当大的面积,功能及性能都改进不少。

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

在GA102核心中,Tensor Core也是第三代架构的,但是跟GA100核心的还是有所不同,每组SM单元也是4个Tensor Core,但是性能减半。

但在游戏GPU上,Tensor Core的意义没那么大了,NVIDIA官方的应用中DLSS算是发挥AI加速比较好的,可以进一步提升游戏性能,这一次虽然还是DLSS 2.0,但是配合RTX 3090显卡强大的性能,8K DLSS游戏成为可能。

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

8K游戏的分辨率是4K的4倍了,是1080p的16倍,光是高分辨率带来的挑战就足以让当前的高端硬件吃不消了,但在DLSS的加持下,RTX 3090在多款主流游戏中可以实现60fps以上的性能,最高可以超过100fps,可玩性已经不是问题。

这大概就是Tensor Core对游戏的重要意义,不过我们得说8K现在还比较遥远,性能跟上了硬件设备也跟不上,现在能玩好4K就差不多了。

安培GPU架构详解之:升级GDDR6X显存 带宽堪比HBM2

除了GPU本体之外,显存技术这一代也升级了,上代的图灵GPU首发了GDDR6显存,这一次NVIDIA又迅速商业化了GDDR6X显存,其中RTX 3090不仅频率飙上了19.5Gbps,还达到了24GB超大容量。

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

GDDR6X基于目前的GDDR6升级而来,基本架构和技术保持不变,重点加入了PAM4信令机制,在处理器和内存之间,使用四档电压,每个周期内编码和传输两个比特位。

对于PAM4机制,大家可以理解为闪存从SLC到MLC的升级,每周期传输的数据量可以翻倍,因此实现了超高速率的等效频率,起步就可以做到21Gbps,NVIDIA目前使用的略微保守,RTX 3090是19.2Gbps,RTX 3080是18Gbps。

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

使用GDDR6X显存之后,在等效带宽提升50%的情况下,能效也提升了,每bit功耗降低了15%。

但是想象一下,如今GDD6X就可以实现HBM2显存的1TB/s带宽,但又不需要后者那么复杂的工艺和成本,在消费级显卡上真的可以不需要考虑HBM2了。

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

安培GPU架构详解之:视频解码、接口、PCIe 4.0

在安培GPU上,还有一些其他技术升级,这里简单说一下吧:

·AV1视频解码升级 支持8K

NVIDIA RTX 30系列架构详解:8nm安培GPU的两倍性能从何而来?

8K是NVIDIA这次升级的一个重要,除了游戏性能可以支持8K之外,接口及解码上也做了准备。


推荐
热点排行
一周推荐
关闭