分析测试百科网 > 行业资讯 > 技术原理

NVIDIA RTX 30系列架构详解（五）

2020.9.28

安培GPU架构详解之：第三代Tensor Core、8K游戏成为可能

Tensor Core是伏特GPU引入的一种新核心，现在也是SM单元的三大子核心之一，不过在数据中心GPU上，AI加速功能非常重要，所以A100大核心的Tensor Core占据了相当大的面积，功能及性能都改进不少。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

在GA102核心中，Tensor Core也是第三代架构的，但是跟GA100核心的还是有所不同，每组SM单元也是4个Tensor Core，但是性能减半。

但在游戏GPU上，Tensor Core的意义没那么大了，NVIDIA官方的应用中DLSS算是发挥AI加速比较好的，可以进一步提升游戏性能，这一次虽然还是DLSS 2．0，但是配合RTX 3090显卡强大的性能，8K DLSS游戏成为可能。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

8K游戏的分辨率是4K的4倍了，是1080p的16倍，光是高分辨率带来的挑战就足以让当前的高端硬件吃不消了，但在DLSS的加持下，RTX 3090在多款主流游戏中可以实现60fps以上的性能，最高可以超过100fps，可玩性已经不是问题。

这大概就是Tensor Core对游戏的重要意义，不过我们得说8K现在还比较遥远，性能跟上了硬件设备也跟不上，现在能玩好4K就差不多了。

安培GPU架构详解之：升级GDDR6X显存带宽堪比HBM2

除了GPU本体之外，显存技术这一代也升级了，上代的图灵GPU首发了GDDR6显存，这一次NVIDIA又迅速商业化了GDDR6X显存，其中RTX 3090不仅频率飙上了19．5Gbps，还达到了24GB超大容量。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

GDDR6X基于目前的GDDR6升级而来，基本架构和技术保持不变，重点加入了PAM4信令机制，在处理器和内存之间，使用四档电压，每个周期内编码和传输两个比特位。

对于PAM4机制，大家可以理解为闪存从SLC到MLC的升级，每周期传输的数据量可以翻倍，因此实现了超高速率的等效频率，起步就可以做到21Gbps，NVIDIA目前使用的略微保守，RTX 3090是19．2Gbps，RTX 3080是18Gbps。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

使用GDDR6X显存之后，在等效带宽提升50％的情况下，能效也提升了，每bit功耗降低了15％。

但是想象一下，如今GDD6X就可以实现HBM2显存的1TB／s带宽，但又不需要后者那么复杂的工艺和成本，在消费级显卡上真的可以不需要考虑HBM2了。

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

安培GPU架构详解之：视频解码、接口、PCIe 4．0

在安培GPU上，还有一些其他技术升级，这里简单说一下吧：

·AV1视频解码升级支持8K

NVIDIA RTX 30系列架构详解：8nm安培GPU的两倍性能从何而来？

8K是NVIDIA这次升级的一个重要，除了游戏性能可以支持8K之外，接口及解码上也做了准备。

互联网

喜欢作者我要约稿