您现在的位置是:首页 > 技术资料 > Volta架构详解
推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

Volta架构详解

更新时间:2026-06-17 08:42:42 大小:16K 上传用户:烟雨查看TA发布的资源 标签:volta 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

一、Volta架构基本概述

Volta架构是NVIDIA推出的第七代GPU架构,于2017年正式发布,是NVIDIAPascal架构之后的新一代GPU微架构,主要面向高性能计算、深度学习训练与推理等高端计算场景,代表产品包括面向数据中心的Tesla V100计算卡,以及面向专业图形领域的Quadro GV100显卡。Volta架构在计算单元、存储架构、互联技术等多个方面进行了革新,首次引入了专门针对深度学习加速的Tensor Core单元,为AI计算和高性能并行计算带来了革命性的性能提升。

和前代Pascal架构相比,Volta架构采用了全新的12nm FinFET工艺制造,在相同功耗下能够容纳更多的计算单元,晶体管密度提升超过50%,典型产品Tesla V100总计集成了超过210亿个晶体管,核心面积达到815平方毫米,是当时规模最大的GPU芯片之一。Volta架构的设计目标就是满足百亿亿次(Exascale)级超算以及深度学习大规模训练的需求,因此在浮点性能、内存带宽、互联带宽三个核心维度都实现了大幅度升级。

二、Volta架构核心设计特点

2.1 SM单元架构革新

Volta架构对传统的流式多处理器(SM)架构进行了重新设计,将原有的多组SM子单元整合为更高效的GPCGraphics Processing Cluster)结构,每个GPC包含多个TPCTexture Processing Cluster),每个TPC包含两个全新设计的Volta SM单元。单个Volta SM单元拥有64FP32 CUDA核心、64FP64 CUDA核心、8Tensor Core,以及统一的L1缓存/共享内存设计。和Pascal架构的SM相比,Volta架构将原本分离的L1缓存和共享内存合并为统一可调配的存储块,可根据应用需求分配缓存和共享内存的容量,大幅提升了不同负载下的存储效率,同时将单SML1缓存容量从Pascal48KB提升到了最多128KB,显著降低了对全局内存的访问延迟。


部分文件列表

文件名 大小
Volta架构详解.docx 16K

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载