在两年前的2014 GTC大会上,NVIDIA更新了该公司的产品路线图,Maxwell架构原定的接班人从Volta更新为Pascal(帕斯卡),后者将选用3D内存技能,具有Terabyte/s等级的内存带宽以及簇新的NVLink总线技能,关于许多一向重视GPU技能的人士来说,这些新技能无疑让人十分振作的。
Pascal是NVIDIA引进GPU核算后的第五代GPU架构,可是依照NVIDIA自己总的架构代数区别,则归于第十一代,而对消费的人而言,最简略的描绘便是:这是他们行将就能买到的新显卡。
其间,Tesla P100作为旗舰级产品,具有了Pascal架构的一切特性:
16 纳米 FinFET(鳍式场效应管)制程:能够让Pascal完成更多的特性、更快的功用以及改进能效比
依照现在的材料看,GP100是Tesla P100的微架构代号,这样的区别在过往并未呈现过,例如GM200微架构对应的GPU加速器就没有Tesla M200这样的说法,呈现这样的区别,或许是因为NVIDIA从这一代产品开端将GPU核算产品看做一个十分严厉(挣钱?)的产品看待。
事实上,“GPU加速器”这样的称号也是初次在这次大会上频频呈现,NVIDIA不断提“加速器”的说法,其意图是期望杰出产品的核算功用而不再仅仅是图形处理器。
NVIDIA的GPU核算产品被称作Tesla,这是从第一代针对GPU核算的 G80(Tesla 8,其时的GPU微架构也叫Tesla)开端,NVIDIA将传统微架构意义上的内核称作 streaming multiprocessor,简称SM,SM对来自并行运转的很多线程的指令进行创立、办理、调度和履行,而“内核”这个称号则被NVIDIA用作 SIMD 中单个处理单元,GPU厂商的这些术语即便到现在对许多业内人士来说也都是有点紊乱的。
从核算的视点,SM尽管现已算是一个内核,其时从图形处理的视点,它只担任可编程核算部分,缺少一些图形烘托的固定功用硬件,例如三角形 Setup(设置)、Tessellation(镶嵌)、纹路等单元。
NVIDIA将若干SM安排为一个被称作GPC(图形处理簇,更早的时分被称作 TPC,纹路处理簇,因为那时分还没在这个层级上引进硬件几许处理单元),GP100具有10个GPC,每个GPC具有6个SM,算计有60个SM,每个SM具有64个CUDA Core(或者说64路SIMD)和16个纹路单元,所以CUDA Core一共有3840个,纹路单元有240个。
内存带宽方面因为引进了HBM2,峰值带宽为720GB/s,这离HBM2的 1TB/s 略有距离,可是仍然达到了Tesla M40的三倍。
微信二维码
友情推荐: 江南体育 | 江南体育官方客服电话查询地址 | 江南体育官方客服电话查询中心