5月24日上午11點(diǎn),NVIDIA將亮相臺(tái)北電腦展舉辦專題演講,雖然老黃缺席,但GeForce業(yè)務(wù)高級(jí)副總裁在列,還是有希望公布RTX 40系顯卡的消息甚至是提前發(fā)布。
在此之前,爆料達(dá)人Kopte7kimi分享了號(hào)稱是AD102 GPU的內(nèi)核設(shè)計(jì)圖。
AD102也就是Ada Lovelace家族的次頂配核心,也是RTX 40系游戲旗艦卡的配置,大概率對應(yīng)RTX 4090 Ti、RTX 4090顯卡。
分析來看,AD102內(nèi)建多大12組GPC(顯示計(jì)算簇),比上代GA102多出70%。每組GPC包括6個(gè)TPC(2個(gè)SM),每個(gè)SM單元包括4個(gè)子核心,這都與安培相同,但不同的是,每個(gè)SM子核心包含128組FP32單元,加上IN32整數(shù)單元合計(jì)達(dá)到192。
完整AD102包括24組SM,所有就是12288個(gè)FP32單元加上6144 INT32,說通俗易懂點(diǎn)就是18432個(gè)CUDA。
緩存方面,AD102核心中,每組SM享有192KB L1,比安培增加50%,共計(jì)4.5MB。L2增加到96MB,是安培的16倍。
相應(yīng)的,ROP和RT光追單元規(guī)模自然也是水漲船高,AD102最多384個(gè)ROP,RTX 3090 Ti不過112個(gè)。另外,光追單元升級(jí)到第三代,Tensor單元升級(jí)到第四代。
基于此,RTX 4090最終實(shí)現(xiàn)性能翻番似乎并不是可望不可及的虛妄,就FP32單精度浮點(diǎn)來說,外界預(yù)期能到90T,而RTX 3090 Ti不過40T,代價(jià)就是超600W的功耗……(作者:萬南)
關(guān)鍵詞: NVIDIA新一代AdaGPU內(nèi)核圖 光追單元規(guī)模 性能翻番 次頂配核心