去年11月,AMD發(fā)布了CDNA2新架構(gòu)的新一代加速計算卡Instinct MI250X、MI250,升級6nm工藝、2.5D MCM雙芯整合封裝、第三代Infinity Fabric總線互連技術,集成最多14080個流處理器核心、880個矩陣核心、218GB HBM2e顯存/內(nèi)存。
兩款卡均采用OAM模塊形態(tài),現(xiàn)在終于增加了PCIe標準形態(tài),型號“Instinct MI200”,支持PCIe 4.0。
MI200回歸單芯封裝,規(guī)格、性能幾乎完全就是MI250砍去一半:291億個晶體管,104組計算單元,6656個流處理器核心,416個矩陣核心,4096-bit 64GB HBM2e顯存,三條Infinity Link互連總線(最多四塊并行)。
核心頻率還是1.7GHz,性能也正好減半,F(xiàn)P64/FP32矢量算力22.6TFlops,F(xiàn)P64/FP32矩陣算力45.3TFlops,F(xiàn)P16矩陣算力181TFlops,INT8矩陣算力181Tops。
顯存頻率也維持在3.2GHz,所以帶寬減半1.6TB/s。
整卡功耗從560W降到了300W,采用單個EPS12V 8針輔助供電接口,被動散熱。
軟件API支持OpenMP、OpenCL、HIP,計算框架支持TensorFlow、PyTorch、Kokkos、RAJA。(作者:上方文Q)