700W功耗性能猛獸 售價(jià)超24萬(wàn)元 NVIDIA稱H100顯卡全面投產(chǎn)
最近幾個(gè)月來(lái)以ChatGPT為代表的AI大火,也導(dǎo)致了訓(xùn)練AI用的NVIDIA加速顯卡備受追捧,黃仁勛也多次推薦大家購(gòu)買A100顯卡,不過(guò)這并不是NVIDIA最新最強(qiáng)的AI卡,去年發(fā)布的H100才是性能猛獸。
本文引用地址:http://m.butianyuan.cn/article/202303/444732.htm至于黃仁勛為何不重點(diǎn)推H100加速卡,主要是這款顯卡之前產(chǎn)量不多,但在日前的GTC 2023大會(huì)上,黃仁勛宣布H100已經(jīng)全面投產(chǎn),并部署在多家客戶的云計(jì)算服務(wù)中,包括微軟的Azure、谷歌、甲骨文等客戶數(shù)據(jù)中心。
H100加速卡與2022年3月份的GTC大會(huì)上發(fā)布,采用Hopper架構(gòu),GH100大核心,臺(tái)積電4nm制造工藝、CoWoS 2.5D封裝技術(shù),集成800億個(gè)晶體管,核心面積814平方毫米。
它擁有18432個(gè)CUDA核心、576個(gè)Tensor核心、60MB二級(jí)緩存,支持6144-bit位寬的六顆HBM3/HBM2e,支持PCIe 5.0,支持第四代NVLink總線。
H100計(jì)算卡有SXM、PCIe 5.0兩種樣式,其中SXM版本15872個(gè)CUDA核心、528個(gè)Tensor核心,PCIe 5.0版本14952個(gè)CUDA核心、456個(gè)Tensor核心,功耗最高達(dá)700W。
性能方面,F(xiàn)P64/FP32 60TFlops(每秒60萬(wàn)億次),F(xiàn)P16 2000TFlops(每秒2000萬(wàn)億次),TF32 1000TFlops(每秒1000萬(wàn)億次),都三倍于A100,F(xiàn)P8 4000TFlops(每秒4000萬(wàn)億次),六倍于A100。
售價(jià)方面,H100的官方建議價(jià)一直沒(méi)公布,但日本市場(chǎng)之前預(yù)售的價(jià)格是475萬(wàn)日元,約合人民幣24.2萬(wàn)元,比A100的價(jià)格至少翻倍了。
評(píng)論