多家頭部國產(chǎn)GPU企業(yè)的產(chǎn)品,已經(jīng)開始接受市場的檢驗。作者 | 心緣
編輯 | 漠影
芯東西11月3日報道,剛剛,國產(chǎn)GPU獨角獸企業(yè)摩爾線程推出了基于其自研MUSA架構(gòu)的多功能GPU芯片MT-春曉,以及國潮顯卡MTT S80、面向服務(wù)器的MTT S3000加速卡。同時,摩爾線程充分展示了其軟硬協(xié)同的綜合實力:發(fā)布兼容適配CUDA的MUSA開發(fā)者套件,sGPU 1.0云原生技術(shù),還打造了中國首個元宇宙平臺MTVERSE及眾多軟硬件產(chǎn)品,包括基于MTT S3000打造的MCCX元計算一體機等。MTT S80將在“雙11”期間在京東首發(fā)開售,近期在摩爾線程官方公眾號上可查詢產(chǎn)品購買信息。摩爾線程創(chuàng)始人兼CEO張建中在GPU領(lǐng)域深耕超過15年,曾幫助世界頭部芯片設(shè)計公司英偉達(dá)開拓并構(gòu)建GPU在中國大陸的完整生態(tài)體系。觀察到中國GPU的發(fā)展始終與國外存在差距,張建中在2020年10月創(chuàng)辦摩爾線程。今年3月,摩爾線程首次交卷,推出基于自研第一代MUSA架構(gòu)的GPU蘇堤,以及基于蘇堤的桌面級顯卡及數(shù)據(jù)中心級產(chǎn)品。(4096核心!摩爾線程推首款服務(wù)器GPU產(chǎn)品,還有臺式機顯卡)如今,僅隔7個月,摩爾線程再亮多款新品,并現(xiàn)場演示了40多個基于其多功能GPU的豐富應(yīng)用,覆蓋PC游戲、AI、數(shù)字人、數(shù)字孿生、物理仿真、8K多媒體顯示、云游戲、云桌面、數(shù)字辦公等場景。會后,摩爾線程CEO張建中、摩爾線程CTO張鈺勃與芯東西等媒體進(jìn)行深入交流。
01.第二款GPU春曉來了!
首款國潮游戲顯卡支持PCIe Gen5
一開場,張建中首先宣布,摩爾線程PES完美體驗系統(tǒng)聯(lián)盟不斷壯大,覆蓋CPU、操作系統(tǒng)、OEM廠商、軟件服務(wù)廠商、云服務(wù)廠商以及系統(tǒng)軟件開發(fā)商。多款現(xiàn)代化辦公PC系統(tǒng)及人工智能(AI)服務(wù)器等產(chǎn)品獲得PES認(rèn)證。自今年3月推出摩爾線程首款GPU蘇堤以來,蘇堤光速前進(jìn),獲得品高云、首都在線、天翼云、七牛云、紫光云、青云、瑞云渲染、移動云、澤塔云、華云等一眾云計算伙伴的支持。中國移動、中國電信、招商****等行業(yè)用戶,均率先使用摩爾線程的首款GPU蘇堤。緊接著,張建中宣布推出第二款基于其自研架構(gòu)MUSA的多功能GPU——MT-春曉。MT-春曉擁有4086個MUSA核心、128個張量計算核心,在1.8GHz主頻下單精度浮點算力(FP32)可達(dá)14.4TFLOPS,INT8算力達(dá)到57.6TOPS。該GPU的像素填充率、紋理填充率均達(dá)到460Pixel/s,支持PCIe Gen5、GDDR6顯存,顯存帶寬為448GB/s,視頻編解碼方面支持8K、AV1、H.265、H.264和32路1080P@30fps,可支撐7680 x 4320@30Hz的8K顯示輸出。相較“蘇堤”,“春曉”的GPU四大引擎全面升級,整體性能提升在4倍左右。其中圖形渲染能力方面平均提升3倍;編碼能力提升4倍,解碼能力提升2倍;AI計算加速平均提升4倍,物理仿真計算性能提升2.5倍;并引入了新技術(shù)支持窄帶高清,節(jié)約帶寬30%以上。張建中在接受采訪時說,摩爾線程首款GPU蘇堤的目標(biāo)是與國內(nèi)計算生態(tài)系統(tǒng)適配,第二款GPU則不僅要滿足國產(chǎn)化需要,還希望能成為主流的GPU產(chǎn)品,參與國際化競爭,并更好地提升國產(chǎn)軟件平臺的用戶體驗。基于MT-春曉GPU,摩爾線程打造了其第一款國潮游戲顯卡MTT S80。張建中說,MTT S80是國內(nèi)首款支持Windows環(huán)境、DirectX圖形接口以及PCIe Gen5的顯卡產(chǎn)品,這是一款中高端顯卡,配有16GB超大顯存,支持業(yè)界所有的主流游戲。全球排名前二的廠商花了超過10年的時間來開發(fā)驅(qū)動程序,摩爾線程希望用更短時間,去完成看似不可能的事情。研發(fā)設(shè)計游戲顯卡難度非常大,其中最難的部分在于開發(fā)Windows驅(qū)動程序。由于計算機圖形的專業(yè)性非常強,一套成熟的圖形驅(qū)動程序代碼量和一個操作系統(tǒng)的代碼量相當(dāng),懂得開發(fā)Windows 驅(qū)動的人才也非常稀有。因此,所有GPU公司,都會面臨在短時間內(nèi)開發(fā)優(yōu)秀的Windows驅(qū)動程序、完美支持DirectX不同版本的巨大挑戰(zhàn)。經(jīng)過工程師的努力,今天,摩爾線程推出MUSA DirectX 1.0,已經(jīng)支持20多款PC游戲,測試用例超過100萬,頂住了12小時循環(huán)壓力測試。MTT S80的Windows驅(qū)動目前已經(jīng)內(nèi)置了MUSA DirectX Driver模塊,并已完成對《暗黑破壞神3》、《英雄聯(lián)盟》和《穿越火線》等數(shù)十款主流游戲的適配。“路再長,走下去必能到達(dá)?!睆埥ㄖ姓劦?,摩爾線程計劃在一年之內(nèi),開發(fā)出世界一流的DirectX驅(qū)動程序,去滿足用戶對性能的需求。其終極目標(biāo)是完成DirectX完整功能研發(fā),讓它支持當(dāng)前的主流游戲及和圖形工作的工作站軟件。摩爾線程現(xiàn)場演示了用MTT S80玩《暗黑破壞神3》和《極品飛車》,整個過程都很穩(wěn)定流暢。當(dāng)前摩爾線程正在與Unreal和Unity等游戲引擎開發(fā)商,以及騰訊游戲、網(wǎng)易游戲、西山居、完美世界、360游戲等國內(nèi)頂尖游戲開發(fā)商展開深度合作,以便對游戲引擎和游戲產(chǎn)品提供更好更快的支持,使得玩家可以獲得持續(xù)更新的3A級游戲體驗。通過MTSS時空超分辨率技術(shù),MTT S80支持用低分辨率原始圖像重構(gòu)高分辨率成像,性能超越原生分辨率渲染。此外,摩爾線程還發(fā)布了PES控制中心,允許用戶管理、監(jiān)控圖形顯卡的運行狀態(tài),可在游戲內(nèi)實時顯示幀率、GPU負(fù)載等信息,并可以設(shè)置分辨率、顏色、實現(xiàn)游戲中“一鍵截圖”等。對游戲性能進(jìn)行優(yōu)化,通常需要圍繞硬件、計算、訪存、調(diào)度和系統(tǒng)等幾個維度來開展,離不開研發(fā)資源和時間的投入。通過驅(qū)動軟件的優(yōu)化,性能可以得到大幅提升,但這需要大量時間和資源的投入,還需要和廣泛的游戲開發(fā)者進(jìn)行深度合作。張建中說,GPU的軟件生態(tài)打造,是比產(chǎn)品研發(fā)還要挑戰(zhàn)的事情,是一項長期的事業(yè)。
02.面向服務(wù)器的MTT S3000:訓(xùn)推一體 兼容CUDA
傳統(tǒng)GPU叫圖像處理器,最早主攻圖形渲染,負(fù)責(zé)“成像”,是游戲、設(shè)計領(lǐng)域的主力;后來GPU在并行計算方面的“天賦”被挖掘,開始拓展邊界,逐步發(fā)展成加速AI及高性能計算的一大主流算力底座。隨著全社會對算力的需求持續(xù)暴漲,GPU的長期市場空間相當(dāng)可觀。今日發(fā)布的MT-春曉GPU,便是一款多功能計算平臺,集成了視頻編解碼、AI訓(xùn)練及推理、物理仿真與科學(xué)計算等豐富的引擎。除了游戲顯卡外,摩爾線程也基于MT-春曉打造了面向服務(wù)器的計算平臺MTT S3000,亮點是同時兼顧AI訓(xùn)練和推理。這是目前GPU行業(yè)中首款支持PCIe 5.0標(biāo)準(zhǔn)的產(chǎn)品,可為AI推理和訓(xùn)練、云游戲、云渲染、視頻云、數(shù)字孿生、數(shù)字內(nèi)容創(chuàng)作等提供算力支持。面向服務(wù)器的MTT S3000包含了4096個MUSA流處理核心及128個專用張量計算核心,晶體管規(guī)模達(dá)到220億,GPU核心頻率為1.9GHz,顯存位寬256bit,搭配32GB GDDR6顯存。MTT S3000支持FP32、FP16、INT8等多種計算精度,其中FP32算力可達(dá)15.2TFLOPS,支持DirectX、OpenGL、Vulkan、OpenCL等主流圖形和計算接口,兼容CUDA,同時支持動態(tài)彈性切分的虛擬化技術(shù)和SR-IOV隔離。摩爾線程致力于實現(xiàn)從算法模型到AI應(yīng)用的端到端全流程覆蓋,可幫助AI開發(fā)者實現(xiàn)從算法到應(yīng)用的高效部署。AI訓(xùn)練方面,MTT S3000提供有龐大的預(yù)訓(xùn)練模型庫,并支持TensorFlow、PyTorch、百度飛槳等主流AI框架,并實現(xiàn)了對Transformer、CNN、RNN等數(shù)十類AI模型的優(yōu)化。AI推理方面,MTT S3000覆蓋多種主流AI模型,并與CUDA兼容適配,可實現(xiàn)算法應(yīng)用無縫遷移,支持已經(jīng)開發(fā)好的CUDA代碼。以醫(yī)療應(yīng)用為例,MTT S3000的FP32高精度推理可以支持醫(yī)療領(lǐng)域MONAI推理框架。MTT S3000內(nèi)置了AI推理引擎Tensor X,AI應(yīng)用性能相比“蘇堤”可平均提升4倍。OpenMMLab、潞晨科技、百度飛槳、計圖、智源研究院都是MUSA AI戰(zhàn)略合作伙伴。在GPU生態(tài)中,軟件是舉足輕重的存在,開發(fā)門檻很高。而要讓好的軟件與應(yīng)用得以在GPU上發(fā)揮作用,不僅需要工程師的努力,還需廣大用戶和游戲愛好者的支持。為此,摩爾線程打造了MUSA軟件棧,從下往上包含四大引擎的驅(qū)動程序、MUSA開發(fā)套件和應(yīng)用領(lǐng)域開發(fā)套件,為開發(fā)者提供了多種強大的編程開發(fā)工具。其中,應(yīng)用層面開發(fā)套件有各種庫來滿足不同行業(yè)的應(yīng)用。無論是初學(xué)者還是有經(jīng)驗的開發(fā)者,都能使用地得心應(yīng)手。MUSA與CUDA兼容適配,通過自動化工具,可以很方便地將同一段CUDA應(yīng)用代碼移植到MUSA上,在開發(fā)上也照顧了現(xiàn)有的用戶習(xí)慣。從現(xiàn)場演示來看,MUSA上的運行結(jié)果與CUDA平臺基本上完全一致。總的來說,摩爾線程今日發(fā)布的MUSA軟件系列涵蓋平臺軟件、計算加速軟件,以及云計算及應(yīng)用軟件,并打造了開發(fā)者網(wǎng)站來為開發(fā)者提供全方位的技術(shù)與資源支持。云是GPU的一大應(yīng)用場景。張建中說,據(jù)不完全統(tǒng)計,去年云端數(shù)據(jù)中心新增算力中,有90%都來自GPU。其中,容器化和虛擬化技術(shù)對于提升GPU資源利用率非常重要。為此,摩爾線程發(fā)布一系列基于摩爾線程創(chuàng)新性MT Mesh 2.0的GPU云原生方案。MT Mesh 2.0可根據(jù)云端中心應(yīng)用負(fù)載,自動化分配GPU計算和顯存資源,實現(xiàn)GPU算力彈性伸縮。其云原生sGPU 1.0技術(shù)可原生支持Kubernetes生態(tài),支持GPU彈性切分調(diào)度、容器共享與安全隔離以及自動化運維,并能通過使用GPU安卓容器透傳技術(shù)和渲染編碼一體化技術(shù),加速安卓云手機解決方案,減少應(yīng)用延遲,增加并發(fā)路數(shù)。現(xiàn)場,摩爾線程進(jìn)行了云桌面實機演示,通過虛擬化技術(shù),將單個物理GPU切分成多個虛擬GPU,能夠同時運行不同類型的云桌面應(yīng)用,從而滿足對算力資源更靈活多樣化的需求。愛特云翔、百度智能云等都是摩爾線程的云桌面合作伙伴。摩爾線程還宣布將與騰訊先鋒一起打造基于MUSA架構(gòu)的云游戲解決方案ACX,并與蔚領(lǐng)時代、硅基大陸合作云游戲解決方案。
03.打造中國首個元宇宙平臺元計算一體機開箱即用
元宇宙是以圖形和AI計算為核心基石的集成式應(yīng)用,物理引擎、渲染引擎和AI技術(shù)的發(fā)展很大程度上決定了元宇宙的應(yīng)用演進(jìn)步伐。張建中告訴芯東西,摩爾線程將下一代互聯(lián)網(wǎng)視作主戰(zhàn)場,長期研發(fā)方向是提供元宇宙計算的核心技術(shù)。元宇宙有3個關(guān)鍵要素:場景、內(nèi)容、人,摩爾線程便圍繞此打造了核心軟硬件技術(shù)。今天,摩爾線程推出了中國首個元宇宙平臺MTVERSE,并宣布關(guān)于面向“場景”的物理仿真引擎AlphaCore、面向“內(nèi)容”的AI內(nèi)容創(chuàng)作平臺MT馬良、面向“人”的DIGITALME數(shù)字人平臺的一系列升級。MTVERSE元宇宙平臺以摩爾線程MUSA GPU集群為算力基礎(chǔ),為用戶提供計算基礎(chǔ)架構(gòu)及服務(wù),包括大數(shù)據(jù)、AI訓(xùn)練與推理、圖形渲染和物理仿真三大平臺,提供從硬件集群、軟件基礎(chǔ)架構(gòu)到SDK工具鏈的全棧式解決方案。上層的SDK工具鏈包含智能重建、智能理解、智能交互/仿真等工具,方便開發(fā)者調(diào)用數(shù)字人、文獻(xiàn)理解、語音識別、視覺識別、自然語義理解、對話交互、物理仿真、AIGC內(nèi)容生成等功能,縮短開發(fā)周期。同時,摩爾線程獨立設(shè)計研發(fā)的多平臺GPU物理仿真引擎AlphaCore升級至2.0版本。其中CatalystFX可做到實時高精度煙火仿真效果,F(xiàn)lood Dynamics能實現(xiàn)逼真的流體模擬仿真,Storm System可進(jìn)行天氣與云層模擬,Vera Fiber支持多物理場交互。摩爾線程宣布和多家合作伙伴一起打造元宇宙超寫實場景的制作。當(dāng)前摩爾線程正與光線云合作打造云原生渲染引擎RaysEngine全場景應(yīng)用,可支撐超大城市數(shù)字孿生渲染、AlphaCore物理仿真深度整合、DIGITALME數(shù)字人渲染與AI驅(qū)動、8K超高清圖形渲染等。張建中也感謝了摩爾線程的數(shù)字孿生合作伙伴。面向近年爆火的AI應(yīng)用AIGC智能內(nèi)容創(chuàng)作,摩爾線程在MTT S3000上研發(fā)生成了其第一個AI內(nèi)容創(chuàng)作平臺“MT馬良”,支持中英文圖文生成、圖像超分、簡筆畫創(chuàng)作、視頻生成等。摩爾線程與云南藝術(shù)學(xué)院合作,共建設(shè)計學(xué)院AI藝術(shù)創(chuàng)作實驗室,開設(shè)MT-馬良課程培養(yǎng)設(shè)計專業(yè)人才,制作出更好的AI內(nèi)容生成作品?,F(xiàn)場還展示了云南藝術(shù)學(xué)院用“馬良”創(chuàng)作的藝術(shù)作品。摩爾線程DIGITALME數(shù)字人解決方案也全新升級,構(gòu)建了完整的數(shù)字人生產(chǎn)線:MT-女媧能基于原始圖片進(jìn)行人臉風(fēng)格編輯、3D人臉重建,并可以添加人物資產(chǎn);MT-畫皮可通過單路攝像頭捕捉,支持?jǐn)?shù)字人表情驅(qū)動;MT-隨影可通過單路攝像頭進(jìn)行準(zhǔn)確的動作捕捉;MT-隨答是數(shù)字人對話系統(tǒng),適用于智能客服、AI助手、智能座艙等場景。基于此,摩爾線程研發(fā)其第一個數(shù)字人MUSA。張建中現(xiàn)場與MUSA進(jìn)行了流暢的問答對話。最后,摩爾線程宣布推出MCCX元宇宙一體機,通過軟硬件一體化交付,為用戶提供開箱即用、可滿足不同場景需求的元計算算力。
04.結(jié)語:國產(chǎn)GPU正奮起直追,未來可期
作為智算中心建設(shè)的關(guān)鍵算力基礎(chǔ)設(shè)施,GPU能夠為物理世界數(shù)字化和數(shù)字世界物理化實現(xiàn)提供多元有效算力支撐。而要實現(xiàn)兼顧高刷新率、高分辨率的圖形圖像顯示功能,在設(shè)計難度上非常有挑戰(zhàn)性,涉及幾何、像素、光照、紋理映射等大量復(fù)雜功能的設(shè)計,技術(shù)、生態(tài)壁壘森嚴(yán)。當(dāng)前國產(chǎn)GPU性能和生態(tài)建設(shè)仍與國際先進(jìn)水平存在差距,這是客觀事實,但我們也無需妄自菲薄,自主創(chuàng)新不是一步登天的事,至少有一批國產(chǎn)GPU已經(jīng)在起步的路上。前方是需求龐大的廣闊市場,側(cè)方是美國政府的圍追堵截,在復(fù)雜外界環(huán)境的重壓之下,無論從產(chǎn)業(yè)前景還是國家安全的角度來看,國產(chǎn)GPU的發(fā)展只會更加堅決。近兩年來,包括摩爾線程在內(nèi)的多家頭部國產(chǎn)GPU企業(yè)已經(jīng)陸續(xù)拿出硬件產(chǎn)品,并開始接受市場的檢驗。實力雄厚如英偉達(dá),也曾在教育用戶、培育生態(tài)的路上跋涉多年,實現(xiàn)全面可替代的路途依然艱辛遙遠(yuǎn),奮起直追的國產(chǎn)GPU們,需被給予更多的包容與試煉的機會。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
模數(shù)轉(zhuǎn)換器相關(guān)文章:模數(shù)轉(zhuǎn)換器工作原理