Kirin 970引入HiAI,十年人工智能研究的厚積薄發(fā)
在德國柏林舉辦的2017IFA展上,華為消費事業(yè)部CEO余承東正式揭開了華為新一代旗艦芯片Kirin 970的神秘面紗。作為國內(nèi)移動SoC乃至芯片產(chǎn)業(yè)的標(biāo)桿,今年以來,關(guān)于華為這顆芯片的傳言不絕于耳,主要是圍繞著其制程、性能和今年流行起來的AI加速器這些方面。我們來看一下華為對這顆芯片的觀點,對Kirin 970 人工智能加速器的展望。
本文引用地址:http://m.butianyuan.cn/article/201710/370564.htm業(yè)界首顆支持Cat 18的移動SoC
據(jù)余承東介紹,Kirin 970是使用TSMC的10 nm工藝打造的,在CPU方面采用了ARM 4 ×Cortex-A73和4×Cortex-A53的Big-Little八核架構(gòu),最高主頻可以到2.4Ghz,這和上一代Kirin 960一樣的。GPU方面則做了升級,從G71 MP8升級為新一代的12核的G72 MP12,這是業(yè)界首款將ARM G72商用的SoC。
Kirin系列過去三代產(chǎn)品的參數(shù)對比(source:anandtech)
根據(jù)ARM方面之前的介紹,基于Biforst架構(gòu)G72 GPU的效能較之上一代提升了1.4倍,繪圖省電效能也將比G71提高25%。這就意味著可以大大提高移動設(shè)備的游戲、AR/VR體驗。
而根據(jù)華為方面的介紹,Kirin 970 GPU的速度較上一代產(chǎn)品提升了20%,能源效率則提升了50%。
華為GPU的性能提升(source:androidauthority)
其他方面,Kirin 970首次支持了4K HDR10,搭配自研的新一代雙核14bit ISP,能給華為的視頻和拍照提供更好的體驗。
據(jù)介紹,除了是業(yè)界首顆商用G72的SoC外,華為Kirin 970還是一顆兼容LTE-Advanced-Pro 網(wǎng)絡(luò)的SoC,在3CA+4*4MIMO+256QAM的能力組合的FDD模式下,下行速度達到Cat18標(biāo)準(zhǔn)的1.2Gbps。這主要得益于華為自研的LTE Modem。光從以上性能看,Kirin 970這個集成了55億晶體管的芯片無疑是國產(chǎn)最強芯,甚至在全球的安卓SoC上都無能出其右者。
推出HiAI,十年人工智能研究的厚積薄發(fā)
如果說傳統(tǒng)GPU和CPU性能的提升,是華為Kirin系列升級的保留節(jié)目,那么在這個SoC上推出HiAI異構(gòu)計算架構(gòu),算得上是華為的一次銳意創(chuàng)新。
余承東在發(fā)布會上表示,Kirin 970創(chuàng)新地推出了HiAI人工智能移動異構(gòu)計算架構(gòu), 是世界上第一個在移動SoC上集成了神經(jīng)網(wǎng)絡(luò)處理單元(Neural Processing Unit ,簡稱NPU)的芯片組。華為在人工智能的十年布局是成就他們今日的關(guān)鍵。
據(jù)華為方面介紹,從十年前開始,他們就開始了人工智能的相關(guān)布局,為他們積累了深厚的技術(shù)儲備,這種厚積薄發(fā)也在今天給他們帶回了優(yōu)越的回報。
從媒體報道中我們得知,華為這個NPU在FP16下的計算能力為1.92 T OPS,在內(nèi)部測試中,可以在一分鐘內(nèi)辨別2005個圖片,而傳統(tǒng)的CPU一分鐘只能辨別97張圖片。
麒麟970的開發(fā)團隊在繼承過去數(shù)代成果的基礎(chǔ)上,首次集成NPU(Neural Network Processing Unit)專用硬件處理單元,創(chuàng)新設(shè)計了HiAI移動計算架構(gòu),其AI性能密度大幅優(yōu)于CPU和GPU。相比CPU有50倍能效和25倍性能的優(yōu)勢。
在問到應(yīng)用方向的時候,華為表示,新的AI加速器將會幫助消費者提供在聲音、視覺、圖像和拍照等各個方面的體驗,這是在新芯片中加入NPU的目的,也是Kirin 970所專注的幾個方面之一。華為認為,人工智能會作為一個基礎(chǔ)技術(shù)的存在,從本質(zhì)上幫助消費者提升體驗。
針對移動終端的人工智能,我們知道市場有很多不同的解決方案,有用GPU的,也有DSP的,但華為選擇了人工智能IP的AI加速器方案,在問到為什么采用這種方案的時候。華為表示,這主要是基于功耗和性能的平衡考慮。通用的處理器同樣可以實現(xiàn)人工智能的相關(guān)處理,但是在功耗、延時性或者處理能力上,可能很能平衡,因此就需要一個專用的AI加速器存在。但其強調(diào),這并不意味著他們的所有AI相關(guān)處理都是用NPU完成。
“根據(jù)應(yīng)用的不同,我們的芯片會判斷工作量和對延時的需求,然后自動選擇GPU或者AI加速器執(zhí)行相關(guān)處理,這樣就能達到性能最優(yōu)化處理的效果”,華為表示。所有的一切都是提高終端用戶體驗的。
相比于上一代的芯片,Kirin 970不但多集成了一個NPU,晶體管密度與總數(shù)也大大提升,對于華為來說,在功耗等多個方面帶來的挑戰(zhàn)是顯而易見的,在工程師的努力下,加上與第三方合作伙伴的通力合作,將其功耗和成本控制在了可控制范圍。
在華為看來,與第三方伙伴的通力合作,是保證華為芯片更進一步的基礎(chǔ)。
關(guān)于人工智能和Kirin芯片未來的看法
推出了HiAI的Kirin系列有了更大的想象空間,華為未來將加強在人工智能方面的推動和合作。最重要的是與第三方一起打造一個完善的人工智能平臺,更好地服務(wù)消費者。
華為認為,一個企業(yè)并不能憑借自己做好整個生態(tài)鏈,這需要產(chǎn)業(yè)鏈上下游的同心協(xié)力。例如在人工智能這塊,基于Kirin 970強悍的處理能力,會開放相關(guān)的SDK接口,讓第三方參與進來,從應(yīng)用端為消費者提供更好的體驗,共同打造一個生態(tài),合作共贏。這也是華為一直所堅持的。
在問到網(wǎng)友一直詬病的華為只用ARM公版處理器的這個問題上。華為表示,這并不是問題。術(shù)業(yè)有專攻,他們要做的就是將自己的工作做好。以汽車變速器為例舉例:在汽車研發(fā)中,很多主機廠用的都是同一個品牌的變速箱,但是有些廠商在變速箱與發(fā)動機的聯(lián)調(diào)中,能夠讓汽車在換擋的時候很平滑,但有些廠商的工作卻讓整個過程變得異常頓挫,體驗不佳。華為做的就是這個“聯(lián)調(diào)”。
根據(jù)華為的說法,ARM的處理器 IP設(shè)計已經(jīng)非常成熟,沒有必要去自主開發(fā)。在做一個處理器過程中,軟件的兼容、異構(gòu)計算帶來不同處理單元的配合更加重要,且很考開發(fā)者的功夫,華為只需要專注這些方面,并盡量做好,那就能給消費者帶來更好的體驗。“我們看到業(yè)界也逐漸回歸到使用ARM 公版設(shè)計的趨勢”。
我們看到,隨著進程工藝的逐代演變,摩爾定律似乎已經(jīng)走到了盡頭,提高芯片性能變得愈加困難,另外,這些年來移動SoC一直在堆積多核,提高主頻,業(yè)界開始有了“是否需要那么高性能處理器”的質(zhì)疑聲音。
華為認為,摩爾定律還沒有到盡頭,還會一如既往地往下演進。至于芯片的過度設(shè)計,是不可取的,單純的跑分毫無意義,Kirin芯片的宗旨就是聚焦于提高應(yīng)用操作體驗,降低芯片功耗,所有的一切都是以體驗為出發(fā)點。
期待華為在未來帶給我們更多的驚喜。
評論