Kirin 970引入HiAI，十年人工智能研究的厚積薄發(fā)

作者：時間：2017-10-26 來源：半導(dǎo)體行業(yè)觀察

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　在德國柏林舉辦的2017IFA展上，華為消費事業(yè)部CEO余承東正式揭開了華為新一代旗艦芯片Kirin 970的神秘面紗。作為國內(nèi)移動SoC乃至芯片產(chǎn)業(yè)的標(biāo)桿，今年以來，關(guān)于華為這顆芯片的傳言不絕于耳，主要是圍繞著其制程、性能和今年流行起來的AI加速器這些方面。我們來看一下華為對這顆芯片的觀點，對Kirin 970 人工智能加速器的展望。

本文引用地址：http://m.butianyuan.cn/article/201710/370564.htm

　　業(yè)界首顆支持Cat 18的移動SoC

　　據(jù)余承東介紹，Kirin 970是使用TSMC的10 nm工藝打造的，在CPU方面采用了ARM 4 ×Cortex-A73和4×Cortex-A53的Big-Little八核架構(gòu)，最高主頻可以到2.4Ghz，這和上一代Kirin 960一樣的。GPU方面則做了升級，從G71 MP8升級為新一代的12核的G72 MP12，這是業(yè)界首款將ARM G72商用的SoC。

　　Kirin系列過去三代產(chǎn)品的參數(shù)對比(source：anandtech)

　　根據(jù)ARM方面之前的介紹，基于Biforst架構(gòu)G72 GPU的效能較之上一代提升了1.4倍，繪圖省電效能也將比G71提高25%。這就意味著可以大大提高移動設(shè)備的游戲、AR/VR體驗。

　　而根據(jù)華為方面的介紹，Kirin 970 GPU的速度較上一代產(chǎn)品提升了20%，能源效率則提升了50%。

　　華為GPU的性能提升(source：androidauthority)

　　其他方面，Kirin 970首次支持了4K HDR10，搭配自研的新一代雙核14bit ISP，能給華為的視頻和拍照提供更好的體驗。

　　據(jù)介紹，除了是業(yè)界首顆商用G72的SoC外，華為Kirin 970還是一顆兼容LTE-Advanced-Pro 網(wǎng)絡(luò)的SoC，在3CA+4*4MIMO+256QAM的能力組合的FDD模式下，下行速度達(dá)到Cat18標(biāo)準(zhǔn)的1.2Gbps。這主要得益于華為自研的LTE Modem。光從以上性能看，Kirin 970這個集成了55億晶體管的芯片無疑是國產(chǎn)最強(qiáng)芯，甚至在全球的安卓SoC上都無能出其右者。

　　推出HiAI，十年人工智能研究的厚積薄發(fā)

　　如果說傳統(tǒng)GPU和CPU性能的提升，是華為Kirin系列升級的保留節(jié)目，那么在這個SoC上推出HiAI異構(gòu)計算架構(gòu)，算得上是華為的一次銳意創(chuàng)新。

　　余承東在發(fā)布會上表示，Kirin 970創(chuàng)新地推出了HiAI人工智能移動異構(gòu)計算架構(gòu)，是世界上第一個在移動SoC上集成了神經(jīng)網(wǎng)絡(luò)處理單元(Neural Processing Unit ，簡稱NPU)的芯片組。華為在人工智能的十年布局是成就他們今日的關(guān)鍵。

　　據(jù)華為方面介紹，從十年前開始，他們就開始了人工智能的相關(guān)布局，為他們積累了深厚的技術(shù)儲備，這種厚積薄發(fā)也在今天給他們帶回了優(yōu)越的回報。

　　從媒體報道中我們得知，華為這個NPU在FP16下的計算能力為1.92 T OPS，在內(nèi)部測試中，可以在一分鐘內(nèi)辨別2005個圖片，而傳統(tǒng)的CPU一分鐘只能辨別97張圖片。

　　麒麟970的開發(fā)團(tuán)隊在繼承過去數(shù)代成果的基礎(chǔ)上，首次集成NPU(Neural Network Processing Unit)專用硬件處理單元,創(chuàng)新設(shè)計了HiAI移動計算架構(gòu),其AI性能密度大幅優(yōu)于CPU和GPU。相比CPU有50倍能效和25倍性能的優(yōu)勢。

　　在問到應(yīng)用方向的時候，華為表示，新的AI加速器將會幫助消費者提供在聲音、視覺、圖像和拍照等各個方面的體驗，這是在新芯片中加入NPU的目的，也是Kirin 970所專注的幾個方面之一。華為認(rèn)為，人工智能會作為一個基礎(chǔ)技術(shù)的存在，從本質(zhì)上幫助消費者提升體驗。

　　針對移動終端的人工智能，我們知道市場有很多不同的解決方案，有用GPU的，也有DSP的，但華為選擇了人工智能IP的AI加速器方案，在問到為什么采用這種方案的時候。華為表示，這主要是基于功耗和性能的平衡考慮。通用的處理器同樣可以實現(xiàn)人工智能的相關(guān)處理，但是在功耗、延時性或者處理能力上，可能很能平衡，因此就需要一個專用的AI加速器存在。但其強(qiáng)調(diào)，這并不意味著他們的所有AI相關(guān)處理都是用NPU完成。

　　“根據(jù)應(yīng)用的不同，我們的芯片會判斷工作量和對延時的需求，然后自動選擇GPU或者AI加速器執(zhí)行相關(guān)處理，這樣就能達(dá)到性能最優(yōu)化處理的效果”，華為表示。所有的一切都是提高終端用戶體驗的。

　　相比于上一代的芯片，Kirin 970不但多集成了一個NPU，晶體管密度與總數(shù)也大大提升，對于華為來說，在功耗等多個方面帶來的挑戰(zhàn)是顯而易見的，在工程師的努力下，加上與第三方合作伙伴的通力合作，將其功耗和成本控制在了可控制范圍。

　　在華為看來，與第三方伙伴的通力合作，是保證華為芯片更進(jìn)一步的基礎(chǔ)。

　　關(guān)于人工智能和Kirin芯片未來的看法

　　推出了HiAI的Kirin系列有了更大的想象空間，華為未來將加強(qiáng)在人工智能方面的推動和合作。最重要的是與第三方一起打造一個完善的人工智能平臺，更好地服務(wù)消費者。

　　華為認(rèn)為，一個企業(yè)并不能憑借自己做好整個生態(tài)鏈，這需要產(chǎn)業(yè)鏈上下游的同心協(xié)力。例如在人工智能這塊，基于Kirin 970強(qiáng)悍的處理能力，會開放相關(guān)的SDK接口，讓第三方參與進(jìn)來，從應(yīng)用端為消費者提供更好的體驗，共同打造一個生態(tài)，合作共贏。這也是華為一直所堅持的。

　　在問到網(wǎng)友一直詬病的華為只用ARM公版處理器的這個問題上。華為表示，這并不是問題。術(shù)業(yè)有專攻，他們要做的就是將自己的工作做好。以汽車變速器為例舉例：在汽車研發(fā)中，很多主機(jī)廠用的都是同一個品牌的變速箱，但是有些廠商在變速箱與發(fā)動機(jī)的聯(lián)調(diào)中，能夠讓汽車在換擋的時候很平滑，但有些廠商的工作卻讓整個過程變得異常頓挫，體驗不佳。華為做的就是這個“聯(lián)調(diào)”。

　　根據(jù)華為的說法，ARM的處理器 IP設(shè)計已經(jīng)非常成熟，沒有必要去自主開發(fā)。在做一個處理器過程中，軟件的兼容、異構(gòu)計算帶來不同處理單元的配合更加重要，且很考開發(fā)者的功夫，華為只需要專注這些方面，并盡量做好，那就能給消費者帶來更好的體驗。“我們看到業(yè)界也逐漸回歸到使用ARM 公版設(shè)計的趨勢”。

　　我們看到，隨著進(jìn)程工藝的逐代演變，摩爾定律似乎已經(jīng)走到了盡頭，提高芯片性能變得愈加困難，另外，這些年來移動SoC一直在堆積多核，提高主頻，業(yè)界開始有了“是否需要那么高性能處理器”的質(zhì)疑聲音。

　　華為認(rèn)為，摩爾定律還沒有到盡頭，還會一如既往地往下演進(jìn)。至于芯片的過度設(shè)計，是不可取的，單純的跑分毫無意義，Kirin芯片的宗旨就是聚焦于提高應(yīng)用操作體驗，降低芯片功耗，所有的一切都是以體驗為出發(fā)點。

　　期待華為在未來帶給我們更多的驚喜。