谷歌AI負責(zé)人Jeff Dean:一文回顧谷歌的2018技術(shù)進展
自然語言理解
本文引用地址:http://m.butianyuan.cn/article/201901/396818.htm2018年,Google的自然語言研究在基礎(chǔ)研究和以產(chǎn)品為中心的合作上都取得了非常棒的成果。我們在之前的機器學(xué)習(xí)模型基礎(chǔ)上開發(fā)了一個新的并行版本的模型 Universal Transformer,它在包括翻譯和語言推理在內(nèi)的許多自然語言任務(wù)中都顯示出強大的技術(shù)能力。
我們還開發(fā)了BERT,這是第一個深度雙向,無監(jiān)督的自然語言處理模型,僅使用純文本語料庫進行預(yù)訓(xùn)練,就能使用遷移學(xué)習(xí)對各種自然語言任務(wù)進行微調(diào)。
感知
我們的感知研究解決了允許計算機理解圖像,聲音以及為圖像獲取、壓縮、處理,創(chuàng)造性表達和增強現(xiàn)實提供更強大工具的難題。
Google AI使命的一個關(guān)鍵是讓其他人能夠從我們的技術(shù)中受益,今年我們在改進作為Google API一部分的功能和構(gòu)建塊方面取得了很大進展。比如通過ML Kit 在Cloud ML API和面部相關(guān)設(shè)備構(gòu)建塊中實現(xiàn)視覺和視頻的改進和新功能。
MobileNetV2是谷歌的下一代移動計算機視覺模型,我們的MobileNets廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界。MorphNet提出了一種有效的方法來學(xué)習(xí)深層網(wǎng)絡(luò)的結(jié)構(gòu),從而在計算資源有限的同時,改進圖像和音頻模型上的性能。
計算攝影
手機拍照性能的提升不僅僅在于物理傳感器的改進,更大部分要歸咎于計算攝影技術(shù)的發(fā)展。
我們的計算攝影技術(shù)正在與Google的Android和消費者硬件團隊密切合作,將這項研究交付給最新的Pixel和Android手機及其他設(shè)備。2014年,我們推出了HDR +,可以在軟件中對齊幀,并將它們與計算軟件結(jié)合,使圖片具有比單次曝光更高的動態(tài)范圍。這是2018年我們能夠在Pixel 2中開發(fā)Motion Photos,以及Motion Stills中開發(fā)增強現(xiàn)實模式的基礎(chǔ)。
今年,我們在計算攝影研究方面的主要工作之一就是創(chuàng)造一種名為Night Sight的新功能,即便在沒有閃光燈的情況下,也能讓Pixel用戶在非?;璋档膱鼍爸信某銮逦恼掌?。
算法和理論
在過去的一年中,我們的研究涵蓋從理論基礎(chǔ)到應(yīng)用算法,從圖形挖掘到隱私保護計算等廣泛領(lǐng)域。我們在優(yōu)化方面的工作涉及從研究機器學(xué)習(xí)的持續(xù)優(yōu)化到分布式組合優(yōu)化的領(lǐng)域。在前一領(lǐng)域,我們研究用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的隨機優(yōu)化算法的收斂性(其贏得了ICLR 2018最佳論文獎),展示了流行的基于梯度的優(yōu)化方法(例如ADAM的一些變體)的問題,為新的基于梯度的優(yōu)化方法提供了堅實的基礎(chǔ)。
軟件系統(tǒng)
我們對軟件系統(tǒng)的大部分研究仍然與構(gòu)建機器學(xué)習(xí)模型,尤其是TensorFlow有關(guān)。我們的一些新研究引入了Mesh TensorFlow,這使得用模型并行性指定大規(guī)模分布式計算變得容易。另外,我們還使用TensorFlow發(fā)布了一個可擴展的深度神經(jīng)排序庫。
另一個重要的研究方向是將ML應(yīng)用于軟件系統(tǒng)的堆棧層面。在安全漏洞問題方面,我們的編譯器研究團隊將他們用于測量機器指令延遲和端口壓力的工具集成到LLVM中,從而可以做出更好的編譯決策。
評論