新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 人工智能+產(chǎn)品優(yōu)勢 百度AR或?qū)⒑蟀l(fā)制人?

人工智能+產(chǎn)品優(yōu)勢 百度AR或?qū)⒑蟀l(fā)制人?

作者: 時間:2016-08-05 來源:機器之心 收藏
編者按:未來,人工智能和AR必將走向融合,從技術(shù)到平臺,再到應(yīng)用。

  二、深厚的AI技術(shù)是百度起航的動力

本文引用地址:http://m.butianyuan.cn/article/201608/295055.htm

  就在昨天,百度在其智能營銷解決方案發(fā)布會上,發(fā)布了專為智能手機研發(fā)的平臺“DuSee”。在吳恩達(dá)看來,DuSee是百度技術(shù)的自然延伸。該平臺使用了復(fù)雜的計算機視覺技術(shù)和深度學(xué)習(xí),去理解場景,然后增強場景。要想研發(fā)出優(yōu)秀的技術(shù),就必須應(yīng)用更優(yōu)的技術(shù)。

  從技術(shù)環(huán)節(jié)來看,AR主要包括對現(xiàn)實世界的感知、真實世界和虛擬世界的信息融合、實時交互三個方面。DuSee是在百度大腦的基礎(chǔ)上發(fā)展起來的平臺。百度大腦利用Paddle深度學(xué)習(xí)并行計算平臺,在百度的GPU集群上訓(xùn)練上千億級數(shù)據(jù)樣本。整個百度大腦有上萬億的參數(shù),是全球最大的神經(jīng)網(wǎng)絡(luò),在圖像識別、語音交互等方向世界領(lǐng)先。利用百度大腦的技術(shù)和計算能力,百度AR技術(shù)在物體識別、三維環(huán)境感知、人機交互等核心方向建立了絕對優(yōu)勢。

  首先,深度學(xué)習(xí)在圖像識別和物體識別方面準(zhǔn)確率的大幅提升可以幫助設(shè)備更好的感知世界。物體識別是AR的基礎(chǔ)功能。通過攝像頭識別場景中的物體,能夠觸發(fā)相關(guān)的AR,并且在數(shù)據(jù)庫中找到相應(yīng)的虛擬物體與信息。目前,百度的圖像識別能力已經(jīng)排名世界第一,達(dá)到了四萬個物體種類的識別。同時,百度在大規(guī)模圖片檢索、商品垂類識別、人臉識別和OCR識別等技術(shù)方面也是出于世界領(lǐng)先水平。

  其次,在信息融合方面,技術(shù)也會帶來更加智能的定位和追蹤功能,以及更加出色的圖像渲染。百度的雙目視覺里程計技術(shù)在KITTI數(shù)據(jù)集上多項指標(biāo)位列前三位。百度自主研發(fā)的相機追蹤算法能夠為AR應(yīng)用提供快速穩(wěn)定的相機姿態(tài)估計結(jié)果,算法速度和準(zhǔn)確度都處于業(yè)內(nèi)領(lǐng)先水平。算法同時具備輕量,內(nèi)存消耗低以及對相機對焦準(zhǔn)確度要求寬松等技術(shù)優(yōu)勢,極好的適應(yīng)了AR技術(shù)在移動設(shè)備上的要求。同時在三維視覺的其它基礎(chǔ)技術(shù)領(lǐng)域也進(jìn)行了積極的布局和積累。比如在基于圖像的室內(nèi)定位,雙目視覺里程計,基于立體相機的景深感知,基于RGB-D相機的室內(nèi)大規(guī)模重建等方向都取得了世界級的成果。相關(guān)研究成果被世界計算機視覺領(lǐng)域頂級會議如ICCV,CVPR錄用,多項技術(shù)已經(jīng)應(yīng)用到百度的無人車項目中。

  百度自主開發(fā)的跨平臺三維渲染引擎,除了傳統(tǒng)引擎的渲染功能,側(cè)重于虛擬物體和現(xiàn)實環(huán)境的融合,包括動態(tài)真實環(huán)境的識別、實時三維圖形的生成渲染、虛實混合中的光照一致性和虛實物體相互作用的一致性構(gòu)建上

  最后,在AR下,人和機器會出現(xiàn)一種有史以來最為自然的交互方式,人工智能在手勢識別、語音識別和自然對話方面的成績會成為這種自然交互的基礎(chǔ),而且近期在做多模識別,比如說基于自然語言處理和圖像的imagecaption也會和AR的交互場景完美的匹配起來。百度利用深度神經(jīng)網(wǎng)絡(luò)和大量數(shù)據(jù),語音識別能力在嘈雜環(huán)境和各種方言等條件下保持非常高的識別率。

  人工智能技術(shù)只是為AR提供基礎(chǔ)技術(shù),而真正讓AR落地,重塑人、信息和物理世界三者之間關(guān)系的終極目標(biāo)還需要豐富的產(chǎn)品和應(yīng)用來延伸至用戶。斯坦福大學(xué)的電氣工程助理教授GordonWetzstein說:「AR真的可以無縫地集成到日常生活之中:例如溝通、工作、信息可視化、戶外游戲等等,在幾乎任何你能想出的各個領(lǐng)域……這將從根本上改變?nèi)伺c人交流的方式?!?/p>

  三、豐富的產(chǎn)品將助力百度AR迅速落地

  百度在AR領(lǐng)域的優(yōu)勢除了在基礎(chǔ)技術(shù)人工智能方面的強大儲備之外,其次是還擁有搜索、地圖、無人車等天然與AR產(chǎn)生聯(lián)系的豐富的產(chǎn)品線。

  首先,百度在搜索方面的優(yōu)勢毋庸置疑,而用戶搜索的目的基本可以分成幾類,1)獲取知識;2)掌握技能,借助AR,一個醫(yī)學(xué)院的學(xué)生可以直接搜到3D可互動的人體結(jié)構(gòu);家庭用戶在搜索「如何給空氣凈化器更換濾芯」時,也可以借助更加直觀的AR效果來解決現(xiàn)實生活的問題。因此,百度可以將AR效果集成到搜索中以提升用戶體驗。

  其次,AR是用戶真實世界和信息世界的疊加,真實世界就涉及用戶的移動和位置,因此,地圖和LBS服務(wù)就顯得尤為重要了,這個大家從火爆的AR游戲上就可以體會到。而百度在移動端,比如說在百度地圖上,積累了海量用戶及他們的數(shù)據(jù)和行為習(xí)慣,這一方面成為百度AR上必不可少的工具,同時也提供了足夠多的數(shù)據(jù)以提供更加智能的應(yīng)用。從這方面來講,百度可以將AR功能集成到這些產(chǎn)品中。

  此外,百度的其他產(chǎn)品也將與AR結(jié)合起來,比如手機百度、百度糯米等多個用戶體量過億的產(chǎn)品,總之,百度在AR的應(yīng)用方面還是有著充分的想象空間。

  百度基于人工智能底層技術(shù)和多種移動產(chǎn)品的兩端優(yōu)勢,未來的AR布局值得期待。


上一頁 1 2 下一頁

關(guān)鍵詞: 人工智能 AR

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉