Google Now背后的科技有多黑?
不久前,Google 宣布進(jìn)行架構(gòu)重組,原安卓業(yè)務(wù)主管、Google 高級(jí)副總裁桑達(dá)爾·皮查伊成為了 Google 新任的CEO。這個(gè)變動(dòng)似乎引起了一些 Google Now 開發(fā)團(tuán)隊(duì)的不滿,引發(fā)全員離職(亦說骨干成員離職),Google Now并入大 Search 組。Google Now 是安卓平臺(tái)用以對(duì)抗蘋果Siri、微軟Cortana的語音助手。那么,Google Now是什么?它包含了哪些 Google 的黑科技?
本文引用地址:http://m.butianyuan.cn/article/279637.htmGoogle Now 是什么
雖然本文談的廣義 Google Now 是集成了語音搜索的一整套 App,但更精確地定義狹義的 Google Now,就是手機(jī)上 Google Now 應(yīng)用打開之后,出現(xiàn)在首屏的那些智能推薦卡片,在合適的時(shí)間推送給你合適的信息,比如天氣、新聞。相對(duì)于人們?cè)贕oogle搜索輸入框主動(dòng)輸入自己想找的東西,Google Now會(huì)“智能”地把你所需要的信息推送到你面前。
所以,大家經(jīng)常把 Google Now 稱之為 Google 的智能推送技術(shù)。
比如筆者在國(guó)外的時(shí)候,能享受到 Google Now 的便利。比如通過Booking.com(類似攜程)定了酒店,或者 kayak.com(類似去哪兒)定了機(jī)票,確認(rèn)郵件都會(huì)發(fā)到筆者的Gmail郵箱。Google會(huì)很“智能”地分析(偷窺)這些行程郵件,并在航班即將起飛前幾小時(shí)提醒你航班的具體信息及航站樓甚至登機(jī)口信息。在你到達(dá)新的城市的時(shí)候,自動(dòng)彈出你即將下榻酒店的導(dǎo)航路線以及聯(lián)系電話等信息。出國(guó)旅行的時(shí)候,Google Now會(huì)自動(dòng)彈出當(dāng)?shù)氐呢泿艆R率,以及祖國(guó)的時(shí)間。它也會(huì)細(xì)心地記住你家和公司的位置,在下班時(shí)間準(zhǔn)時(shí)提醒你回家的交通狀況,雖然還并不能那么智能地了解到你今晚又要加班!
這里再說說Google Now 的誕生
Google Now,也是傳說中的 Google 20% Project 的產(chǎn)物。Google工程師 Baris Gultekin 在2010年的時(shí)候,因?yàn)閭€(gè)人興趣想利用手機(jī)上豐富的傳感器來做一些有趣的事情,這個(gè)想法跟時(shí)任Google Map負(fù)責(zé)人的 Andrew Kirmse 不謀而合。兩人在業(yè)余時(shí)間里面搭建了一個(gè)原型,并展示給當(dāng)時(shí)還在 Google 的梅姐 Marissa mayer。
在梅姐的支持下,隊(duì)伍漸漸壯大,并且也加入了用戶通勤的時(shí)間預(yù)測(cè)和對(duì) Google Calendar 事件的整合。碰巧的是,在2012年初,Larry Page正好要求 Android 和 Search 團(tuán)隊(duì)搭建一個(gè)類似的東西。于是在Android 老大 Andy Rubin 的支持下,兩人加入了 Android 團(tuán)隊(duì),得到了大量的設(shè)計(jì)方面的資源,并且在2012年 Google IO上第一次發(fā)布Google Now。
發(fā)展了這么多年,現(xiàn)在 Google Now 已經(jīng)被整合進(jìn) Google 搜索的 App 中。
最近某國(guó)外科技網(wǎng)站也傳出了Google Now團(tuán)隊(duì)解散的謠言,說是成員全數(shù)離職,還聯(lián)系到最近Google架構(gòu)變動(dòng),頗有陰謀論的意思。部分骨干成員離職確有其事,但這早在幾個(gè)月前就發(fā)生了,非常正常的人事變動(dòng)。
Google Now本身作為一個(gè)出色的產(chǎn)品,從Android組移入Search組,從技術(shù)角度來講,能得到大Search組更多的技術(shù)資源,對(duì)早日完成智能Google這一偉大目標(biāo)是大有好處的,這明顯是個(gè)好消息!
別看這個(gè)App界面簡(jiǎn)單,就一個(gè)搜索框和一排卡片,里面的技術(shù)可不簡(jiǎn)單。
介紹完狹義的Google Now推薦卡片,我們一起來看看Google Now這個(gè)小app里面,蘊(yùn)含了很多Google的黑科技:智能推薦(Google Now card),熱詞喚醒(OK Google),語音識(shí)別和語義分析。
首先說下智能推薦
推薦的原則是“Just right information at right time”,即合適的時(shí)間推薦合適的信息。那么如何知道哪些信息是用戶真正想要的,而不是機(jī)器自作主張,這個(gè)度需要拿捏。雖然現(xiàn)在統(tǒng)計(jì)機(jī)器學(xué)習(xí)方面這幾年已經(jīng)大規(guī)模地應(yīng)用在工業(yè)界,但是巧婦難為無米之炊,在無法得知用戶生活方方面面信息的前提之下,算機(jī)器學(xué)習(xí)算法再高級(jí),也無法做出太智能的推薦,所以一般公司都會(huì)采用規(guī)則+機(jī)器學(xué)習(xí)相結(jié)合的策略。
從現(xiàn)有產(chǎn)品看來,Google Now推薦的東西也相當(dāng)保守。
Google 能夠通過你在某個(gè)地點(diǎn)待的頻率,猜測(cè)你家和工作單位的位置,并且在每天指定時(shí)間自動(dòng)提醒你回家的交通情況。
前面也提到過,行程郵件卡片、酒店預(yù)訂卡片、出國(guó)旅游的匯率和祖國(guó)時(shí)間卡片等等。難點(diǎn)不在有多高深的推薦算法,而在于Google能盡量收集用戶的生活信息的點(diǎn)點(diǎn)滴滴,并且通過深思熟慮的規(guī)則,盡量不打擾地推薦給你。在國(guó)外,由于郵件普及率高,Google 坐擁 Gmail(順便說一下,Gmail 當(dāng)年出生跟 Google Now很像,也是誕生于傳說中的20% project),做出 Google now,Google占了天時(shí)地利人和。
熱詞喚醒
在 Google Now 軟件主界面,對(duì)著手機(jī)喊一聲“OK Google”,則自動(dòng)觸發(fā)語音識(shí)別接受用戶語音查詢。
熱詞喚醒作為啟動(dòng)語音識(shí)別的鑰匙,目的是以盡可能低的功耗來接受用戶的喚醒。
因?yàn)樾枰掷m(xù)開著麥克風(fēng),對(duì)輸入的音頻進(jìn)行運(yùn)算,使得CPU一直無法得到休眠,會(huì)嚴(yán)重影響已經(jīng)很緊張的手機(jī)電池續(xù)航。
所以手機(jī)上熱詞喚醒要維持高水準(zhǔn),需要考慮的重點(diǎn),除了準(zhǔn)確率(用戶叫你的時(shí)候能馬上響應(yīng),用戶不在叫你的時(shí)候不要聽錯(cuò)),還有能耗。熱詞喚醒不需要像通用語音識(shí)別一樣識(shí)別千變?nèi)f化的自然語言,它只要識(shí)別“OK Google”這個(gè)固定的詞,所以在算法方面也不必要采用復(fù)雜的傳統(tǒng)語音識(shí)別,拋棄高大上的各種 HMM、語言模型,用簡(jiǎn)單直接的分類的方法在用戶輸入語音流中尋找“OK Google”這幾個(gè)字,簡(jiǎn)單但好用。
當(dāng)然,這也有個(gè)例外,幾年前 Moto X剛出來,就是主打24小時(shí)全程語音喚醒待命,人家可是有2顆低功耗芯片,專門等待著用戶隨時(shí)輸入語音命令。
語音識(shí)別就不用說了,Google的強(qiáng)項(xiàng)
幾年前微軟研究院的一篇基于深度學(xué)習(xí)應(yīng)用于語音識(shí)別的論文,定義的算法準(zhǔn)確率超越了傳統(tǒng)的基于 HMM-GMM 的語音識(shí)別。但 Google 領(lǐng)先將其工業(yè)化,并應(yīng)用到當(dāng)年的語音搜索產(chǎn)品中。DNN 直接在最原始的音頻數(shù)據(jù)上進(jìn)行語音識(shí)別,并且需要大量的訓(xùn)練數(shù)據(jù),來訓(xùn)練大量的神經(jīng)網(wǎng)絡(luò)參數(shù),因此對(duì)硬件要求也很高,這正好是 Google 的強(qiáng)項(xiàng)。
經(jīng)過幾年的積累,Google 的語音識(shí)別已經(jīng)初具規(guī)模。值得注意的是,作為 Google Now 的競(jìng)爭(zhēng)對(duì)手的Siri,Siri 的語音識(shí)別一直用的是 nuance 家的技術(shù)(nuance是世界最大的語音識(shí)別提供商,可以理解為訊飛在中國(guó)的地位),雖然前段時(shí)間也傳出過蘋果在組建自己的語音識(shí)別團(tuán)隊(duì)的消息。
語義識(shí)別
通過 Google Now 上面的應(yīng)用搜索框,你可以問一些看起來非常炫酷的問題。
一些日常生活類信息查詢,比如紐約到舊金山的航班,比如未來3天北京的天氣,現(xiàn)在東京時(shí)間幾點(diǎn)。這種問答系統(tǒng)涉及到自然語言處理的方方面面,難度極大。
雖然在學(xué)術(shù)上,NLP(自然語言處理)在各種領(lǐng)域,比如語法分析、實(shí)體識(shí)別,經(jīng)過幾十年的努力,都取得了90%以上的準(zhǔn)確率。但在實(shí)際產(chǎn)品情境下,用戶口語化表述更加多樣,會(huì)產(chǎn)生歧義,和學(xué)術(shù)界經(jīng)常用于評(píng)測(cè)系統(tǒng)的語言測(cè)試集差別很大。
并且,問答系統(tǒng)是多個(gè)子NLP系統(tǒng)串聯(lián)成流水線的產(chǎn)物,比如詞性分析的輸出可能作為語法分析的輸入,語法分析的輸出可能作為實(shí)體識(shí)別的輸入。在這么一個(gè)流水線系統(tǒng)中,早期的錯(cuò)誤會(huì)被傳播到流水線之后的步驟,并被放大。
因此單個(gè)子系統(tǒng)上很小的錯(cuò)誤,在最終都會(huì)被放大,嚴(yán)重影響最終對(duì)用戶查詢的理解。
一般的問答系統(tǒng),都會(huì)針對(duì)當(dāng)前領(lǐng)域進(jìn)行專門優(yōu)化,研究用戶問得最多的是哪些問題,并盡量倚重規(guī)則(甚至正則表達(dá)式),并加強(qiáng)用戶引導(dǎo),減少用戶自然語言的歧義。
Google Now 語音搜索還支持一些百科類問題,比如現(xiàn)在的美國(guó)總統(tǒng)是誰,喜馬拉雅山的高度是多少,或者中國(guó)的人口是多少。
Google 畢竟是搜索出身,坐擁整個(gè)互聯(lián)網(wǎng)的信息,千千萬萬的網(wǎng)頁中已經(jīng)包含了“奧巴馬是美國(guó)總統(tǒng)”,“中國(guó)的人口是13億”這樣的陳述,對(duì)于 Google 來說,問題會(huì)簡(jiǎn)化成如何匹配用戶的問題到千千萬萬網(wǎng)頁中的某一句話,而不僅僅是給出 Top 幾十的匹配網(wǎng)頁,這在屏幕小的手機(jī)上、甚至手表上對(duì)用戶體驗(yàn)的影響至關(guān)重要。
學(xué)術(shù)界的一般做法,是首先識(shí)別用戶是問哪個(gè)類型的問題(What? When? Which? Where? etc。),然后利用信息檢索的策略先在千萬網(wǎng)頁中篩選出一些和用戶問題最相關(guān)的候選網(wǎng)頁,之后根據(jù)問題類型,去這些候選網(wǎng)頁中摘出最能直接回答用戶提問的語句。贏了Jeopardy!(可以理解為老美的開心辭典這樣的知識(shí)問答類節(jié)目)人類冠軍的 IBM Watson 系統(tǒng),也采用了類似的設(shè)計(jì)思路。這樣的方法可以確保以自動(dòng)化而非人力的方法提高問題的覆蓋率,而不用像某果需要招聘很多問題編輯來應(yīng)對(duì)越來越多熱心群眾對(duì)Siri的無情調(diào)戲。
Google 近幾年來,在語義分析、知識(shí)圖譜方面都投入了大力氣,大家也漸漸能在Google Now以及普通搜索中看到對(duì)這類技術(shù)的整合。
所以,Google Now 并入大 Search 組,得到更多的技術(shù)支持,絕對(duì)是一件大大的好事呢!
三極管相關(guān)文章:三極管放大電路
評(píng)論