谷歌的終極武器是機器學(xué)習(xí)與語義搜索?
過去這幾年對于搜索引擎營銷者來說是激動人心的(或者說有些駭人,如果你不那么能夠接受變化的話)。谷歌引入了一系列新技術(shù)和系統(tǒng)來優(yōu)化其已非常出色的搜索算法,它的競爭者如必應(yīng),蘋果,微軟,甚至是Facebook也引進(jìn)或升級了對應(yīng)的系統(tǒng)來優(yōu)化它們的用戶搜索體驗。
本文引用地址:http://m.butianyuan.cn/article/201602/287035.htm而這些優(yōu)化的核心目標(biāo)則是解決計算機與人工智能歷史上最困難的問題之一:對自然語言的獲取與理解。雖然機器非常擅長程序性和邏輯性的任務(wù)(如解數(shù)學(xué)方程或識別物體數(shù)據(jù)特征),但是它們難以辨析那些僅有母語使用者才能憑直覺感受到的微妙差異。舉個例子,對我們來說「最近的漢堡店在哪里」和「我想吃漢堡」兩句話傳達(dá)了相似的意圖,但是對于基本的機器而言,兩者差距甚大:第一句話是對特定信息的檢索,與說話者的想法無關(guān);第二句話傳達(dá)了一個明確的欲望,與信息索取無關(guān)。過去幾年中,谷歌致力于打破不同語言間的隔閡并且解決其機器算法所面臨的問題。
語義搜索的根源和蜂鳥算法
2013年,伴隨著蜂鳥更新(Hummingbird update)的引入,語義搜索(Semantic Search)這一概念第一次進(jìn)入人們的視野。此前,谷歌通過確定搜索查詢語句的關(guān)鍵詞來檢索出相應(yīng)的網(wǎng)頁。就上述漢堡店的例子來說,谷歌會得到「漢堡」這個關(guān)鍵詞,并返回頻繁提到該關(guān)鍵詞的網(wǎng)頁——但這一方法不能真正捕捉用戶的意圖,它無法區(qū)分用戶是想搜索「漢堡店」還是「如何自制漢堡」。盡管還需完善,基于用戶意圖辨析的蜂鳥算法(Hummingbird)能夠捕捉到用戶意圖的關(guān)鍵因素并且「理解」頁面的內(nèi)容,而不再拘泥于頁面所包含的關(guān)鍵詞。
個人數(shù)字助理和語音搜索
個人數(shù)字助理,包括谷歌Now和Siri等,需要更高水準(zhǔn)的語義理解。目前出現(xiàn)了一些新的障礙,包括將口頭語句翻譯成輸入文本,找到合適的搜索方式,并且以一種可理解的方式進(jìn)行回復(fù)。盡管在本質(zhì)上,搜索結(jié)果的獲取依然還是依靠谷歌的標(biāo)準(zhǔn)搜索算法,但人工智能算法不斷改進(jìn),這些技術(shù)已經(jīng)進(jìn)步到了我們今天所能看到的水平。首要的動機是讓搜索變得更易用,但第二個動機卻是要改變用戶習(xí)慣:語音搜索需要使用對話輸入和上下文提示,比起傳統(tǒng)的基于關(guān)鍵詞的輸入,這需要更加強大、更相關(guān)的結(jié)果。
RankBrain的出現(xiàn) 去年語義領(lǐng)域最大的新聞是RankBrain的出現(xiàn),它是一種與蜂鳥算法相結(jié)合的機器學(xué)習(xí)算法。我概括了它的目的來對其進(jìn)行簡要說明:
它的作用是幫助谷歌理解用戶輸入的各種冗長復(fù)雜或者模棱兩可的口頭的查詢語句。可以這樣理解,它把那些不符合語法規(guī)則的糟糕輸入語句翻譯成可以被算法邏輯解讀的形式。而且因為利用了機器學(xué)習(xí),它能夠自行更新,從而不再依賴開發(fā)者的人工調(diào)整和升級。
「相關(guān)問題」的興起 為了讓用戶的搜索體驗更加飽滿,谷歌正在逐漸推廣「豐富答案」(rich answers)(在傳統(tǒng)的搜索結(jié)果上方時而出現(xiàn)的簡明版「答案」)。最近,谷歌更是推出了「相關(guān)問題」,它鼓勵用戶就其搜索主題進(jìn)一步進(jìn)行探索。尤為有趣的的是,目前「相關(guān)問題」的答案與各自對應(yīng)的作為Rich Answers的答案是不同的,也就意味著兩者是基于谷歌搜索算法的不同區(qū)塊的(比如,我們可以谷歌知識圖譜(Knowledge Graph)和RankBrain)。無論如何,似乎谷歌正致力于不僅僅理解用戶的查詢問題,并且簡潔明了的回答它們。
三大預(yù)測 為了推測出這些觀察情況的意義,我想要提供三種預(yù)測,預(yù)測谷歌接下來十年會如何選擇接下來的發(fā)展道路:
1.機器學(xué)習(xí)會成為新的目標(biāo)。目前,機器學(xué)習(xí)僅存在于谷歌搜索算法較為優(yōu)化的一部分。我猜想,它的應(yīng)用將延伸至其它領(lǐng)域,包括網(wǎng)頁內(nèi)容質(zhì)量分析(content quality analysis)和上下文反向鏈接評估(backlink context evaluation)。
2.谷歌將致力于把每一條搜索查詢都轉(zhuǎn)化為可回答問句的形式。隨著豐富答案及相關(guān)問題的積累,很顯然谷歌希望向用戶提供最直接的信息。我想,我們將會見證谷歌在這個方向更多的努力,包括將基本的查詢語句轉(zhuǎn)化為復(fù)雜的、可回答的問句。
3.新涌現(xiàn)出的科技將會讓更多人轉(zhuǎn)向語音搜索,這自然意味著語義更加復(fù)雜的問句和直接回答這些問句的答案。越多的人使用語音搜索,對谷歌來說則意味著更多的數(shù)據(jù),對用戶來說則是更好的搜索結(jié)果——總的來說,我們會得到更加完善的搜索系統(tǒng)。因此,我猜想谷歌會推動更多人在未來的幾年里使用語音搜索。
用你覺得合適的方式將這三個預(yù)測運用起來:你可以著手采用新的內(nèi)容營銷策略來回應(yīng)用戶的問題;或是使用新的技術(shù)進(jìn)行搜索引擎優(yōu)化(Search Engine Optimization),以避免機器學(xué)習(xí)所帶來的頻繁變化;再或者,你只需等待一個更加容易、更加符合直覺的搜索方式供自己使用。我們無法對未來下定論,但是回首過去短短幾年我們?nèi)〉玫木薮筮M(jìn)步,可以預(yù)想,接下來的十年將是極具開創(chuàng)性的十年。
評論