全球AI競(jìng)賽，美國(guó)的優(yōu)勢(shì)不止英偉達(dá)

作者：時(shí)間：2024-07-09 來(lái)源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

人工智能的全球市場(chǎng)競(jìng)爭(zhēng)中，「主權(quán)人工智能」開(kāi)始成為越來(lái)越重要的議題。

本文引用地址：http://m.butianyuan.cn/article/202407/460802.htm

關(guān)于這個(gè)話題的大多數(shù)討論都集中在以下幾個(gè)核心問(wèn)題：

世界各國(guó)都希望盡快成為萬(wàn)億美元人工智能市場(chǎng)，并讓人工智能成為本國(guó)經(jīng)濟(jì)增長(zhǎng)的關(guān)鍵引擎
各個(gè)國(guó)家、地區(qū)都想要建立反映當(dāng)?shù)卣Z(yǔ)言、政治和文化的本土人工智能系統(tǒng)
各個(gè)國(guó)家、地區(qū)都認(rèn)為技術(shù)獨(dú)立是一種應(yīng)對(duì)當(dāng)前緊張的世界政治格局的正確選擇

這種「技術(shù)主權(quán)」的焦慮，主要來(lái)自人們已經(jīng)深刻認(rèn)識(shí)到技術(shù)落要面對(duì)的代價(jià)。

美國(guó)科技的領(lǐng)先帶來(lái)的福利越來(lái)越清晰。20 世紀(jì) 80 年代和 90 年代，微軟和英特爾等美國(guó)科技巨頭主宰了 PC 時(shí)代，遠(yuǎn)遠(yuǎn)超過(guò)了亞洲和歐洲的競(jìng)爭(zhēng)對(duì)手。在接下來(lái)的幾十年里，隨著硅谷涌現(xiàn)出一波又一波世界級(jí)公司，互聯(lián)網(wǎng)搜索、社交媒體、電子商務(wù)、移動(dòng)和云計(jì)算等領(lǐng)域也出現(xiàn)了同樣的循環(huán)。

2022 年 11 月 30 日，美國(guó)公司 OpenAI 發(fā)布了給予大型語(yǔ)言模型（LLM）的 ChatGPT。隨后，公眾對(duì) AI 技術(shù)的關(guān)注熱情被迅速點(diǎn)燃。彼時(shí)，ChatGPT 成為歷史上增長(zhǎng)最快的消費(fèi)軟件應(yīng)用程序，也掀起了全球 AI 投資熱潮。英國(guó)半導(dǎo)體公司 Arm 和 Amadeus Capital Partners 的聯(lián)合創(chuàng)始人赫爾曼·豪澤 (Hermann Hauser) 表示：「我們非常擔(dān)心美國(guó)會(huì)再次遙遙領(lǐng)先」。豪澤曾撰寫(xiě)大量關(guān)于歐洲建立技術(shù)主權(quán)必要性的文章。

如何掌握人工智能的主權(quán)？

面對(duì)美國(guó)再次領(lǐng)先，全世界都在準(zhǔn)備 AI 的「糧草」。IDC 數(shù)據(jù)顯示，2022 年全球人工智能 IT 總投資規(guī)模為 1,324.9 億美元，并有望在 2027 年增至 5,124.2 億美元，年復(fù)合增長(zhǎng)率為 31.1%。在生成式 AI 市場(chǎng)上，IDC 預(yù)測(cè)，全球生成式 AI 市場(chǎng)年復(fù)合增長(zhǎng)率或達(dá) 85.7%。2027 年，45% 的企業(yè)將掌握并使用生成式 AI 來(lái)共同開(kāi)發(fā)數(shù)字產(chǎn)品和服務(wù)，全球生成式 AI 市場(chǎng)規(guī)模將接近 1500 億美元。

作為 AI 的載體，數(shù)據(jù)中心的建設(shè)如火如荼地進(jìn)行中。

日本政府投資 725 億日元，幫助 KDDI、軟銀和 Sakura 等多家日本公司為 AI 應(yīng)用建立本地云數(shù)據(jù)中心。印度政府宣布了一項(xiàng) 12.5 億美元的計(jì)劃，名為「IndiaAI Mission」。通過(guò)該計(jì)劃，印度將在全國(guó)范圍內(nèi)為創(chuàng)新者、初創(chuàng)企業(yè)、學(xué)生和教育機(jī)構(gòu)提供便捷的計(jì)算能力。

這樣的競(jìng)賽讓英偉達(dá)芯片供不應(yīng)求。當(dāng)?shù)貢r(shí)間 6 月 18 日，英偉達(dá)盤(pán)中股價(jià)上漲 3.2%，推升該公司市值達(dá)到 3.33 萬(wàn)億美元，市值超越微軟。Arm 創(chuàng)始人的擔(dān)心似乎正在成真。

英偉達(dá)產(chǎn)品在 AI 領(lǐng)域的廣泛使用成為美國(guó) AI 行業(yè)發(fā)展的重要優(yōu)勢(shì)。即使全球都在進(jìn)行 AI 投資，美國(guó) AI 投資規(guī)模依舊領(lǐng)先于非美國(guó)地區(qū)的投融資規(guī)模。

數(shù)據(jù)來(lái)源：PitchBook

當(dāng)然，英偉達(dá)只是美國(guó)人工智能，特別是大語(yǔ)言模型產(chǎn)業(yè)優(yōu)勢(shì)的一部分?；谟⒄Z(yǔ)數(shù)據(jù)庫(kù)的模型訓(xùn)練，讓其他語(yǔ)言的用戶在進(jìn)入 LLM 市場(chǎng)時(shí)，面對(duì)天然的壁壘。

外國(guó)大型語(yǔ)言模型在處理當(dāng)?shù)卣Z(yǔ)言新詞時(shí)往往面臨理解上的困難。以中文為例，盡管 ChatGPT 等模型能夠識(shí)別包括中文在內(nèi)的多種語(yǔ)言，但由于其訓(xùn)練數(shù)據(jù)主要基于英文文本，因此在處理非英語(yǔ)語(yǔ)言時(shí)，可能會(huì)遭遇語(yǔ)言結(jié)構(gòu)、語(yǔ)法等方面的挑戰(zhàn)，從而影響其輸出效果。近日，一篇論文指出，相較于直接使用非英文語(yǔ)言作為提示詞，將非英文語(yǔ)言先翻譯成英文再進(jìn)行處理的輸出效果更佳。

此外，值得注意的是，中文與英文在訓(xùn)練與推理方面存在顯著的「不公平性」。由于中文語(yǔ)言的復(fù)雜性，AI 模型在運(yùn)用中文數(shù)據(jù)進(jìn)行準(zhǔn)確訓(xùn)練和推理時(shí)可能會(huì)遭遇挑戰(zhàn)，并且增加了中文模型應(yīng)用和維護(hù)的難度。同時(shí)，對(duì)于開(kāi)發(fā)大模型的公司來(lái)說(shuō)，構(gòu)建中文大模型由于需要額外的資源，或許就得承擔(dān)更大的成本。

具體而言，中文的 token 數(shù)通常比英文多出兩倍以上，這主要源于中文詞匯的豐富含義和靈活的語(yǔ)言組成。中文詞匯常常具有深厚的文化內(nèi)涵和豐富的語(yǔ)境意義，這極大地增加了語(yǔ)言的歧義性和處理難度。相比之下，英語(yǔ)的語(yǔ)法結(jié)構(gòu)相對(duì)簡(jiǎn)單，這在一定程度上使得英語(yǔ)在某些自然語(yǔ)言處理任務(wù)中相較于中文更易于被理解和處理。而 token 數(shù)量就是成本，畢竟使用 OpenAI 的 GPT-4 模型 API，每輸入 1 千 token 至少要花費(fèi) 0.03 美元。

針對(duì)上述觀點(diǎn)，有工程師指出，中文與英文在模型訓(xùn)練的基本原理上并無(wú)本質(zhì)區(qū)別。兩者均是將語(yǔ)句拆解為獨(dú)立的單詞，隨后將這些單詞納入向量數(shù)據(jù)庫(kù)，并通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)。實(shí)際上，OpenAI 在初創(chuàng)時(shí)期亦曾面臨效果不佳的困境，最終之所以能夠取得顯著成效，主要得益于數(shù)據(jù)量的不斷積累與擴(kuò)充。

因此，無(wú)論是哪種語(yǔ)言的大模型，其訓(xùn)練的核心原理均保持一致，并不會(huì)因語(yǔ)言差異而導(dǎo)致訓(xùn)練難度的顯著變化。美國(guó)在大語(yǔ)言模型領(lǐng)域并未展現(xiàn)出特別的優(yōu)勢(shì)，其之所以表現(xiàn)更為出色，主要得益于龐大的數(shù)據(jù)量。相比之下，中國(guó)在語(yǔ)料豐富性方面具備一定優(yōu)勢(shì)。然而，由于中文處理過(guò)程中涉及的 token 數(shù)量相對(duì)較多，這也導(dǎo)致了模型在運(yùn)行過(guò)程中所需的內(nèi)存和計(jì)算資源相應(yīng)增加，進(jìn)而使得成本有所上升。目前，國(guó)內(nèi)通義千問(wèn)在相關(guān)領(lǐng)域表現(xiàn)優(yōu)異，這同樣得益于其擁有大量的數(shù)據(jù)支持。

盡管數(shù)據(jù)量是最重要的因素，全球各地也都在圍繞本國(guó)語(yǔ)言去發(fā)展大語(yǔ)言模型。

非英語(yǔ)大模型的進(jìn)擊

HyperClova X 背后的另一個(gè)重要?jiǎng)訖C(jī)是追求更低的計(jì)算成本。使用 LLM 的費(fèi)用通常取決于它們被要求處理的數(shù)據(jù)量，它們將這些數(shù)據(jù)分解成為標(biāo)記的單詞或字符塊。標(biāo)記越多，成本就越高。

韓國(guó)互聯(lián)網(wǎng)巨頭 Naver 正積極研發(fā)其自有的大型語(yǔ)言模型——HyperClova X，并計(jì)劃將其廣泛應(yīng)用于旗下各類(lèi)服務(wù)中。此模型的引入，預(yù)計(jì)將深刻影響這個(gè)高度數(shù)字化的國(guó)家內(nèi)，Naver 眾多應(yīng)用程序的運(yùn)行與體驗(yàn)。Naver 的業(yè)務(wù)范疇廣泛，涵蓋了電子商務(wù)、搜索引擎、出行服務(wù)等多個(gè)領(lǐng)域。

為確保 HyperClova X 的輸出內(nèi)容能夠充分契合韓國(guó)國(guó)內(nèi)受眾的文化背景，Naver 特別組建了一支專(zhuān)業(yè)的安全專(zhuān)家團(tuán)隊(duì)。Naver 研究主管 Kang Min Yoo 指出，韓國(guó)社會(huì)擁有豐富的新詞文化，這些新詞往往令外國(guó)大型語(yǔ)言模型難以捉摸。同時(shí)，韓國(guó)民眾在對(duì)待政府調(diào)控房?jī)r(jià)等社會(huì)問(wèn)題上的態(tài)度，相較于美國(guó)民眾，顯得更為支持。因此，HyperClova X 在回應(yīng)相關(guān)問(wèn)題時(shí)，能夠比非韓國(guó)模型更準(zhǔn)確地反映這些社會(huì)價(jià)值觀。

Kang Min Yoo 表示，大型語(yǔ)言模型在處理問(wèn)題時(shí)，往往會(huì)根據(jù)上下文和地理位置的不同，得出不同的答案。這也是 HyperClova X 在研發(fā)過(guò)程中需要重點(diǎn)考慮的因素之一。

當(dāng)然，追求更低的計(jì)算成本也是推動(dòng) HyperClova X 研發(fā)的重要?jiǎng)恿χ弧Ｔ谑褂么笮驼Z(yǔ)言模型時(shí)，費(fèi)用通常與所需處理的數(shù)據(jù)量成正比。而數(shù)據(jù)量的多少，又直接決定了模型需要處理的標(biāo)記數(shù)量。因此，減少標(biāo)記數(shù)量，降低計(jì)算成本，成為 HyperClova X 研發(fā)過(guò)程中的一項(xiàng)重要任務(wù)。

Naver 宣稱(chēng)，其模型相較于 OpenAI 的 GPT-3 含有 6,500 倍之多的韓語(yǔ)數(shù)據(jù)，從而能夠?qū)㈨n語(yǔ)查詢分解為更少的標(biāo)記，進(jìn)而實(shí)現(xiàn)成本的有效降低。據(jù)對(duì)西方大型語(yǔ)言模型 LLM 的獨(dú)立分析顯示，處理非英語(yǔ)語(yǔ)言的查詢通常需要比英語(yǔ)更多的標(biāo)記。

在印度，有著類(lèi)似的故事上演。人工智能初創(chuàng)公司 Sarvam AI 的創(chuàng)始人維韋克·拉加萬(wàn)（Vivek Raghavan）正在致力于構(gòu)建印地語(yǔ)專(zhuān)用的模型 OpenHathi，以提升其在印地語(yǔ)環(huán)境中的運(yùn)行效率。盡管印地語(yǔ)是全球使用最為廣泛的語(yǔ)言之一，但拉加萬(wàn)指出，印地語(yǔ)在 Common Crawl 這一網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)庫(kù)中所占的數(shù)據(jù)比例僅為約 0.17%。而 Common Crawl 正是許多全球最大型的人工智能公司用于訓(xùn)練其模型的重要資源。

本地 AI 模型降低成本的有效性已引起了知名投資者的廣泛關(guān)注。硅谷著名風(fēng)險(xiǎn)投資家 Vinod Khosla 透露，他通常不會(huì)投資于與 OpenAI 及其他行業(yè)領(lǐng)先者直接競(jìng)爭(zhēng)的公司，因?yàn)樗J(rèn)為新創(chuàng)公司難以在競(jìng)爭(zhēng)中占得先機(jī)。然而，他卻為 Sarvam AI 和日本初創(chuàng)公司 Sakana AI 破例，對(duì)這兩家公司進(jìn)行了投資。談及印度語(yǔ)言，Khosla 表示，基于英語(yǔ)的人工智能系統(tǒng)在處理印度語(yǔ)言時(shí)的效率往往比專(zhuān)門(mén)針對(duì)這些語(yǔ)言構(gòu)建的模型低三到五倍。他強(qiáng)調(diào)在印度，降低成本至關(guān)重要，使用模型的每分鐘成本必須達(dá)到最低。

歐洲的 AI 布局

在激烈的競(jìng)爭(zhēng)中，歐洲企業(yè)值得注意。要知道，如果溯源到人工智能的歷史，歐洲才是這一技術(shù)的發(fā)源地。英裔加拿大人 Geoffrey Hinton 和法國(guó)出生的 Yann LeCun，兩人被稱(chēng)為「人工智能教父」。

非美國(guó)地區(qū) AI 投資規(guī)模前十案例

根據(jù)上表所呈現(xiàn)的數(shù)據(jù)，歐洲在人工智能領(lǐng)域的投資規(guī)模明顯領(lǐng)先于其他地區(qū)。此外，在過(guò)去的十年中，歐洲的監(jiān)管機(jī)構(gòu)著手制定更為嚴(yán)謹(jǐn)且嚴(yán)格的基礎(chǔ)規(guī)則，旨在讓科技巨頭公司遵從其指導(dǎo)原則。歐盟及其成員國(guó)，包括德國(guó)和英國(guó)在內(nèi)，已經(jīng)通過(guò)了多項(xiàng)隱私法規(guī)，比如 2016 年實(shí)施的《通用數(shù)據(jù)保護(hù)條例》，旨在嚴(yán)懲濫用消費(fèi)者個(gè)人數(shù)據(jù)的互聯(lián)網(wǎng)公司。

最近，歐盟更是頒布了《數(shù)字市場(chǎng)法案》，以遏制科技領(lǐng)域的「守門(mén)人」通過(guò)不正當(dāng)手段打壓規(guī)模較小的競(jìng)爭(zhēng)對(duì)手。

歐洲人工智能的初創(chuàng)企業(yè)日益增多，并逐漸吸引了硅谷投資者的關(guān)注。法國(guó)版的 OpenAI——Mistral，迄今為止已籌集了超過(guò) 10 億美元的資金，其中包括本周早些時(shí)候宣布的一輪融資，其估值據(jù)報(bào)道已達(dá)到 62 億美元。此外，法國(guó)人工智能公司 H（原名 Holistic）也從前谷歌首席執(zhí)行官埃里克·施密特以及 LVMH 首席執(zhí)行官伯納德·阿諾等業(yè)界知名人士處籌集了 2.2 億美元的資金。

但又如近現(xiàn)代西方政治、經(jīng)濟(jì)的變化一樣，美國(guó)卻再次「反超」了歐洲。這或許與歐洲文化有關(guān)。歐洲的商業(yè)文化更加側(cè)重于謹(jǐn)慎而非單純的增長(zhǎng)，這種傾向可能在一定程度上導(dǎo)致歐洲在突破性技術(shù)領(lǐng)域的成功案例相較于美國(guó)有所減少。歐洲歷來(lái)不乏杰出的大學(xué)與卓越的人才，然而，這些優(yōu)秀的人才和學(xué)術(shù)資源在商業(yè)化方面并未得到充分有效地利用。

國(guó)內(nèi)方面，不久前商湯科技發(fā)布了首個(gè)粵語(yǔ)大模型 Sensechat?？梢园l(fā)現(xiàn) LLM 的競(jìng)爭(zhēng)已經(jīng)從硬件到軟件全面鋪開(kāi)。在這場(chǎng) AI 主權(quán)的競(jìng)爭(zhēng)中，美國(guó)正在承受來(lái)自全世界的追趕。