蘋果或推AI手機(jī)?論文顯示其正研究放棄“嘿Siri”,轉(zhuǎn)而使用AI大模型
近日發(fā)表的一篇論文顯示,蘋果公司的研究人員正在探索是否有可能使用人工智能來檢測用戶何時對 iPhone 等設(shè)備說話,從而消除對 Siri 等觸發(fā)詞的技術(shù)需求。
在一篇未經(jīng)同行評審的預(yù)印本中,研究人員訓(xùn)練了一個大型語言模型,訓(xùn)練所使用的聲學(xué)數(shù)據(jù),來自智能手機(jī)所捕獲的語音和背景噪聲,借此試圖從中尋找用戶通過語音喚醒設(shè)備的規(guī)律。
研究人員表示,該模型中的一部分是用 OpenAI 的 GPT-2 構(gòu)建的,“因為它相對較小,有可能在智能手機(jī)等設(shè)備上運(yùn)行”。
該論文指出,訓(xùn)練模型所用的數(shù)據(jù)包括超過 129 小時的聲音數(shù)據(jù),以及額外的文本數(shù)據(jù),但沒有給出這些數(shù)據(jù)來自哪里。
七位作者中有六位列出了他們與蘋果的關(guān)系,其中三位的 LinkedIn 資料顯示,他們在 Siri 團(tuán)隊工作。而第七位作者在該公司實習(xí)期間做了與該論文相關(guān)的工作。
該論文稱,研究結(jié)果很有希望。與純音頻或純文本模型相比,模型能夠做出更準(zhǔn)確的預(yù)測,并且其性能會隨著模型尺寸的增大而提升。
除了探索這個研究問題,目前還不清楚蘋果是否打算取消“嘿 Siri”這個經(jīng)典的語音助手觸發(fā)短語。
該公司和論文作者都沒有立即回復(fù)置評請求。
目前,Siri 可以短暫地保存少量音頻,但在聽到觸發(fā)短語之前不會開始錄制或準(zhǔn)備回答用戶。
美國斯坦福大學(xué)“以人為本”人工智能研究院的隱私和數(shù)據(jù)政策研究員簡·金(Jen King)說,移除“嘿 Siri”觸發(fā)詞可能會增加人們對電子設(shè)備“總是在監(jiān)聽”的擔(dān)憂。
此前,蘋果處理音頻數(shù)據(jù)的方式曾受到隱私倡導(dǎo)者的審查。2019 年,《衛(wèi)報》的報道顯示,該公司的質(zhì)量控制承包商在處理 Siri 數(shù)據(jù)時,經(jīng)常聽到從 iPhone 收集的私人音頻,包括醫(yī)生和患者之間的敏感對話。
兩年后,該公司做出了政策改變,包括在設(shè)備上存儲更多數(shù)據(jù),并允許用戶選擇不允許他們的錄音被用于改進(jìn) Siri。
2021 年,一場針對該公司的集體訴訟在美國加利福尼亞州提起,指控 Siri 即使在未激活的情況下也會被打開。
(來源:蘋果中國官網(wǎng),圖文無關(guān))
金表示,“嘿 Siri”提示詞對用戶來說十分重要。其在接受《麻省理工科技評論》采訪時表示,這些提示詞讓人們了解設(shè)備何時在聽,去掉這些激活詞可能意味著便利性的提升,但降低了透明度。
這項研究沒有詳細(xì)說明,觸發(fā)詞是否會被任何其他信號所取代。
她說:“一家公司是否應(yīng)該強(qiáng)制實施這種形式的互動,我對此持質(zhì)疑的態(tài)度?!?/span>
最近的一系列信號表明,蘋果計劃在其產(chǎn)品中加入更多的人工智能技術(shù),該論文是最新信號之一。該公司被認(rèn)為在人工智能競賽中落后于其他科技巨頭。
根據(jù) VentureBeat 報道,該公司正在構(gòu)建一個名為 MM1 的生成式人工智能模型,該模型可以處理文本和圖像,這將是該公司對 Open AI ChatGPT 和其他科技巨頭的聊天機(jī)器人的回應(yīng)。
與此同時,彭博社報道稱,該公司正在與 Google 就在 iPhone 中使用該公司的人工智能模型 Gemini 展開對話。此外,《華爾街日報》還報道稱,蘋果已與百度就使用該公司的人工智能產(chǎn)品進(jìn)行了對話。
支持:Ren
01/ 復(fù)雜分子合成新方法!科學(xué)家將純水作為光化學(xué)反應(yīng)溶劑,可用于大規(guī)模流式合成和藥物修飾
02/ 光芯片領(lǐng)域迎新進(jìn)展:科學(xué)家研發(fā)鈮酸鋰微波光芯片,兼具超寬帶處理和高精度計算
03/ 二氧化碳做輪胎!椿范立院士團(tuán)隊用CO2造出丁二烯橡膠輪胎,正和業(yè)界合作用于賽車
04/ 先天性耳聾基因療法獲重大突破,復(fù)旦團(tuán)隊研發(fā)耳聾基因治療藥物,讓多位耳聾患者恢復(fù)聽力
05/ 中科大團(tuán)隊開發(fā)新型電解體系,成功制備高濃度甲酸,可為燃料電池提供動力
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。