深度:語音技術(shù)革命正在改變?nèi)祟惖慕涣鞣绞?/h1>
編者按:無論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國別、語種的各種限制。未來,我們的交流對(duì)象也將不再局限在人類,可以是機(jī)器、可以是動(dòng)物。
語言是我們?nèi)粘=涣鞯闹饕绞剑梢宰屛覀兛焖倭私鈱?duì)方的意圖,并做出適當(dāng)?shù)姆磻?yīng)。但對(duì)很多語言障礙者而言,說話這一看似簡單的行為依舊是難以想象的困難。
本文引用地址:http://m.butianyuan.cn/article/201811/394166.htm 語言是件極其復(fù)雜的事情,不僅僅是文字表面上的發(fā)音,還與音量、音調(diào)、速度、說話環(huán)境等眾多因素密切相關(guān)。
同一個(gè)詞或句子,在不同的場合、不同的音量和速度,所表達(dá)的意義也是不同的。比如“你吃了么?”,可以是兩人見面的問候語;也可以是我正準(zhǔn)備去吃飯,如果你沒吃,我們可以結(jié)伴去吃飯;還可以是戀人間的關(guān)懷;甚至可以是小孩子玩游戲時(shí),跟玩偶的對(duì)話。
語言環(huán)境是如此的復(fù)雜,而對(duì)于那些因受傷或生病而無法說話的人,我們怎樣才能更好的理解他們的想法?他們又如何能更快更有效的表達(dá)自己的意圖?
新技術(shù)正在快速推動(dòng)語音生成設(shè)備的進(jìn)步
自20世紀(jì)60年代以來,一些語音技術(shù)的先行者就致力于研發(fā)語音生成設(shè)備(SGDs)來幫助語言障礙者。
1963年,英國人Maling和Clarkson開發(fā)了專為嚴(yán)重身體殘疾的人設(shè)計(jì)的個(gè)人通信工具POSSUM,這是一臺(tái)帶開關(guān)控制掃描裝置的打字機(jī)。
自此,隨著語音合成算法的進(jìn)步及微處理器技術(shù)的發(fā)展,電子輔助和替代通信系統(tǒng)(AAC)得以快速普及。通信輔助設(shè)備也變得越來越小巧,功能也越來越強(qiáng)大。
目前,電子輔助和替代通信系統(tǒng)(AAC)、語音生成設(shè)備(SGDs)、語音輸出通信輔助設(shè)備(VOCA)已經(jīng)在美國幫助了200多萬人。患有肌萎縮性側(cè)索硬化癥(ALS)、腦癱、閉鎖綜合征、多發(fā)性硬化癥、帕金森、腦中風(fēng)、創(chuàng)傷性腦損傷等交流障礙或殘疾人都可以使用這類語音生成設(shè)備。著名物理學(xué)家史蒂芬·霍金就使用語音生成裝置與他人進(jìn)行交流。
在過去幾年中,隨著人工智能技術(shù)與語音技術(shù)的突破,以及數(shù)字設(shè)備功能的指數(shù)級(jí)增長,數(shù)字化語音正在改變?nèi)藗兊慕涣鞣绞剑貏e是翻譯和醫(yī)療等領(lǐng)域。
據(jù)相關(guān)數(shù)據(jù)顯示, 2017年,語音生成設(shè)備市場規(guī)模為1.9億美元,預(yù)計(jì)到2025年將達(dá)到3.3億美元。
各科技創(chuàng)新公司和谷歌、微軟等科技巨頭都在努力通過輔助應(yīng)用APP、語音生成設(shè)備和腦機(jī)接口技術(shù)幫助語言障礙者能夠更有效地與他人進(jìn)行交流。
1)輔助應(yīng)用APP
智能手機(jī)、平板電腦和數(shù)字觸摸屏為患者提供更加直接的交流方式。如自閉癥患者可以通過觸摸屏上的物品圖像、活動(dòng)圖片或符號(hào)來表達(dá)他們的需求。
Proloquo2Go就是這樣一款面向語言障礙患者的輔助交流工具,適用于自閉癥、唐氏綜合癥、腦癱和其他診斷患者,目前已有20多萬用戶。
此外,還有很多APP可以幫助用戶“說話”,如SayIt!和Predictable這兩款文字處理應(yīng)用,可以將用戶輸入的文字內(nèi)容轉(zhuǎn)化成語音,并具有智能聯(lián)想和自動(dòng)更正單詞的功能。
語言是我們?nèi)粘=涣鞯闹饕绞剑梢宰屛覀兛焖倭私鈱?duì)方的意圖,并做出適當(dāng)?shù)姆磻?yīng)。但對(duì)很多語言障礙者而言,說話這一看似簡單的行為依舊是難以想象的困難。
本文引用地址:http://m.butianyuan.cn/article/201811/394166.htm語言是件極其復(fù)雜的事情,不僅僅是文字表面上的發(fā)音,還與音量、音調(diào)、速度、說話環(huán)境等眾多因素密切相關(guān)。
同一個(gè)詞或句子,在不同的場合、不同的音量和速度,所表達(dá)的意義也是不同的。比如“你吃了么?”,可以是兩人見面的問候語;也可以是我正準(zhǔn)備去吃飯,如果你沒吃,我們可以結(jié)伴去吃飯;還可以是戀人間的關(guān)懷;甚至可以是小孩子玩游戲時(shí),跟玩偶的對(duì)話。
語言環(huán)境是如此的復(fù)雜,而對(duì)于那些因受傷或生病而無法說話的人,我們怎樣才能更好的理解他們的想法?他們又如何能更快更有效的表達(dá)自己的意圖?
新技術(shù)正在快速推動(dòng)語音生成設(shè)備的進(jìn)步
自20世紀(jì)60年代以來,一些語音技術(shù)的先行者就致力于研發(fā)語音生成設(shè)備(SGDs)來幫助語言障礙者。
1963年,英國人Maling和Clarkson開發(fā)了專為嚴(yán)重身體殘疾的人設(shè)計(jì)的個(gè)人通信工具POSSUM,這是一臺(tái)帶開關(guān)控制掃描裝置的打字機(jī)。
自此,隨著語音合成算法的進(jìn)步及微處理器技術(shù)的發(fā)展,電子輔助和替代通信系統(tǒng)(AAC)得以快速普及。通信輔助設(shè)備也變得越來越小巧,功能也越來越強(qiáng)大。
目前,電子輔助和替代通信系統(tǒng)(AAC)、語音生成設(shè)備(SGDs)、語音輸出通信輔助設(shè)備(VOCA)已經(jīng)在美國幫助了200多萬人。患有肌萎縮性側(cè)索硬化癥(ALS)、腦癱、閉鎖綜合征、多發(fā)性硬化癥、帕金森、腦中風(fēng)、創(chuàng)傷性腦損傷等交流障礙或殘疾人都可以使用這類語音生成設(shè)備。著名物理學(xué)家史蒂芬·霍金就使用語音生成裝置與他人進(jìn)行交流。
在過去幾年中,隨著人工智能技術(shù)與語音技術(shù)的突破,以及數(shù)字設(shè)備功能的指數(shù)級(jí)增長,數(shù)字化語音正在改變?nèi)藗兊慕涣鞣绞剑貏e是翻譯和醫(yī)療等領(lǐng)域。
據(jù)相關(guān)數(shù)據(jù)顯示, 2017年,語音生成設(shè)備市場規(guī)模為1.9億美元,預(yù)計(jì)到2025年將達(dá)到3.3億美元。
各科技創(chuàng)新公司和谷歌、微軟等科技巨頭都在努力通過輔助應(yīng)用APP、語音生成設(shè)備和腦機(jī)接口技術(shù)幫助語言障礙者能夠更有效地與他人進(jìn)行交流。
1)輔助應(yīng)用APP
智能手機(jī)、平板電腦和數(shù)字觸摸屏為患者提供更加直接的交流方式。如自閉癥患者可以通過觸摸屏上的物品圖像、活動(dòng)圖片或符號(hào)來表達(dá)他們的需求。
Proloquo2Go就是這樣一款面向語言障礙患者的輔助交流工具,適用于自閉癥、唐氏綜合癥、腦癱和其他診斷患者,目前已有20多萬用戶。
此外,還有很多APP可以幫助用戶“說話”,如SayIt!和Predictable這兩款文字處理應(yīng)用,可以將用戶輸入的文字內(nèi)容轉(zhuǎn)化成語音,并具有智能聯(lián)想和自動(dòng)更正單詞的功能。
評(píng)論