沖電氣推出語(yǔ)音合成軟件 真實(shí)再現(xiàn)自己原音
沖電氣工業(yè)株式會(huì)社(OKI)日前宣布,推出連語(yǔ)氣、語(yǔ)調(diào)等特征也非常接近自然嗓音進(jìn)行發(fā)聲朗讀,能再現(xiàn)自己聲音的軟件“Polluxstar®”。通過(guò)個(gè)人電腦等使用“Polluxstar”,可以避免用無(wú)個(gè)性的機(jī)械合成音發(fā)聲,實(shí)現(xiàn)用具有本人講話(huà)氣氛、個(gè)性的“自己的聲音”進(jìn)行交流溝通。
本文引用地址:http://m.butianyuan.cn/article/86201.htm沖電氣長(zhǎng)期以來(lái)積極研究開(kāi)發(fā)為語(yǔ)音通信提供后盾的技術(shù),在VoIP、CTI市場(chǎng)占據(jù)相當(dāng)高的份額,擁有驕人業(yè)績(jī)。在將文本數(shù)據(jù)轉(zhuǎn)換成語(yǔ)音數(shù)據(jù)的語(yǔ)音合成技術(shù)(TTS:Text-To-Speech)領(lǐng)域也進(jìn)一步超越了以往技術(shù),積極進(jìn)行既實(shí)現(xiàn)清晰易聽(tīng),同時(shí)還能體現(xiàn)本人個(gè)性的語(yǔ)音技術(shù)開(kāi)發(fā)。
語(yǔ)音是最基本的交流溝通手段之一,不單純是用語(yǔ)言表達(dá)意思,還承擔(dān)著傳遞“非此人莫屬”(本人性)的重要責(zé)任。沖電氣以一般人按普通發(fā)聲規(guī)律不一定完全正確的語(yǔ)音數(shù)據(jù),在不勉為其難的收錄量下也能再現(xiàn)“自己的聲音”為目標(biāo)積極推進(jìn)研究開(kāi)發(fā)工作。該項(xiàng)研究成果表明,可以構(gòu)筑高效穩(wěn)定的語(yǔ)音數(shù)據(jù)庫(kù),成功實(shí)用化了再現(xiàn)“自己的聲音”的技術(shù)。
大阪藝術(shù)大學(xué)執(zhí)教于信息工學(xué)的牧泉教授因病必須摘除聲帶,沖電氣在牧教授手術(shù)前,收錄了他的語(yǔ)音數(shù)據(jù),并將這些語(yǔ)音數(shù)據(jù)編入自己的聲音軟件“Polluxstar”提供牧教授使用。牧教授從2008年4月開(kāi)始使用本軟件上的“自己的聲音”,在大學(xué)里重新開(kāi)始授課。結(jié)果證明“Polluxstar”軟件已經(jīng)達(dá)到了在普通人的日常生活中也能有效使用的水平。而且,在向普通人提供該軟件之前進(jìn)一步完善了功能。
沖電氣對(duì)于因疾病等原因失聲的人士,作為代替這些人發(fā)聲,支援其本人及家庭成員生活的工具,開(kāi)始銷(xiāo)售“Polluxstar”軟件。本公司認(rèn)準(zhǔn)運(yùn)用個(gè)人特性的聲音必將發(fā)揮重要作用,準(zhǔn)備通過(guò)在各個(gè)領(lǐng)域擴(kuò)大該軟件的應(yīng)用范圍,積極推進(jìn)不斷豐富語(yǔ)音交流的語(yǔ)音合成技術(shù)的開(kāi)發(fā)。
【主要特點(diǎn)】
以合理的成本制作能再現(xiàn)自己聲音的語(yǔ)音數(shù)據(jù)庫(kù)
為了完美再現(xiàn)本人的語(yǔ)調(diào)?氣氛,必須高效收集充足的語(yǔ)音數(shù)據(jù),并且將之?dāng)?shù)據(jù)庫(kù)化。用于語(yǔ)音合成的語(yǔ)料庫(kù)TTS技術(shù),是在國(guó)際電氣通信基礎(chǔ)技術(shù)研究所(ATR)開(kāi)發(fā)的面向大規(guī)模語(yǔ)料庫(kù)的語(yǔ)音合成技術(shù)中,結(jié)合了沖電氣自主開(kāi)發(fā)的面向小規(guī)模語(yǔ)料庫(kù)的數(shù)據(jù)庫(kù)技術(shù)的技術(shù),既能保持非常逼真的自然嗓音感,又能以合理的成本提供再現(xiàn)“自己的聲音”的Polluxstar軟件。包括收錄語(yǔ)音在內(nèi),構(gòu)筑語(yǔ)音數(shù)據(jù)庫(kù)所需時(shí)間約為1個(gè)月。
廣泛支持日常生活用語(yǔ)
日常生活中使用的言詞、語(yǔ)調(diào)因人而異。在預(yù)先準(zhǔn)備的講稿中加入客戶(hù)固有的原稿,可以加強(qiáng)該客戶(hù)特有的語(yǔ)調(diào)氣氛。而且,可以事先登錄客套話(huà)、對(duì)親朋好友的稱(chēng)呼等最能表現(xiàn)此人特點(diǎn)的特定詞組語(yǔ)音數(shù)據(jù)。從輸入的文字串中識(shí)別已登錄的詞組,原樣輸出此語(yǔ)音數(shù)據(jù)。通過(guò)這些方法,可以消除與合成音的音質(zhì)差距,再現(xiàn)能體現(xiàn)本人個(gè)性的自然而微妙的語(yǔ)氣。
在日常生活中方便實(shí)用的用戶(hù)界面
以大量驗(yàn)證試驗(yàn)等獲得的經(jīng)驗(yàn)為基礎(chǔ),實(shí)現(xiàn)了在日常生活中切實(shí)可用的語(yǔ)音合成用戶(hù)界面。加上以聊天軟件為特點(diǎn)的能實(shí)時(shí)從鍵盤(pán)輸入文章的功能,只要預(yù)先登錄經(jīng)常使用的語(yǔ)言技巧、事先決定了內(nèi)容的文章,根據(jù)文本列表(Text Feeder),只需單擊就能實(shí)現(xiàn)語(yǔ)音輸出。還能支持一對(duì)一的對(duì)話(huà)、眾人前的演講等不同使用情況。
評(píng)論