博客專欄

EEPW首頁 > 博客 > 你知道嗎?當(dāng)你聽到一個自己的聲音的時候"可能不是你說的"

你知道嗎?當(dāng)你聽到一個自己的聲音的時候"可能不是你說的"

發(fā)布人:電巢 時間:2022-11-24 來源:工程師 發(fā)布文章

聲音(sound)是由物體振動產(chǎn)生的聲波,是通過介質(zhì)(空氣或固體、液體)傳播并能被人或動物聽覺器官所感知的波動現(xiàn)象。最初發(fā)出振動(震動)的物體叫聲源。

聲音是一種波,可以被人別的聲音的頻率在20Hz-20000Hz之間。而每個人的聲音都有這獨(dú)特的特點(diǎn)。

image.png


不過最近呢發(fā)現(xiàn)了一個非常酷的網(wǎng)站,叫做library。這個網(wǎng)站呢非常厲害,就是它能夠先把你的聲音進(jìn)行采樣。采用完之后,用它背后非常厲害的演算法去進(jìn)行模擬,然后重新混合合成出一個虛擬的屬于你自己的聲音。也就是說當(dāng)它合成完之后呢,你只要用打字的方式輸入進(jìn)去。他就可以用你的聲音代替你去把這段話念出來,是不是這樣?

今天我們就來試試看看這個網(wǎng)站到底能不能把我的聲音成功的模擬出來。不過這個畢竟是外國人的網(wǎng)站啊,它這個進(jìn)行采樣的文字全部都是用英文寫出來的。


好,那廢話不多說,我們直接開始吧。進(jìn)到網(wǎng)頁畫面。首先這個是我的這個welcome 賬號,然后你就按create your digital voice 這邊,你可以看到上面說you still have to read at least。三十個sentence 代表說你要練至少三十段話,三十個段落,它才有足夠的這個資料量去進(jìn)行模擬跟合成。感覺有點(diǎn)詭異。

練完上面的三十段話,然后我再找一段話,直接輸入到對話框,然后點(diǎn)擊播放,就可以聽到擬合出來自己的聲音,我覺得他的發(fā)音比我還標(biāo)準(zhǔn)的。被機(jī)器人比過去,不過好像真的有一點(diǎn)點(diǎn)像,只是他的聲音比較平淡,就是非常冷靜,沒有任何高低起伏的聲音。但是我自己本人講是稍微有一點(diǎn)高低起伏的。


以上就是這一次為大家測試的這個liar bird,這個非常奇妙的網(wǎng)站。大家可以趕快去下面研究外,趕快去下面自己試試,看看它會不會成功的模擬出屬于你的虛擬聲音。不過有些人會擔(dān)心說你是不是把聲音上來上去,它可能會利用你的聲音合成出來的聲音去做什么壞事什么的,這些都可以刪掉。不過大家也知道他講他刪掉,你也不知道他是不是真的刪掉,只是說大家玩這個東西就自己先知道一下風(fēng)險。

我其實(shí)覺得如果說以后像很多人配音,不是說喜歡用郭郭小姐嗎?郭郭小姐聽起來就很死板,對不對?當(dāng)然最近有那個新的系統(tǒng)可以讓他練起來。很厲害,很像真人,但是那個畢竟是未來才會套用進(jìn)來的。所以第一個我覺得它未來的應(yīng)用就是在比如說一些演講演說的影片里面,經(jīng)常做雙聲道的話,它就可以做的比你用另外一個人來配音的來自然許多。因?yàn)楹芏嗳丝催^這種電視節(jié)目,他可能原本講話的是一個非常非常高大粗壯的男生,但是那時候給他可能用一個女生的配音員口語語言去給他配音。怎么就非常不搭嘛?所以如果說可以用這樣的方式讓


智商名流,比如說什么奧巴馬、川普這些人,你想他的聲音轉(zhuǎn)換成中英文,轉(zhuǎn)換成中文,或者是你想把蔡英文的聲音轉(zhuǎn)換成英文的話,這樣子就非常非常方便嘛,對不對?在第一個就是我覺得他一定要加強(qiáng)他的這個多語言的切換好不好?不要再讓我們是我們想要用念中文,但是他居然是先把我變成外國人在練中文這樣子。當(dāng)然是很有趣,沒錯,但是在應(yīng)用上面可能就不是這么廣了。

好了,以上就是這次跟各位知道這個liar bird 非常非常有趣的這個網(wǎng)站了。有興趣的話可以試一下。但是我而個人覺得這個擬合的聲音還是有點(diǎn)死板,感覺聽著冷冰冰的,沒有任何情感的,所以跟真人說出來的話還是有區(qū)別的。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 聲音

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉