你知道嗎？當(dāng)你聽到一個自己的聲音的時候"可能不是你說的"

發(fā)布人：電巢時間：2022-11-24 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

聲音（sound）是由物體振動產(chǎn)生的聲波，是通過介質(zhì)（空氣或固體、液體）傳播并能被人或動物聽覺器官所感知的波動現(xiàn)象。最初發(fā)出振動（震動）的物體叫聲源。

聲音是一種波，可以被人別的聲音的頻率在20Hz-20000Hz之間。而每個人的聲音都有這獨特的特點。

不過最近呢發(fā)現(xiàn)了一個非常酷的網(wǎng)站，叫做library。這個網(wǎng)站呢非常厲害，就是它能夠先把你的聲音進(jìn)行采樣。采用完之后，用它背后非常厲害的演算法去進(jìn)行模擬，然后重新混合合成出一個虛擬的屬于你自己的聲音。也就是說當(dāng)它合成完之后呢，你只要用打字的方式輸入進(jìn)去。他就可以用你的聲音代替你去把這段話念出來，是不是這樣？

今天我們就來試試看看這個網(wǎng)站到底能不能把我的聲音成功的模擬出來。不過這個畢竟是外國人的網(wǎng)站啊，它這個進(jìn)行采樣的文字全部都是用英文寫出來的。

好，那廢話不多說，我們直接開始吧。進(jìn)到網(wǎng)頁畫面。首先這個是我的這個welcome 賬號，然后你就按create your digital voice 這邊，你可以看到上面說you still have to read at least。三十個sentence 代表說你要練至少三十段話，三十個段落，它才有足夠的這個資料量去進(jìn)行模擬跟合成。感覺有點詭異。

練完上面的三十段話，然后我再找一段話，直接輸入到對話框，然后點擊播放，就可以聽到擬合出來自己的聲音，我覺得他的發(fā)音比我還標(biāo)準(zhǔn)的。被機(jī)器人比過去，不過好像真的有一點點像，只是他的聲音比較平淡，就是非常冷靜，沒有任何高低起伏的聲音。但是我自己本人講是稍微有一點高低起伏的。

以上就是這一次為大家測試的這個liar bird，這個非常奇妙的網(wǎng)站。大家可以趕快去下面研究外，趕快去下面自己試試，看看它會不會成功的模擬出屬于你的虛擬聲音。不過有些人會擔(dān)心說你是不是把聲音上來上去，它可能會利用你的聲音合成出來的聲音去做什么壞事什么的，這些都可以刪掉。不過大家也知道他講他刪掉，你也不知道他是不是真的刪掉，只是說大家玩這個東西就自己先知道一下風(fēng)險。

我其實覺得如果說以后像很多人配音，不是說喜歡用郭郭小姐嗎？郭郭小姐聽起來就很死板，對不對？當(dāng)然最近有那個新的系統(tǒng)可以讓他練起來。很厲害，很像真人，但是那個畢竟是未來才會套用進(jìn)來的。所以第一個我覺得它未來的應(yīng)用就是在比如說一些演講演說的影片里面，經(jīng)常做雙聲道的話，它就可以做的比你用另外一個人來配音的來自然許多。因為很多人看過這種電視節(jié)目，他可能原本講話的是一個非常非常高大粗壯的男生，但是那時候給他可能用一個女生的配音員口語語言去給他配音。怎么就非常不搭嘛？所以如果說可以用這樣的方式讓

智商名流，比如說什么奧巴馬、川普這些人，你想他的聲音轉(zhuǎn)換成中英文，轉(zhuǎn)換成中文，或者是你想把蔡英文的聲音轉(zhuǎn)換成英文的話，這樣子就非常非常方便嘛，對不對？在第一個就是我覺得他一定要加強(qiáng)他的這個多語言的切換好不好？不要再讓我們是我們想要用念中文，但是他居然是先把我變成外國人在練中文這樣子。當(dāng)然是很有趣，沒錯，但是在應(yīng)用上面可能就不是這么廣了。

好了，以上就是這次跟各位知道這個liar bird 非常非常有趣的這個網(wǎng)站了。有興趣的話可以試一下。但是我而個人覺得這個擬合的聲音還是有點死板，感覺聽著冷冰冰的，沒有任何情感的，所以跟真人說出來的話還是有區(qū)別的。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。