DeepMind的TF Hub demo詮釋「史上最強(qiáng) GAN 圖像生成器」
上圖是樣本生成單元格的控制界面,可以控制:生成樣本數(shù)量、截?cái)嘀?、噪聲種子、和類別的參數(shù)。我們可以看看下圖的例子來說明各自的作用。
本文引用地址:http://m.butianyuan.cn/article/201811/394648.htm![](http://editerupload.eepw.com.cn/201811/95be52d48e9b68f91fe8cf9ca8f9cb33.png)
如上圖所示,很容易看出,生成樣本數(shù)量(10)和類別(芝士漢堡)就是字面的意思,那么截?cái)嘀?、噪聲種子分別有什么作用呢?僅用一張圖看不出來,我們修改一下參數(shù)看看區(qū)別就行了。
這時(shí),我們只需要拖動(dòng)滑塊來修改參數(shù),然后 Colab 會(huì)立刻執(zhí)行新參數(shù)設(shè)置下的任務(wù),但這也意味著我們一次只能修改一個(gè)參數(shù)。
經(jīng)過多次實(shí)驗(yàn),我們發(fā)現(xiàn),截?cái)嘀翟酱?,生成樣本的多樣性越?實(shí)際上,截?cái)嘀悼刂频氖请[變量分布(一般呈高斯型)的截?cái)嗑嚯x,也就是采樣范圍,因此不難理解其對(duì)多樣性的作用。
![](http://editerupload.eepw.com.cn/201811/a6580287724a8d5296eb8d6d151ec718.png)
![](http://editerupload.eepw.com.cn/201811/4d31a73af71413b1cf5adf7b6a6f0f0d.png)
![](http://editerupload.eepw.com.cn/201811/1ffcee5e5fb1722e7be94230bcd5ed8f.png)
![](http://editerupload.eepw.com.cn/201811/413250e6344383c8330ecd12cb4657d3.png)
從上到下:截?cái)嘀禐?0.02、0.26、0.58、1.0 的芝士漢堡生成結(jié)果。
而噪聲種子的值對(duì)生成結(jié)果的影響主要是每次生成樣本的初始條件,從而最終生成結(jié)果也會(huì)不同,可以用它來改善生成多樣性。
最后是類別參數(shù)的控制,該 Colab 中提供了 1000 個(gè)類別選項(xiàng),可玩性很足,但要找到自己想要的類別實(shí)在有點(diǎn)困難。可以這樣操作,雙擊這個(gè)單元格,代碼會(huì)顯示在左側(cè),右側(cè)會(huì)出現(xiàn)鉛筆圖標(biāo),點(diǎn)擊該圖標(biāo)后就能查看完整列表,在這個(gè)列表下用 Ctrl+F 搜索類別的編號(hào),再返回修改,這樣就簡(jiǎn)單多了。
![](http://editerupload.eepw.com.cn/201811/9d26689b6a4879ceb17ff80934c82ce0.png)
![](http://editerupload.eepw.com.cn/201811/c047fc588bc129ce21fb66f88938bdad.png)
我們嘗試生成了埃及貓(285)和大熊貓(388)的樣本:
![](http://editerupload.eepw.com.cn/201811/0993f97e0e8274f44e69bd5a739630cd.png)
![](http://editerupload.eepw.com.cn/201811/1b233955453517d956593cc469cd2c8c.png)
可以發(fā)現(xiàn),埃及貓的眼神不太對(duì),大熊貓有點(diǎn)營(yíng)養(yǎng)不良。論文給出的結(jié)果很真實(shí)自然,但在這個(gè) Colab 實(shí)驗(yàn)中我們也能發(fā)現(xiàn)存在很多「不自然」的生成樣本。
接下來,我們來嘗試圖像插值任務(wù)。
![](http://editerupload.eepw.com.cn/201811/a49d689895fbfd9758576327f4912250.png)
如上圖所示,這個(gè)任務(wù)的可控參數(shù)有:樣本數(shù)量、插值數(shù)量、截?cái)嘀?、噪聲種子、以及用于插值的圖像類別 A 和 B。樣本數(shù)量是指每次插值時(shí)類別 A 和類別 B 的的初始樣本數(shù)量,如下圖所示樣本數(shù)量為 2。下圖展示了一些示例,供大家參考。注意該圖像插值是生成樣本之間的插值,所以左右兩側(cè)的原圖也會(huì)有些不自然。
![](http://editerupload.eepw.com.cn/201811/aff61ff3b3b8a26778fce4fa9d644122.png)
圖像插值結(jié)果示例,其中樣本數(shù)量為 2、插值數(shù)量為 5、截?cái)嘀禐?0.2、噪聲種子為 0、類別 A 為金毛、類別 B 為雞。
![](http://editerupload.eepw.com.cn/201811/67e52c62596e376e7fdde4acbb1ac43c.png)
其它參數(shù)不變,插值數(shù)量為 10 的插值結(jié)果示例。
![](http://editerupload.eepw.com.cn/201811/5cb0b2c8c813a6e9301c5113fa7dd822.png)
金毛和埃及貓的圖像插值結(jié)果。
知道怎么用了吧?自己去耍吧~
評(píng)論