<i id="chuga"></i>

博客專欄

EEPW首頁 > 博客 > 有手就行？把大象P轉身只需拖動鼠標，華人一作DragGAN爆火（2）

有手就行？把大象P轉身只需拖動鼠標，華人一作DragGAN爆火（2）

發(fā)布人：機器之心時間：2023-05-20 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發(fā)布文章

實驗

為了展示 DragGAN 在圖像處理方面的強大能力，該研究展開了定性實驗、定量實驗和消融實驗。實驗結果表明 DragGAN 在圖像處理和點跟蹤任務中均優(yōu)于已有方法。

定性評估

圖 4 是本文方法和 UserControllableLT 之間的定性比較，展示了幾個不同物體類別和用戶輸入的圖像操縱結果。本文方法能夠準確地移動操縱點以到達目標點，實現(xiàn)了多樣化和自然的操縱效果，如改變動物的姿勢、汽車形狀和景觀布局。相比之下，UserControllableLT 不能忠實地將操縱點移動到目標點上，往往會導致圖像中出現(xiàn)不想要的變化。

如圖 10 所示，它也不能像本文方法那樣保持未遮蓋區(qū)域固定不變。

圖 6 提供了與 PIPs 和 RAFT 之間的比較，本文方法準確地跟蹤了獅子鼻子上方的操縱點，從而成功地將它拖到了目標位置。

真實圖像編輯。使用 GAN inversion 技術，將真實圖像嵌入 StyleGAN 的潛空間，本文方法也可以用來操作真實圖像。

圖 5 顯示了一個例子，將 PTI inversion 應用于真實圖像，然后進行一系列的操作來編輯圖像中人臉的姿勢、頭發(fā)、形狀和表情：

圖 13 展示了更多的真實圖像編輯案例：

定量評估

研究者在兩種設置中下對該方法進行了定量評估，包括人臉標記點操作和成對圖像重建。

人臉標記點操作。如表 1 所示，在不同的點數(shù)下，本文方法明顯優(yōu)于 UserControllableLT。特別是，本文方法保留了更好的圖像質量，正如表中的 FID 得分所示。

這種對比在圖 7 中可以明顯看出來，本文方法打開了嘴巴并調整下巴的形狀以匹配目標臉，而 UserControllableLT 未能做到這一點。

成對圖像重建。如表 2 所示，本文方法在不同的目標類別中優(yōu)于所有基線。

消融實驗

研究者研究了在運動監(jiān)督和點跟蹤中使用某種特征的效果，并報告了使用不同特征的人臉標記點操作的性能（MD）。如表 3 所示，在運動監(jiān)督和點跟蹤中，StyleGAN 的第 6 個 block 之后的特征圖表現(xiàn)最好，顯示了分辨率和辨別力之間的最佳平衡。

表 4 中提供了

*博客內容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

相關推薦

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

AI+機器視覺成趨勢，圖文詳解N大應用場景

智能計算安森美 AI 機器視覺 | 2024-07-31

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產力

winni945 | 2018-09-12

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統(tǒng)

智能計算 Meta AI | 2024-07-31

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創(chuàng)建AI... 一臺來模擬AI... 一臺來運行AI”

智能計算 AI | 2024-07-31

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

加大調整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術 | 2023-04-25

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

釋說芯語16：硬科技：構建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

海聯(lián)達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

焦點

推薦視頻

更多>>

技術專區(qū)

關閉