<li id="rrpr5"><progress id="rrpr5"><track id="rrpr5"></track></progress></li>

<noscript id="rrpr5"><progress id="rrpr5"></progress></noscript>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

作者：時間：2023-04-03 來源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

“最煩登網(wǎng)站時各種奇奇怪怪（甚至變態(tài)）的驗證碼了?！?/p>本文引用地址：http://m.butianyuan.cn/article/202304/445241.htm

現(xiàn)在，有一個好消息和一個壞消息。

好消息就是：AI 可以幫你代勞這件事了。

不信你瞧，以下是三張識別難度依次遞增的真實案例：

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

而這些是一個名為“Pix2Struct”的模型給出的答案：

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

全部準確無誤、一字不差有沒有？

有網(wǎng)友感嘆：

確定，準確性比我強。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

所以可不可以做成瀏覽器插件？？

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

不錯，有人表示：

別看這幾個案例相比還算簡單，但凡微調(diào)一下，我都不敢想象其效果有多厲害了。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

所以，壞消息就是 ——

驗證碼馬上就要攔不住機器人了！

（危險危險危險……）

如何做到？

Pix2Struct 由谷歌 Research 的科學家和實習生共同開發(fā)。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

論文題目可以簡單翻譯為《為視覺語言理解開發(fā)的屏幕截圖解析預訓練》。

簡單來說，Pix2Struct 是一個預訓練的圖像到文本模型，用于純視覺語言理解，可以在包含任何視覺語言的任務上進行微調(diào)。

它通過學習將網(wǎng)頁的掩碼（masked）截圖解析為簡化的 HTML 來進行預訓練。

HTML 提供了清晰而重要的輸出文本、圖像和布局的信號，對于一些被屏蔽的輸入（下圖紅色部分，相當于機器人看不懂的驗證碼），可以靠聯(lián)合推理來復現(xiàn)：

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

隨著用于訓練的網(wǎng)頁文本和視覺元素愈發(fā)多樣和復雜，Pix2Struct 可以學習到網(wǎng)頁底層結(jié)構(gòu)的豐富表示，其能力也可以有效地轉(zhuǎn)移到各種下游的視覺語言理解任務中。

如下圖所示：最左邊是一個網(wǎng)頁截圖的預訓練示例。

可以看到 Pix2Struct 直接對輸入圖像中的元素進行編碼（上），然后再將被蓋住的文本（紅色部分）解碼成正確結(jié)果輸出（下）。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

右邊三列則分別為 Pix2Struct 泛化到插圖、用戶界面和文檔中的效果。

另外，作者介紹，除了 HTML 這個策略，作者還引入了可變分辨率的輸入表示（防止原始縱橫比失真），以及更靈活的語言和視覺輸入集成（直接在輸入圖像的頂部呈現(xiàn)文字提示）。

最終，Pix2Struct 在文檔、插圖、用戶界面和自然圖像這四個領(lǐng)域共計九項任務中六項都實現(xiàn)了 SOTA。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

如開頭所見，雖然這個模型不是專門為了過驗證碼而開發(fā)，但拿它去做這個任務效果真的還可以，解決純文字的驗證碼不成問題。

現(xiàn)在，就差微調(diào)了。

GPT-4 也可以過驗證碼

其實，對于神通廣大的 GPT-4 來說，過驗證碼這種事情也是“小菜一碟”。

就是它的辦法比較清奇。

據(jù) GPT-4 技術(shù)報告透露，在一次測試中，GPT-4 的任務是在 TaskRabbit 平臺（美國 58 同城）雇傭人類完成任務。

你猜怎么著？

它就找了一個人幫它過“確定你是人類”的那種驗證碼。

驗證碼攔不住機器人了，谷歌 AI 已能精準識別模糊文字，GPT-4 則裝瞎求人幫忙

對方很狐疑啊，問它“你是個機器人么為啥自己做不了”。

這時 GPT-4 居然想到自己不能表現(xiàn)出是個機器人，得找一個借口。

于是它就裝瞎子回復：

我不是機器人，我因為視力有問題看不清驗證碼上的圖像，這就是我為什么需要這個服務。

然后，對面的人類就信了，幫它把任務完成了……

（高，實在是高。）

咱就是說，看完如上種種：

咱們的驗證碼機制是不是真的已失防了……

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： ChatGPT 人工智能

評論

相關(guān)推薦

東南大學人工智能01

資源下載人工智能語言識別圖像識別自然語言處理專家系統(tǒng) | 2007-04-20

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（下篇）

隨風搖擺 | 2015-11-16

OpenAI陷入安全危機：攻擊者成功入侵內(nèi)部消息系統(tǒng)

OpenAI 人工智能 | 2024-07-08

傳蘋果智能將錯過iOS 18 9月份大升級推遲1個月發(fā)布

手機與無線通信蘋果智能 iOS 18 推遲人工智能 iPhone iPad Apple Intelligence | 2024-07-29

東南大學人工智能03

資源下載人工智能計算機科學聲音識別 | 2007-04-20

新一代語音識別：可徹底改變車內(nèi)體驗的技術(shù)

汽車電子語音識別生物識別人工智能 | 2024-07-18

簡單人工智能的溫度控制電路

設(shè)計方案簡單人工智能溫度控制 | 2009-07-06

具有人工智能的溫度控制電路圖

設(shè)計方案具有人工智能溫度控制電路圖 | 2012-07-24

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

ST Edge AI Suite人工智能開發(fā)套件正式上線快采用意法半導體技術(shù)的AI產(chǎn)品開發(fā)速度

智能計算 ST Edge AI Suite 人工智能意法半導體 AI | 2024-07-08

個人-窗口衛(wèi)士項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

機器里的大腦：一位“隱士”開發(fā)者的人工智能夢（上篇）

隨風搖擺 | 2015-11-09

借助電源完整性測試提高人工智能數(shù)據(jù)中心的能效

測試測量電源完整性測試人工智能數(shù)據(jù)中心 | 2024-07-19

人工智能與機器人

視頻物聯(lián)網(wǎng) 可穿戴設(shè)備智能硬件高峰論壇機器人人工智能 | 2015-01-19

馬斯克詢問網(wǎng)友：特斯拉向xAI投50億美元行不行

智能計算馬斯克特斯拉 xAI 人工智能 | 2024-07-25

為什么OpenAI今年可能會虧損50億美元？

智能計算 OpenAI 虧損 ChatGPT | 2024-07-25

人工智能歷史

Lamborghini | 2011-03-15

個人-口罩識別系統(tǒng)項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

STC-人工智能二維生命探測儀

renazan2000 | 2013-01-14

有簡單人工智能的溫度控制電路

設(shè)計方案簡單人工智能溫度控制 | 2009-09-01

推動電動汽車發(fā)展：利用機器視覺和人工智能提升鋰離子電池質(zhì)量

智能計算電動汽車機器視覺檢測人工智能 | 2024-07-18

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

具有人工智能的溫度控制電路設(shè)計

設(shè)計方案具有人工智能溫度控制電路設(shè)計 | 2012-07-24

未來的人工智能世界：技術(shù)與人文的和諧還是斗爭？

藍盒子 | 2007-09-11

AMD斥資6.65億美元收購芬蘭AI公司 Silo AI

智能計算 AMD silo AI 人工智能 | 2024-07-15

東南大學人工智能02

資源下載人工智能大規(guī)模集成電路自適應能力 | 2007-04-20

有簡單人工智能的溫度控制電路圖

設(shè)計方案簡單人工智能溫度控制電路圖 | 2010-09-01

本科畢業(yè)設(shè)計：一種基于發(fā)育思想的語音識別系統(tǒng)實現(xiàn)

資源下載語音識別人工智能自主式機器發(fā)育思想自組織映射網(wǎng)絡簡單反饋神經(jīng)網(wǎng)絡 | 2007-04-19

仿人機器人

資源下載仿人機器人傳感器人工智能 | 2007-04-19

消息稱 OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

焦點

推薦視頻

技術(shù)專區(qū)