新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 你可能對人工智能有什么誤解:人力勞動只是轉(zhuǎn)移了

你可能對人工智能有什么誤解:人力勞動只是轉(zhuǎn)移了

作者: 時間:2018-07-17 來源:鎂客網(wǎng) 收藏
編者按:最需要AI去做的事情,AI反而無能無力,而我們?yōu)榱四茏孉I取代勞動密集型的工作,得先為AI服務(wù),付出密集、辛勤的勞動,這讓數(shù)據(jù)標注工作看上去有點賽博朋克、反烏托邦的“魔幻”感覺。

  一雙眼睛的局部細節(jié)圖出現(xiàn)在電腦屏幕上,小慧對著放大的眼睛,一步步地做好標記點。

本文引用地址:http://m.butianyuan.cn/article/201807/383363.htm

  一眼望過去,一排排的電腦屏幕上,都是類似的畫面。也許是因為窗簾的遮光效果太好,略顯昏暗的辦公環(huán)境加上電腦屏幕上被放大的各種物體細節(jié),頗為驚悚。

  在某研究院看到這一幕,不覺驚嘆即使是頭部的AI創(chuàng)業(yè)公司,最關(guān)鍵的一環(huán)依然是從數(shù)據(jù)標注員開始的。

  而這是一群被稱作第一批被AI累死的人。

  AI的老師:畫框的這些人

  伴隨著AI興起的最關(guān)鍵的技術(shù)莫過于深度學(xué)習(xí),作為深度學(xué)習(xí)的基礎(chǔ),神經(jīng)網(wǎng)絡(luò)是一種以輸入為導(dǎo)向的算法,其結(jié)果的準確性取決于接近“無窮”量級的數(shù)據(jù)。

  所以摒除那些復(fù)雜的中間環(huán)節(jié),深度學(xué)習(xí)最關(guān)鍵的就是需要大量的數(shù)據(jù)訓(xùn)練,這也是為什么在互聯(lián)網(wǎng)大數(shù)據(jù)的時代,AI可以崛起。而在數(shù)據(jù)訓(xùn)練之前,又必須先對大量的數(shù)據(jù)進行標注,作為機器學(xué)習(xí)的先導(dǎo)經(jīng)驗。

  因此,催生了大量數(shù)據(jù)標注員的產(chǎn)生。

  簡單的說,數(shù)據(jù)標注員類似于AI的老師,舉個形象的例子,我們要教機器認識一個蘋果,你直接給它一張?zhí)O果的圖片,它是完全不理解的。我們得先有蘋果的圖片,然后在上面標注著“蘋果”兩個字,機器通過學(xué)習(xí)了大量的圖片中的特征,這時候再給它任意一張?zhí)O果的圖片,它就能認出來了。

  據(jù)了解,目前標注員的工作內(nèi)容常見的有拉框標點、打標簽、分割、批注等等。其中分類就是最常見的打標簽,比如標注畫面上動物毛發(fā)顏色、動物耳朵等等;框選是將畫面中相對應(yīng)的對象標框標注;還有一種是描點標注,一般用于更細致的人臉標注:需要在眉毛、眼睛、鼻子、嘴巴等關(guān)鍵點做二十多個標記點。

  從他們的基本工作內(nèi)容就可以看出來,數(shù)據(jù)標注是個非??菰锒挚简炄四土Φ墓ぷ?,并且相比較AI所代表的高科技,標注看起來毫無技術(shù)含量。

  一條產(chǎn)業(yè)鏈的開始

  但巧婦難為無米之炊,AI算法的訓(xùn)練離不開這些大量的數(shù)據(jù)標注,與之相伴生的數(shù)據(jù)標注外包業(yè)務(wù)也成了熱門的產(chǎn)業(yè)。

  在IT桔子的大數(shù)據(jù)標注公司專輯中,一共收納了6家,其中,有5家都在2017年到2018年這個時間周期內(nèi)獲得千萬的融資:

  2017年7月,BasicFinder完成1000萬人民幣Pre-A輪融資;

  2017年11月,龍貓數(shù)據(jù)獲得A輪3370萬人民幣融資;

  2018年1月,星塵數(shù)據(jù)獲得1000萬人民幣Pre-A輪融資;

  2018年3月,愛數(shù)智慧獲得A輪融資;

  2018年5月,周同科技完成2000萬人民幣A輪融資。

  同時,他們業(yè)務(wù)方向也有一定細分區(qū)別,有的以處理圖像見長,有的數(shù)據(jù)標注公司更擅長做一些視頻標注。而這些公司的服務(wù)企業(yè)有百度、小米、京東、今日頭條這樣的互聯(lián)網(wǎng)公司,也有出門問問、云從、深鑒等AI公司。

  另外,像京東、百度、騰訊、阿里其實都有自己的標注平臺和工具。

  而在國外方面,亞馬遜有推出眾包數(shù)據(jù)平臺Amazon Mechanical Turk,初創(chuàng)公司方面則有CrowdFlower、Mighty AI等。

  這些已經(jīng)算是這個領(lǐng)域的佼佼者了,在他們的下面,還有成百上千的小的數(shù)據(jù)標注公司。

  據(jù)悉,數(shù)據(jù)標注行業(yè)實行這樣一套分工流程:上游的科技巨頭把任務(wù)交給中游的數(shù)據(jù)標注公司,再由中游眾包給下游的小公司、小作坊,有的小作坊還會進一步眾包給“散兵游勇”,比如學(xué)生或家庭主婦。

  這條產(chǎn)業(yè)鏈上,分包現(xiàn)象越嚴重,最終落到最底層的數(shù)據(jù)服務(wù)公司的價格就越低,一層層的“數(shù)據(jù)黃?!眽嚎s了利潤空間,所以一些任務(wù)經(jīng)過數(shù)手轉(zhuǎn)包,酬勞已低得驚人。

  目前的數(shù)據(jù)標注工作主要是集中在河北、河南、山東、山西等勞動力密集的地區(qū),這樣的選址也因為能夠以更加低廉的勞動力成本去完成大量的數(shù)據(jù)標注工作。

  在很多數(shù)據(jù)標注的報道中,出現(xiàn)頻率最高的都是那些畢業(yè)于職業(yè)技術(shù)學(xué)校的學(xué)生,他們在三四線城市,只需要會操作電腦,就能做數(shù)據(jù)標注的工作。然而枯燥而又乏味的重復(fù)性工作,導(dǎo)致數(shù)據(jù)標注人員的流動性非常之大。此前,在澎湃新聞的一篇視頻采訪中,某數(shù)據(jù)標注公司創(chuàng)始人表示他們有500名左右的在職人員,但是全職的只有11、12個。

  在一些大的數(shù)據(jù)服務(wù)公司,他們宣稱平臺用戶(數(shù)據(jù)標注人員)超過20萬人,其中很多都是兼職人員。

  不過,快速的人口流動也依然阻擋不了低門檻數(shù)據(jù)標注生意的紅火。

  有多少智能,就有多少人工

  即使現(xiàn)在有一些數(shù)據(jù)服務(wù)平臺開發(fā)了AI工具來輔助人工標注,但依然需要數(shù)據(jù)標注員去檢查和修正其中的錯誤。在一些專業(yè)數(shù)據(jù)標注公司,機器占30%,而人工標注占比達到70%左右。

  梳理數(shù)據(jù)標注員的工作邏輯,就像一個悖論,AI能否進化的更為智能某種程度上取決于這些標注工作的人,而這個工作卻是最不智能、最沒有技術(shù)含量的。

  記得在一篇采訪中,管理標注員的負責人用特斯拉(Tesla)的自動駕駛事故給員工“打雞血”,他提到2016年,一輛自動駕駛模式下的特斯拉發(fā)生車禍事故。事后特斯拉公司發(fā)表聲明稱:白色卡車在藍天背景下識別不出來,特斯拉因此沒有啟動剎車。

  “我一直跟他們說:‘你們打磨的每一個數(shù)據(jù)都會為做出巨大貢獻,將來的無人駕駛車能夠識別出藍天下的白色卡車,就是因為你當年把它標出來了?!?/p>

  這種看似無意義的低效率工作應(yīng)該由AI去做才符合我們對技術(shù)的認知,因為我們發(fā)展的初衷,就是為了解放生產(chǎn)力、提高生產(chǎn)效率。

  最需要AI去做的事情,AI反而無能無力,而我們?yōu)榱四茏孉I取代勞動密集型的工作,得先為AI服務(wù),付出密集、辛勤的勞動,這讓數(shù)據(jù)標注工作看上去有點賽博朋克、反烏托邦的“魔幻”感覺。

  然而更令人覺得沮喪的是,人工去訓(xùn)練AI依然存在很多問題。

  此前,清華大學(xué)人工智能學(xué)院院長張鈸院士就提到純數(shù)據(jù)驅(qū)動的系統(tǒng)也存在很大問題——魯棒性很差,易受到很大的干擾。即便訓(xùn)練出的系統(tǒng)模型準確率高達99%,但在實際應(yīng)用中,仍然會犯很多“弱智”的錯誤。

  這就陷入了死循環(huán),人不可能像AI一樣,在工作中嚴格按照數(shù)據(jù)程序毫無瑕疵地完成工作,紕漏或者技術(shù)本身的問題,會導(dǎo)致人工智能的不準確性。最終,就在這個無限循環(huán)中不停地優(yōu)化。

  而且考慮到數(shù)據(jù)的隱私和公司的商業(yè)利益,同類型的數(shù)據(jù)是無法相互打通的,就像一位數(shù)據(jù)標注資深從業(yè)者所說, “以自動駕駛領(lǐng)域的數(shù)據(jù)標注為例,我用A公司的數(shù)據(jù)模型放到 B公司的設(shè)備上跑不通,甚至攝像頭換了一個角度、位置或分辨率,都跑不通。”

  “有多少智能,就有多少人工?!边@似乎是AI進化必須經(jīng)歷的過程。

  結(jié)語:

  當然,最完美的情況應(yīng)該是:AI能夠自己消化大量的數(shù)據(jù)自學(xué)成才。目前無需標注數(shù)據(jù)的無監(jiān)督學(xué)習(xí)已經(jīng)從實驗室走向應(yīng)用,而類似的遷移學(xué)習(xí)算法也能減少一定的數(shù)據(jù)標注工作量。

  Facebook人工智能研究部門負責人Yann LeCun曾經(jīng)說過,AI的核心在于預(yù)測,AI的下一個變革是無監(jiān)督學(xué)習(xí)、常識學(xué)習(xí)。研究人員正努力讓 AI 不依賴人類訓(xùn)練,自己去觀察世界是如何運轉(zhuǎn)的,并學(xué)會預(yù)測。

  所以理想環(huán)境下,可能我們探討的悖論過幾年或者十幾年就能完美解決了,這批為AI服務(wù)最終會被AI取代的人,也“功成身退”了。



關(guān)鍵詞: 人工智能

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉