酷刑!人工智能背后的“血汗工廠”:ChatGPT光環(huán)照耀不到的隱秘角落
坐在電腦前、閱讀一段文本、給出相應(yīng)的標(biāo)注、緊接著切換到下一段……這就是數(shù)據(jù)標(biāo)注員的日常。在這場席卷中美兩個市場的資本狂歡中,他們是邊緣化的、被遺忘的卻又至關(guān)重要的一個群體。
據(jù)美國《時代周刊》報道顯示,為了訓(xùn)練ChatGPT,OpenAI雇傭了時薪不到2美元的外包肯尼亞勞工,他們所負(fù)責(zé)的工作就是數(shù)據(jù)標(biāo)注。
數(shù)據(jù)標(biāo)注的工作流程包括數(shù)據(jù)標(biāo)注、打標(biāo)簽、分類、調(diào)整和處理等,是構(gòu)建AI模型的數(shù)據(jù)準(zhǔn)備和預(yù)處理工作中不可或缺的一環(huán)。對于ChatGPT這樣的語言模型,如果沒有人工標(biāo)注來篩除一些不恰當(dāng)?shù)膬?nèi)容,那么它不僅會給出一些錯誤的信息,更會對用戶造成心理不適。
更何況,類似ChatGPT這樣的預(yù)訓(xùn)練模型在訓(xùn)練過程中需使用的數(shù)據(jù)樣本較多,數(shù)據(jù)標(biāo)注的需求較高。
那么如何規(guī)避上述問題,篩查出有害內(nèi)容呢?OpenAI效仿了Facebook等社交媒體公司的做法——構(gòu)建一個額外的AI模型,向它提供暴力、仇恨等帶有攻擊性的言論,從而讓它學(xué)會識別相應(yīng)內(nèi)容。這樣的模型會被內(nèi)置到ChatGPT中,幫助后者過濾掉一些有害的文本。
在這個過程中,需要大量的人力來給攻擊性言論做標(biāo)注。于是,OpenAI在2021年底與一家外包公司Sama達成了合作。兩者簽署了三份總價值約20萬美元的合同,OpenAI向Sama發(fā)送了數(shù)萬個文本片段,包含大量的有關(guān)謀殺、自殘、虐待甚至其他更加不堪的內(nèi)容。Sama公司的每一個數(shù)據(jù)標(biāo)注員的日常工作流程就是閱讀文本并為其添加相應(yīng)的標(biāo)簽。
“那是酷刑”Sama是一家主營數(shù)據(jù)訓(xùn)練的公司,專注于為人工智能算法注釋數(shù)據(jù),客戶包括沃爾瑪、谷歌、通用汽車和微軟等多個海外大廠。
Sama官網(wǎng)據(jù)《紐約時報》早年報道和維基百科注釋,Sama標(biāo)榜自己為一家有道德的公司:“Sama的使命是在數(shù)字經(jīng)濟時代為低收入人群增加就業(yè)機會。”此外,公司聲稱已幫助超五萬人擺脫了貧困。
而Sama數(shù)據(jù)標(biāo)注員的真實工作情況如何?據(jù)《時代周刊》披露,根據(jù)資歷和表現(xiàn),Sama為OpenAI雇用的數(shù)據(jù)標(biāo)注員的實際工資約為每小時1.32美元至2美元。有三位員工透露,在Sama,三十余名工人被分成三個小組,他們每九小時輪班閱讀和標(biāo)記150至250段文字,每段文字大約100詞到1000詞不等。
上述被采訪員工均表示,這份工作給他們留下了“精神創(chuàng)傷”,雖然他們能夠參加公司組織的團體心理輔導(dǎo),但輔導(dǎo)并沒有提供任何的幫助。此外,由于Sama對員工工作效率要求極高,所以公司很少組織心理輔導(dǎo)活動。有員工曾提出想與心理輔導(dǎo)員一對一進行咨詢,但被Sama的管理層拒絕。
其中一位數(shù)據(jù)標(biāo)注員坦言,在閱讀了一些過于不堪的內(nèi)容后,他反復(fù)出現(xiàn)幻覺。“那是酷刑?!?/strong>他表示,“整個一周,你會反復(fù)的閱讀這樣的內(nèi)容。等到周五,你會不停想象與它相關(guān)的場景?!?/span>Sama的回應(yīng)低薪、高強度、創(chuàng)傷性的標(biāo)注工作折磨著肯尼亞工人的身心。對于來自《時代周刊》等媒體的“控訴”,Sama回應(yīng)外媒Quartz稱,其支付給標(biāo)注員的薪資幾乎是東非其他內(nèi)容審核公司的兩倍,并給員工提供福利和養(yǎng)老金,并聲稱這樣的待遇在東非并不常見。
據(jù)了解,肯尼亞并沒有統(tǒng)一的最低薪資規(guī)定。但在內(nèi)羅畢(肯尼亞首都),一個接待員的最低時薪是1.52美元,而Sama的數(shù)據(jù)標(biāo)注員最低薪資僅為1.32美元。在Sama與OpenAI的合同中,OpenAI向Sama支付每小時12.5美元的工作費用,是Sama數(shù)據(jù)標(biāo)注員最低薪資的9倍以上。
Sama的發(fā)言人還表示,在每九小時的輪班工作里,標(biāo)注員只需要標(biāo)記70段文字,而不是上文所述的150至250段文字。此外,數(shù)據(jù)標(biāo)注員的稅后時薪為1.46美元至3.74美元。合同中每小時12.5美元的工作費用覆蓋了包括基礎(chǔ)設(shè)施、質(zhì)檢、管理團隊薪資等在內(nèi)的所有成本。針對員工遭受心理折磨的情況,Sama的發(fā)言人則聲稱,公司十分重視員工的心理健康?!拔覀?yōu)閱T工提供一對一的心理咨詢。在審核、標(biāo)注工作過程中,員工可以隨時退出工作,且不會受到任何的懲罰?!痹摪l(fā)言人補充道,“員工標(biāo)注有害內(nèi)容的時間是有限的,敏感信息會有專人處理?!?/span>
違法、解約和失業(yè)2022年2月,OpenAI與Sama加深了合作,OpenAI要求Sama收集數(shù)千張暴力和黃色的圖片,其中包括一些違法美國法律的內(nèi)容。據(jù)《時代周刊》、《布魯塞爾時報》等外媒報道,當(dāng)月,Sama給OpenAI交付了一批1400張圖像的樣本,后者向前者支付了787.5美元。但很快,兩者的合作破裂。Sama在一份聲明中表示,有關(guān)圖像收集工作的原始合同并未包含違法內(nèi)容,但工作開始后,OpenAI向其發(fā)送了一份附加說明,其中提及到一些涉嫌違法的內(nèi)容。因此,Sama決定終止與OpenAI的合作。
在2022年2月下旬,陸陸續(xù)續(xù)有Sama的員工收到了轉(zhuǎn)崗和裁員的通知。一位員工無奈的表示:“對我們來說,這是一份養(yǎng)家糊口的工作。而現(xiàn)在,僅有30多名工人被迫轉(zhuǎn)到更低薪的崗位,其他人都面臨失業(yè)?!?/strong>
今年1月10日,Sama宣布取消所有涉及到敏感內(nèi)容的工作,并表示不會與Facebook續(xù)簽價值390萬美元的內(nèi)容審核合同。據(jù)了解,F(xiàn)acebook也曾被指控雇傭外包勞工來審核有害內(nèi)容。
Sama表示,經(jīng)團隊多次討論后,公司決定剝離自然語言處理和內(nèi)容審核業(yè)務(wù),專注于構(gòu)建計算機視覺數(shù)據(jù)標(biāo)注解決方案。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。