新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 《紐約時(shí)報(bào)》聯(lián)合谷歌開(kāi)發(fā)的 AI 算法

《紐約時(shí)報(bào)》聯(lián)合谷歌開(kāi)發(fā)的 AI 算法

作者: 時(shí)間:2017-06-16 來(lái)源:雷鋒網(wǎng) 收藏

  網(wǎng)絡(luò)媒體的的一大特色就是有評(píng)論區(qū),供讀者直接對(duì)文章、視頻發(fā)表自己的看法,但灌水、罵戰(zhàn)、惡毒言論也讓媒體頭疼不已,于是有些媒體選擇將評(píng)論區(qū)關(guān)閉。例如紐約時(shí)報(bào)的網(wǎng)站就只有 10% 的文章開(kāi)放評(píng)論,但這種做法也讓很多理性的讀者失去了發(fā)表看法的平臺(tái),于是《時(shí)報(bào)》和合作,利用后者的算法開(kāi)發(fā)了評(píng)論區(qū)惡毒言論過(guò)濾器,借此希望未來(lái)能夠?qū)?80% 的文章開(kāi)放給讀者評(píng)論。

本文引用地址:http://m.butianyuan.cn/article/201706/360605.htm

  Bassey Etim 是《紐約時(shí)報(bào)》網(wǎng)站的社區(qū)編輯。在他看來(lái),新聞通訊社與讀者間的關(guān)系相當(dāng)簡(jiǎn)單,讀者付款訂閱或者看廣告免費(fèi)讀新聞,而通訊社們將掙來(lái)的錢(qián)投入后續(xù)的新聞報(bào)道中去。

  不過(guò),網(wǎng)站社區(qū)的出現(xiàn)卻讓事情變得越來(lái)越復(fù)雜。通訊社們想與讀者進(jìn)行深入交流,而讀者也想找個(gè)渠道來(lái)發(fā)表自己的看法,于是讀者們開(kāi)始在評(píng)論區(qū)交流起來(lái)。當(dāng)然,如果大家都本著友好交流的心態(tài),評(píng)論區(qū)可能會(huì)出現(xiàn)許多金句,但事實(shí)上評(píng)論區(qū)卻總是會(huì)出現(xiàn)各種不相干的內(nèi)容,同時(shí)這里也成了網(wǎng)絡(luò)暴力和謠言的溫床。

  為了凈化評(píng)論區(qū)風(fēng)氣,《紐約時(shí)報(bào)》會(huì)人工對(duì)評(píng)論區(qū)的讀者評(píng)論進(jìn)行審核。不過(guò),每天平均 1.2 萬(wàn)條以上的評(píng)論卻讓審核人員怨聲載道。有時(shí)由于缺乏人手,他們還會(huì)直接關(guān)閉某些新聞的評(píng)論區(qū)。雷鋒網(wǎng)發(fā)現(xiàn),《紐約時(shí)報(bào)》許多爭(zhēng)議性較強(qiáng)的頭條新聞在發(fā)布時(shí)就直接禁止評(píng)論。

  不過(guò),這樣的情況馬上就要發(fā)生改變了。


《紐約時(shí)報(bào)》聯(lián)合谷歌開(kāi)發(fā)的 AI 算法


  今天,《紐約時(shí)報(bào)》上線了名為 Moderator(意為版主)的新系統(tǒng),未來(lái)頭條新聞的評(píng)論區(qū)在工作日每天都會(huì)開(kāi)放 8 小時(shí)。此外,新聞和觀點(diǎn)板塊的評(píng)論區(qū)則會(huì) 24 小時(shí)開(kāi)放。

  Moderator 的誕生還要感謝 Jigsaw,它是旗下的技術(shù)孵化器,該公司利用機(jī)器學(xué)習(xí)技術(shù)優(yōu)先審核“言論不太出格”的溫和評(píng)論,有時(shí)還會(huì)自動(dòng)給它們放行。Moderator 有這樣的能耐是因?yàn)樗殚喠?2007 年以來(lái)評(píng)論區(qū)里超過(guò) 1600 萬(wàn)條溫和評(píng)論。

  在《紐約時(shí)報(bào)》看來(lái),讀者的評(píng)論也是內(nèi)容,但它們更重視質(zhì)量而非數(shù)量。調(diào)查結(jié)果也顯示,《紐約時(shí)報(bào)》的讀者們非常喜歡評(píng)論區(qū)不時(shí)出現(xiàn)的神評(píng)論。

  去年夏天,Jigsaw 也發(fā)覺(jué)自己需要處理類(lèi)似的問(wèn)題:到底怎樣提升網(wǎng)絡(luò)會(huì)話的質(zhì)量呢?

  于是,兩家公司一拍即合,拿到《紐約時(shí)報(bào)》的匿名評(píng)論數(shù)據(jù)后,Jigsaw 打造了一款機(jī)器學(xué)習(xí)算法,它能掌握社區(qū)編輯對(duì)待評(píng)論的尺度。除此之外,這兩家公司還拉上了名為 Instrument 的數(shù)字產(chǎn)品合作伙伴一起打造 Moderator。如今,這款算法還成了 Perspective 計(jì)劃的一部分,該項(xiàng)目的目標(biāo)是揪出網(wǎng)上的騷擾和各種語(yǔ)言暴力。

  “出版商靠廣告生存,而廣告商投放廣告時(shí)看的是讀者的參與度?!盝igsaw 董事長(zhǎng) Jared Cohen 寫(xiě)道。Jigsaw 將“幫助各大新聞平臺(tái)開(kāi)辟供讀者進(jìn)行兩性討論的空間?!?/p>

  《紐約時(shí)報(bào)》將如何利用 Moderator

  Moderator 的加入讓社區(qū)管理用戶貢獻(xiàn)內(nèi)容的方式發(fā)生了改變,傳統(tǒng)上優(yōu)先考慮每一條評(píng)論的方法被摒棄了。在 Moderator 的管理下,每條評(píng)論都會(huì)被打分,如果不符合要求就不會(huì)出現(xiàn)在評(píng)論區(qū)。

  對(duì)《紐約時(shí)報(bào)》的社區(qū)編輯來(lái)說(shuō),每條評(píng)論都像是直方圖上的一個(gè)小點(diǎn)(如下圖)。

《紐約時(shí)報(bào)》聯(lián)合谷歌開(kāi)發(fā)的 AI 算法

  在直方圖上的位置可能就會(huì)決定一條評(píng)論是否會(huì)被刪掉。除此之外,Moderator 還會(huì)試著預(yù)測(cè)為何一些評(píng)論會(huì)被刪掉。

  有了新工具,《紐約時(shí)報(bào)》的社區(qū)編輯們輕松多了,它們能直接參考機(jī)器學(xué)習(xí)模型,閱讀那些有 15%-20% 被刪除可能性的評(píng)論,如果這些評(píng)論足夠溫和,他們可能就會(huì)對(duì) 0%-20% 區(qū)間的所有評(píng)論放行。回想從前,社區(qū)編輯們需要對(duì)每條評(píng)論進(jìn)行逐個(gè)閱讀。

  被優(yōu)先推薦的評(píng)論總是“綜合評(píng)分”較高,新系統(tǒng)加入后,能否得高分則主要看三個(gè)方面:評(píng)論是否包含淫穢色情內(nèi)容、毒害性言論和被刪除的概率。

  隨著綜合評(píng)分系統(tǒng)的逐漸成熟,《紐約時(shí)報(bào)》決定進(jìn)一步降低社區(qū)編輯們的工作強(qiáng)度,那些絕對(duì)人畜無(wú)害的評(píng)論會(huì)被自動(dòng)放行。

  Cohen 先生表示:“機(jī)器學(xué)習(xí)的優(yōu)勢(shì)就在于它會(huì)隨著學(xué)習(xí)的深入變得越來(lái)越聰明。”

  未來(lái),網(wǎng)絡(luò)評(píng)論的好日子可能會(huì)重新到來(lái)?!都~約時(shí)報(bào)》就正在搭建一個(gè)能讓讀者隨心討論的安全環(huán)境,這里沒(méi)有臟話、騷擾和網(wǎng)絡(luò)暴力,每個(gè)人都能平心靜氣的抒發(fā)自己的觀點(diǎn)。



關(guān)鍵詞: 谷歌 AI

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉