穿顏色成對(duì)的襪子,追最新的?。哼@群coder正幫視障者移走身上的大山
「視障是壓在身上的一座大山。你從小就是被否定的,你看不見(jiàn)就做不了這,做不了那,你自己也那么認(rèn)為。」
在你的印象中,視障群體一般會(huì)從事哪些職業(yè)?如果被問(wèn)到這個(gè)問(wèn)題,大多數(shù)人想到的第一個(gè)答案可能都是推拿師、按摩師??峙拢瑳](méi)有人會(huì)想到「化妝師」。 「盲人怎么還能化妝、拍抖音、回私信呢?是騙人的吧!」抖音視頻博主「盲人美妝師肖佳」經(jīng)常會(huì)受到這種質(zhì)疑。
和很多視障人士一樣,肖佳最初也從事過(guò)按摩工作,但這份工作并沒(méi)有束縛住她。北漂的經(jīng)歷讓她發(fā)現(xiàn)了自己人生的更多可能性并找到了興趣所在。6 年間,她教會(huì)了數(shù)千名視障女性化妝。
肖佳的抖音視頻截圖
其實(shí)從肖佳的身上不難看到,隨著技術(shù)的進(jìn)步,視障群體的就業(yè)范圍早就不再局限于推拿、按摩等傳統(tǒng)行業(yè),越來(lái)越多的視障者渴望或正在從事和明眼人一樣的工作,比如有聲主播、云客服、數(shù)據(jù)標(biāo)注師等。只是,這一人群所占的比例還比較小。 這其中的原因是多重的,包括工作機(jī)會(huì)少、無(wú)障礙支持做得還不夠等等,這導(dǎo)致很多視障者在「邁出家門(mén)」這一步就被卡住了。 為了改變這一群體的境遇,社會(huì)各界正從各個(gè)方向發(fā)力,科技是其中一個(gè)比較有效的方向,包括近年來(lái)已經(jīng)在各行各業(yè)找到應(yīng)用場(chǎng)景的 AI 技術(shù)。
不過(guò),對(duì)于技術(shù)人員來(lái)說(shuō),嘗試用 AI 幫助視障群體可能并不容易,因?yàn)檫@類(lèi)項(xiàng)目的用戶調(diào)研更難開(kāi)展,可借鑒的成熟模式也比較有限。就像字節(jié)跳動(dòng)的一位算法工程師所說(shuō),「我們隱約覺(jué)得視障群體會(huì)因?yàn)榭床灰?jiàn)東西而面臨很多困難,但是具體有什么困難我們也不知道」。
在 AI 技術(shù)圈,抱有相同疑惑的工程師不在少數(shù)。因此,從去年 8 月份開(kāi)始,字節(jié)跳動(dòng)就組織了一場(chǎng)以「AI 助力視障群體」為主題的大賽,即「2022 技術(shù)公益創(chuàng)新杯大賽」,希望助力視障群體在生活和工作上更好地融入社會(huì)。
為了確保選手對(duì)視障人群有足夠的了解,同時(shí)確保他們的創(chuàng)意作品有足夠的迭代時(shí)間,大賽在比賽初期就引入了肖佳等受益人評(píng)委,而且用 5 個(gè)多月的時(shí)間組織了初賽、復(fù)賽、決賽三大環(huán)節(jié)。雙方在經(jīng)歷了多輪溝通、交流之后都對(duì)要解決的問(wèn)題、可應(yīng)用的技術(shù)有了新的認(rèn)識(shí),也為廣大想要在這一領(lǐng)域有所貢獻(xiàn)的技術(shù)人員提供了一些參考。
關(guān)于視障需求的一些「誤解」
哪些是「真需求」?哪些是「?jìng)涡枨蟆梗?/strong>
對(duì)于明眼人來(lái)說(shuō),生活中能夠感知到的無(wú)障礙設(shè)施其實(shí)并不多,盲道算是最為明顯的一個(gè)。很多人會(huì)吐槽盲道會(huì)導(dǎo)到樹(shù)上或溝里,用起來(lái)令人膽戰(zhàn)心驚。但受益人評(píng)委之一、北京一加一殘障公益集團(tuán)合伙人傅高山卻說(shuō),這些吐槽其實(shí)并沒(méi)有抓住重點(diǎn),視障者本身有辦法避開(kāi)上述障礙。 比起吐槽中提到的問(wèn)題,更加困擾傅高山的其實(shí)是一些開(kāi)闊區(qū)域盲道的缺失,比如斑馬線。這些地方參照物少得可憐,視障者很容易走歪、進(jìn)錯(cuò)路,這恰恰是盲道應(yīng)該發(fā)揮作用的地方。 在比賽中,選手們也經(jīng)歷著類(lèi)似的認(rèn)知沖擊。 想要做一款「助視輔具」幫助視障人群了解周邊環(huán)境的微光團(tuán)隊(duì)回憶說(shuō),他們起初設(shè)計(jì)的產(chǎn)品包含危險(xiǎn)物品的識(shí)別,比如提醒視障者前面有個(gè)坑,或周?chē)械毒?。但在進(jìn)行深入的用戶訪談后,他們放棄了這個(gè)功能。因?yàn)橐曊险呓柚ふ鹊裙ぞ咭材芴綔y(cè)到危險(xiǎn)物品。在熟悉的環(huán)境中,他們甚至能把周邊物體的位置背下來(lái)。 主打「對(duì)話式視覺(jué)助手」的靈瞳團(tuán)隊(duì)也遇到了需求理解不到位的問(wèn)題。他們的產(chǎn)品邏輯是讓 AI 理解視障者拍的照片,以問(wèn)答的方式告訴他們照片上的信息。在最初的版本中,他們?cè)O(shè)計(jì)了一個(gè)提醒視障者物品是否入鏡的功能,不過(guò)后來(lái)因?yàn)榻换テ饋?lái)不夠簡(jiǎn)潔又把這個(gè)功能刪掉了。但傅高山告訴他們,這個(gè)功能對(duì)于視障用戶還是很重要的,所以他們最后又把這個(gè)功能撿了回來(lái),并嘗試用更簡(jiǎn)潔的交互邏輯來(lái)實(shí)現(xiàn)它。
靈瞳團(tuán)隊(duì)作品功能介紹
視障者=盲人? 很多人在聽(tīng)到「視障者」這個(gè)詞的時(shí)候,都會(huì)簡(jiǎn)單地將其等同于「盲人」,這無(wú)疑是一種誤解。 其實(shí),截至 2021 年,我國(guó)總共有 1750 萬(wàn)視障群體,其中盲人有 875 萬(wàn),其余可以被歸為「低視力」等范疇。在傅高山身上,微光團(tuán)隊(duì)看到了這兩類(lèi)群體的差異。傅高山本身屬于低視力,所以他希望助視輔具不僅告訴他某個(gè)餐館在屏幕的哪個(gè)方向,還要提供一個(gè)放大鏡功能,方便他貼到眼睛上看?!高@是之前沒(méi)有想到的需求,」微光的隊(duì)長(zhǎng)坦言。 除了視力,視障群體對(duì)光的感知能力也是不同的。有光感的肖佳習(xí)慣于晚上開(kāi)燈,因?yàn)槟欠N「亮亮的感覺(jué)」讓她覺(jué)得很舒服。但沒(méi)有光感的另一位視障用戶同樣習(xí)慣于晚上開(kāi) / 關(guān)燈,因?yàn)樗枰源藶樾盘?hào)告訴別人他是否在休息。不過(guò),和肖佳不同,他還需要借助某種方法判斷燈是開(kāi)著還是關(guān)著。在了解到這一需求后,微光團(tuán)隊(duì)把將亮度檢測(cè)功能加入了自己的作品。 這種光譜式的需求點(diǎn)挖掘讓受益人評(píng)委深感欣慰。傅高山評(píng)價(jià)說(shuō),「我們社會(huì)并不是所有人對(duì)殘障的認(rèn)知都達(dá)到了正確理解的程度。同學(xué)們的作品其實(shí)開(kāi)了一個(gè)好頭,就是識(shí)別用戶。在這個(gè)用戶光譜里,還有很多處在漸變色的中間用戶,其實(shí)這部分用戶是最值得被挖掘出來(lái)的。」
眼睛不好,補(bǔ)兩顆智能的就能解決問(wèn)題?
在明確了視障群體的需求之后,選手們接下來(lái)面臨的問(wèn)題就是怎么滿足這些需求,以什么產(chǎn)品形態(tài)來(lái)滿足。 普通技術(shù)人員最容易想到的品類(lèi)可能就是智能眼鏡,因?yàn)檫@和人的眼睛在形態(tài)、功能上是最像的。這類(lèi)眼鏡往往用攝像頭采集數(shù)據(jù),然后用耳機(jī)把 AI 處理后的結(jié)果播報(bào)給用戶。這些年,傅高山已經(jīng)見(jiàn)過(guò)不下五款智能眼鏡,設(shè)計(jì)者的想法基本都是「你眼睛不好,我就給你補(bǔ)兩顆智能的」。 起初,微光團(tuán)隊(duì)的助視輔具也有這種傾向,但傅高山的一番解釋讓他們明白了為什么這種形式行不通。 首先,從信息采集方式來(lái)看,人的頭部在行走過(guò)程中是不穩(wěn)定的。 其次,眼鏡 + 耳機(jī)的形式大量占用耳朵,而耳朵又是視障者接收周?chē)畔⒌闹匾泄佟榱吮3致?tīng)覺(jué)的靈敏,他們下雨天甚至都不怎么打傘。 最后,視障者其實(shí)希望在接受技術(shù)輔助時(shí)擁有自主權(quán)。他們不需要輔具時(shí)時(shí)刻刻工作,只想在需要的時(shí)候拿出來(lái)用一下。因此,他們希望這款輔具是方便摘取且按需播報(bào)的。 「我們期望技術(shù)能解決的,就是遵循現(xiàn)有的方式,讓視障者的學(xué)習(xí)成本更低、便利性更高。如果想做一款設(shè)備來(lái)替代人的器官,目前來(lái)看,這種思路基本都不可行。」傅高山解釋說(shuō)。 在聽(tīng)取了傅高山的建議后,微光團(tuán)隊(duì)把助視輔具的形態(tài)改成了頸掛式,交互方式也演變成了用揚(yáng)聲器按需播報(bào)。這款設(shè)備可以滿足日常生活、出行的一些基本需求,比如物體、信息識(shí)別,建筑物內(nèi)導(dǎo)航等。此外,該設(shè)備還支持向附近在線的人發(fā)起求助。
微光團(tuán)隊(duì)作品3D打印樣品
一份「超出期待」的答卷
「您試用過(guò)選手的作品嗎,感覺(jué)怎么樣?」在被問(wèn)及這個(gè)問(wèn)題時(shí),傅高山的回答是:超出期待。 以靈瞳團(tuán)隊(duì)的「對(duì)話式視覺(jué)助手」為例,傅高山對(duì)它的期待原本是:能實(shí)現(xiàn)一個(gè)功能就很有價(jià)值了,結(jié)果靈瞳做出了很多個(gè)。通過(guò)對(duì)話式主動(dòng)智能,你既可以問(wèn)視覺(jué)助手衣服的款式和價(jià)格、 襪子的顏色是否一致、薯片的口味和保質(zhì)期,也可以和它聊聊文章的配圖、電商主播的穿搭……
這種超出期待的能力離不開(kāi)多模態(tài)技術(shù)的支持。靈瞳團(tuán)隊(duì)介紹說(shuō),目前國(guó)際學(xué)術(shù)界很多人都在嘗試用 VQA(視覺(jué)問(wèn)答)等多模態(tài)方法解決視障類(lèi)問(wèn)題,只是還沒(méi)有實(shí)現(xiàn)大規(guī)模工程落地。
vizwiz 公開(kāi)的用于解決視障類(lèi)問(wèn)題的 VQA-Grounding 數(shù)據(jù)集。照片由視障者拍攝。
同樣采用了多模態(tài)技術(shù)的還有聆影聽(tīng)光團(tuán)隊(duì),他們的目標(biāo)是用 AI 實(shí)現(xiàn)視頻無(wú)對(duì)白片段的內(nèi)容理解,進(jìn)而為這些片段生成旁白,方便視障群體追劇、看電影、刷視頻。與傳統(tǒng)的人工方式相比,他們的方法會(huì)顯著降低無(wú)障礙視頻的制作成本和周期,滿足了視障者想和朋友溝通最新影視作品的愿望。
「只要是在正確的路上,有就比沒(méi)有強(qiáng),」傅高山總結(jié)說(shuō)。 從「面對(duì)面」到「肩并肩」,「改變」正在發(fā)生
「視障是壓在身上的一座大山。你從小就是被否定的,你看不見(jiàn)就做不了這,做不了那,你自己也那么認(rèn)為。」肖佳這番話道出了很多人對(duì)于視障群體的刻板觀念,這也是很多視障問(wèn)題遲遲難以解決的根源。
持有這種觀念的明眼人在幫助視障群體時(shí)往往會(huì)以一種「面對(duì)面」而非「肩并肩」的態(tài)度來(lái)看待事情?!副热缥覀兿胂笠粋€(gè)畫(huà)面,在飛機(jī)座艙里面,一個(gè)空乘背著一個(gè)肢體障礙者??赡軓耐饨绲慕嵌?,他很容易看到航空公司提供了溫暖的服務(wù)。但從障礙者的角度來(lái)看,他會(huì)想為什么飛機(jī)上沒(méi)有輪椅。作為被背著的那個(gè)人,他其實(shí)沒(méi)有那么舒服。」傅高山解釋說(shuō)。
在傅高山看來(lái),靈瞳、微光等團(tuán)隊(duì)的可貴之處在于,他們?cè)趲椭曊先后w的過(guò)程中完成了從「面對(duì)面」到「肩并肩」的視角切換,真正做到了站在視障者的視角去解決問(wèn)題。
這種讓視障者更加自主的解決問(wèn)題的方式對(duì)于他們建立自信也非常重要。當(dāng)做很多小事的學(xué)習(xí)成本降下來(lái)之后,他們會(huì)更加愿意嘗試。就像肖佳所說(shuō),視障者學(xué)會(huì)了化妝就不會(huì)只想做按摩師,也會(huì)想嘗試主播等新興職業(yè)。
在經(jīng)歷了 5 個(gè)多月的賽程后,2022 技術(shù)公益創(chuàng)新杯終于在前段時(shí)間迎來(lái)了決賽。文中提到的幾個(gè)團(tuán)隊(duì)均在決賽中取得了優(yōu)異的成績(jī)。其中,靈瞳和聆影聽(tīng)光團(tuán)隊(duì)獲得了大賽一等獎(jiǎng),靈瞳還和微光團(tuán)隊(duì)一起獲得了最受歡迎獎(jiǎng)。
雖然比賽已經(jīng)告一段落,但從更長(zhǎng)的時(shí)間維度來(lái)看,它只是一個(gè)開(kāi)始。目前,大賽的相關(guān)人員已經(jīng)開(kāi)始著手后續(xù)的孵化工作,希望大賽中誕生的這些 idea 能夠讓更多的視障者過(guò)上更加體面的生活。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。