IBM訪談:如何用物聯(lián)網(wǎng)拯救 PM2.5?
人無(wú)時(shí)不刻不在呼吸,而動(dòng)輒爆表的 PM2.5,掙扎的霧霾讓我們不禁憂慮起自身的健康來(lái)。
本文引用地址:http://m.butianyuan.cn/article/201611/339849.htm在一年以前,IBM 研究院推出了 Green Horizon項(xiàng)目,雷鋒網(wǎng)此前也做過(guò)報(bào)道。Green Horizon 利用IBM的機(jī)器學(xué)習(xí)技術(shù)及物聯(lián)網(wǎng)技術(shù)(IoT),從大數(shù)據(jù)中挖掘從天氣到污染指數(shù)的一系列海量信息,以反復(fù)的迭代及自適應(yīng)的調(diào)整系統(tǒng),鍛造出世界上最為精確的能源和環(huán)境預(yù)測(cè)系統(tǒng)。
IBM 首先把試點(diǎn)城市選在了南非的約翰內(nèi)斯堡,與當(dāng)?shù)氐难芯繖C(jī)構(gòu)進(jìn)行協(xié)作。面對(duì)不斷惡化的大氣環(huán)境及氣候變化,它們又會(huì)做出怎樣的嘗試呢?日前,駐該機(jī)構(gòu)的 IBM 科學(xué)家 Tapiwa Chiwewe 與 IBM的 Chris Sciacca 進(jìn)行了一次訪談,雷鋒網(wǎng)摘編如下,未經(jīng)許可不得轉(zhuǎn)載。
Tapiwa Chiwewe
Chris Sciacca(下稱 Sciacca):
目前這個(gè)環(huán)境預(yù)測(cè)系統(tǒng)進(jìn)行到了怎樣的階段?
Tapiwa Chiwewe(下稱 TC):
此前試點(diǎn)城市能夠成功預(yù)測(cè)明天的環(huán)境狀況,不過(guò)經(jīng)過(guò)我們的努力,能夠?qū)⑦@一時(shí)間延長(zhǎng)到七天。
Sciacca:
那么,這個(gè)預(yù)測(cè)系統(tǒng)目前達(dá)到了怎樣的精度?
TC:
現(xiàn)在能夠達(dá)到 10 km*10 km 的空間分布率,而如果能增加更多的計(jì)算源,這一數(shù)字還能提升到 1 km*1 km 的高分辨率。
Sciacca:
如果要用預(yù)測(cè)結(jié)果做決策,精度要達(dá)到怎樣的水平?
TC:
如果這些判斷要用于決策的話,準(zhǔn)確度能達(dá)到 70% 以上(包括一些明顯的、肉眼可排除的錯(cuò)誤)就可以稱得上是很不錯(cuò)的結(jié)果了。而預(yù)測(cè)污染指數(shù)為環(huán)境提供公共預(yù)警信號(hào)肯定是大有裨益。
Sciacca:
我們都知道,在一天內(nèi)或者一個(gè)地點(diǎn)中污染物的數(shù)量不可避免地會(huì)存在一定波動(dòng),那么這一數(shù)字與預(yù)測(cè)結(jié)果相比存在多少誤差?
TC:
污染情況的波動(dòng)取決于特定的天氣狀況。一些會(huì)造成強(qiáng)烈影響的天氣狀況(如強(qiáng)風(fēng)、降雨、低氣壓等)能夠在幾個(gè)小時(shí)內(nèi)迅速改變污染指數(shù)。而空氣質(zhì)量的預(yù)測(cè)主要借助的是天氣模型來(lái)捕獲上述容易影響污染狀況的信息并做出調(diào)整,因此誤差的規(guī)模就會(huì)減小很多。
Sciacca:
目前階段及未來(lái),我們是否能準(zhǔn)確判斷污染源?
TC:
污染源對(duì)于預(yù)測(cè)系統(tǒng)而言是另一個(gè)全新的命題,因?yàn)樗枰獙?duì)每個(gè)污染源進(jìn)行判斷,包括直接排放量、天氣影響,伴隨化學(xué)反應(yīng)產(chǎn)生的二次污染等。
我們實(shí)際上可以追蹤污染源來(lái)自什么樣的地點(diǎn)。但它需要大量的數(shù)據(jù)源模型,且不能包含目前的試點(diǎn)。不過(guò)它可能是未來(lái)商業(yè)化的一個(gè)變現(xiàn)手段。另外,風(fēng)是一個(gè)比較簡(jiǎn)單的判斷因素,如果我們只考慮污染物的飄散狀況,這個(gè)模型就會(huì)相對(duì)簡(jiǎn)單。
Sciacca:
要讓這個(gè)系統(tǒng)順利運(yùn)轉(zhuǎn),我們需要什么樣的支持?
TC:
實(shí)時(shí)傳感器的數(shù)據(jù)當(dāng)然必不可少。日常的天氣預(yù)測(cè)可以以三天為界,并通過(guò)在線站點(diǎn)進(jìn)行分析與整合。
Sciacca:
數(shù)據(jù)的來(lái)源是什么,又是如何進(jìn)行收集的?
TC:
數(shù)據(jù)源于三個(gè)南非的空氣監(jiān)測(cè)網(wǎng)絡(luò),為約翰內(nèi)斯堡、Thswane及瓦爾河監(jiān)測(cè)中心。在三個(gè)網(wǎng)絡(luò)點(diǎn)間,有 21 個(gè)監(jiān)測(cè)站,按照南非空氣質(zhì)量數(shù)據(jù)中心的要求收集數(shù)據(jù)。我們準(zhǔn)備將這一功能增加到 IBM 的 The Weather Company 商業(yè)計(jì)劃中。
Sciacca:
是否能為我們解釋一下采用 PM10、PM2.5和二氧化氮這三個(gè)指標(biāo)的原因?可否簡(jiǎn)單理解為,這三項(xiàng)為最“簡(jiǎn)單粗暴”的判斷標(biāo)準(zhǔn)?
TC:
在監(jiān)測(cè)之時(shí),那些容易對(duì)人類、野生動(dòng)植物及環(huán)境的健康造成影響的污染物自然首當(dāng)其沖。南非通常每五年就會(huì)重新制定一次空氣質(zhì)量管理計(jì)劃,明確首要關(guān)注的污染物,考慮所可能造成的危害,對(duì)干預(yù)策略的有效性進(jìn)行判斷,以控制空氣污染。
Sciacca:
約翰內(nèi)斯堡的哪些信息能夠作為數(shù)據(jù)源?
TC:
數(shù)據(jù)的質(zhì)量會(huì)以多種形式從不同站點(diǎn)收集,包括讀數(shù)記錄、采樣間隔的時(shí)間、還有讀數(shù)的準(zhǔn)確性。這些都受監(jiān)測(cè)站設(shè)備維護(hù)狀況的影響。
Sciacca:
后續(xù)將有什么研究計(jì)劃?
TC:
除了收集更多的數(shù)據(jù),我們計(jì)劃推出API,開(kāi)發(fā)人員能夠基于此創(chuàng)建為消費(fèi)者和企業(yè)使用的應(yīng)用程序。
如果你對(duì)他的研究感興趣,歡迎閱讀他的論文:Machine Learning Based Estimation of Ozone Using Spatio-Temporal Data from Air Quality Monitoring Stations
評(píng)論