5分鐘速通 AI 計(jì)算機(jī)視覺(jué)發(fā)展應(yīng)用
作者 | 李秋鍵
出品 | AI科技大本營(yíng)(ID:rgznai100)
計(jì)算機(jī)視覺(jué)是進(jìn)步最大、發(fā)展最快的領(lǐng)域之一。根據(jù) Global VIEW 的研究,全球計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模在 2020 的價(jià)值為 113 億 2000 萬(wàn)美元,預(yù)計(jì)從2021 到 2028 的復(fù)合年增長(zhǎng)率為 7.3% 。人工智能計(jì)算機(jī)視覺(jué)的使用案例幾乎不計(jì)其數(shù),其中最受歡迎的是無(wú)人機(jī)以及自動(dòng)和半自動(dòng)車輛。今天小編帶大家?guī)追昼娝偻?AI 計(jì)算機(jī)視覺(jué)發(fā)展應(yīng)用。
應(yīng)用前景
(1)物流:
利用計(jì)算機(jī)圖像識(shí)別、地址庫(kù)、合卷積神經(jīng)網(wǎng)提升手寫運(yùn)單機(jī)器有效識(shí)別率和準(zhǔn)確率,大幅度地減少人工輸單的工作量和差錯(cuò)可能。
(2)肺部疾病影像診斷:
使用圖像分割算法對(duì)肺部掃描序列進(jìn)行處理,生成肺部區(qū)域圖,然后根據(jù)肺部區(qū)域圖生成肺部圖像。利用肺部分割生成的肺部區(qū)域圖像和結(jié)節(jié)標(biāo)準(zhǔn)信息生成結(jié)節(jié)區(qū)域圖像,對(duì)基于CNN的肺結(jié)節(jié)分割器進(jìn)行訓(xùn)練,然后對(duì)圖像進(jìn)行肺結(jié)節(jié)分割,得到疑似肺結(jié)節(jié)區(qū)域。找到疑似肺結(jié)節(jié)后,使用3D CNN對(duì)肺結(jié)節(jié)進(jìn)行分類,得到真正肺結(jié)節(jié)的位置和置信度。
(3)垃圾桶智能監(jiān)護(hù):
首先,攝像頭拍攝垃圾照片,并將照片上傳至信息處理器,信息處理器對(duì)照片識(shí)別后,對(duì)垃圾進(jìn)行分類;然后生成分類結(jié)果,再將結(jié)果發(fā)送到信號(hào)燈指示器;最后,對(duì)應(yīng)的垃圾類別的信號(hào)燈就會(huì)亮起,提示人應(yīng)該投入哪個(gè)投放口。需要注意的是,垃圾桶應(yīng)配備傳感器和感應(yīng)開(kāi)關(guān),并且應(yīng)當(dāng)設(shè)置在垃圾桶外殼與投放口相對(duì)應(yīng)的位置。顯示屏最好選用觸摸屏,便于用戶操作和調(diào)整設(shè)置以及控制攝像頭。
(4)交通:
(一)用于自適應(yīng)信號(hào)控制機(jī)檢測(cè)
1. 對(duì)車輛的檢測(cè)
無(wú)論是針對(duì)全感應(yīng)信號(hào)控制機(jī)還是半感應(yīng)信號(hào)控制機(jī),圖像識(shí)別技術(shù)可以實(shí)時(shí)檢測(cè)主干道或次干路車道上的車輛到達(dá)和排隊(duì)情況,并可通過(guò)算法分析,對(duì)交叉口信號(hào)控制機(jī)進(jìn)行實(shí)時(shí)數(shù)據(jù)更新,以保證最優(yōu)算法,提供通暢的交通條件,在一定程度上避免了上下游交通擁堵。
2. 對(duì)行人的檢測(cè)
在城市化建設(shè)的重要發(fā)展中,CBD商業(yè)步行街越來(lái)越彰顯一個(gè)城市的文化精神之地,但大部分的商業(yè)街都是開(kāi)放性的,如成都寬窄巷子等,這些旅游熱點(diǎn),往往是人潮擁擠,將其感應(yīng)控制理念用于該交叉口的信號(hào)控制機(jī),即采取車輛相位的最小綠燈時(shí)間和行人相位的最大綠燈時(shí)間,會(huì)大大提高行人和車輛的有效綠燈時(shí)間,并使得行人與車輛有序、暢通、安全地進(jìn)行交通組織。而識(shí)別技術(shù)可以作為決策最小和最大綠燈時(shí)間的“發(fā)現(xiàn)者”;它可以在半感應(yīng)控制系統(tǒng)中實(shí)時(shí)檢測(cè)出車輛,并最大化地疏通行人;或在全感應(yīng)控制系統(tǒng)中將兩相行人流量和車輛流量反饋給信號(hào)控制機(jī),從而優(yōu)化交叉口的信號(hào)相位,達(dá)到確保行人、車輛的有序安全組織。
(二)用于潮汐車道的自適應(yīng)檢測(cè)
隨著現(xiàn)代化都市工作節(jié)奏的加快,城市的交通流形成了周期性、潮汐性的現(xiàn)象;而潮汐車道應(yīng)運(yùn)而生,但面臨波動(dòng)的車流和交通區(qū)位的不同,為了保證潮汐車道的連續(xù)性,現(xiàn)有的潮汐車道都是穩(wěn)定的時(shí)間點(diǎn)變化,即在規(guī)定時(shí)間內(nèi),該車道是上行還是下行方向,這樣的設(shè)定時(shí)段式控制法,不具靈活性,由于早高峰和晚高峰具有不同集群的特點(diǎn),因此忽略了交通的動(dòng)態(tài)變化性這個(gè)特點(diǎn)。
根據(jù)大城市多具有放射環(huán)狀式路網(wǎng)布局的特點(diǎn),采用識(shí)別技術(shù)在城市中心多個(gè)射線沿路上的交叉口進(jìn)行采集點(diǎn)布局,將上游路段實(shí)時(shí)反饋給下游,再結(jié)合電子屏實(shí)時(shí)信號(hào)控制,充分發(fā)揮潮汐車道的機(jī)動(dòng)性,在時(shí)間上給予車流最大節(jié)省,從而緩解城市的擁堵,尤其是高峰期的擁堵。
(三)用于無(wú)人駕駛場(chǎng)景下的檢測(cè)
隨著人工智能的發(fā)展,無(wú)人駕駛在國(guó)內(nèi)也得到了多個(gè)科研機(jī)構(gòu)和大型企業(yè)的進(jìn)一步探索,而試運(yùn)車也在上海廣州等地正式上路,這說(shuō)明無(wú)人駕駛時(shí)代即將在不遠(yuǎn)的將來(lái)走進(jìn)人們的生活,而面對(duì)如此復(fù)雜的交通環(huán)境,尤其是城市交通,要保證慢行交通尤其是步行者——人的安全,就要充分發(fā)揮無(wú)人駕駛各個(gè)傳感器的綜合優(yōu)勢(shì),而攝像頭作為其環(huán)境感知部分的重要部分之一,將深度學(xué)習(xí)和機(jī)器視覺(jué)同時(shí)融合,讓無(wú)人車輛在上路前學(xué)會(huì)大量的城市場(chǎng)景儲(chǔ)備,同時(shí)識(shí)別技術(shù)在無(wú)人駕駛車真正路用時(shí)發(fā)揮其作用,輔助車輛精準(zhǔn)判別各類復(fù)雜的交通場(chǎng)景,并相應(yīng)的給出決策行為。
(5)紡織品及服裝:
纖維及織物組織識(shí)別
紡織階段,圖像識(shí)別技術(shù)可用于識(shí)別區(qū)分各類纖維及其織物,還可用于原棉加工前識(shí)別非棉雜質(zhì)。對(duì)于織物組織結(jié)構(gòu),針織物中對(duì)緯編組織的研究較多,如對(duì)其編織周期的識(shí)別及組織結(jié)構(gòu)的編碼分類等。機(jī)織物中目前能夠識(shí)別出織物中的三原組織;還可輔以亮度累加法檢測(cè)分割經(jīng)緯紗線、定位組織點(diǎn),用于計(jì)算紗線密度和組織點(diǎn)的自動(dòng)分類。但由于織物組織結(jié)構(gòu)復(fù)雜多樣,即使是人工識(shí)別,若非專業(yè)人士也難以輕易辨認(rèn),因此目前大多相關(guān)研究還停留在人工與計(jì)算機(jī)交互操作提取特征進(jìn)行識(shí)別,難以大范圍推廣。
織物疵點(diǎn)檢測(cè)
織物疵點(diǎn)檢測(cè)經(jīng)過(guò)十?dāng)?shù)年的發(fā)展,已基本能完成疵點(diǎn)判別、疵點(diǎn)分割、疵點(diǎn)分類等功能,并應(yīng)用于工業(yè)。識(shí)別準(zhǔn)度是其中較為重要的驗(yàn)收指標(biāo),但在保證準(zhǔn)度的前提下,識(shí)別速度也需逐步提高,目前疵點(diǎn)在線監(jiān)測(cè)的速度要求一般高于60 m/min,檢測(cè)的疵點(diǎn)最小尺寸為0.5 mm。近年進(jìn)展多為提高精細(xì)度及速度、擴(kuò)展識(shí)別疵點(diǎn)類別及檢驗(yàn)規(guī)范化等,還有部分學(xué)者在對(duì)織物褶皺及折痕的研究中也使用了圖像識(shí)別相關(guān)技術(shù),提出多視域織物外觀平整度客觀評(píng)級(jí)方法,嘗試讓機(jī)器判斷織物平整度并驗(yàn)證,為織物表現(xiàn)性能的評(píng)估提供了有效的解決方案。
面料檢索
面料圖像的商業(yè)價(jià)值和大眾使用率較高,消費(fèi)者和生產(chǎn)商都有挑選符合自己預(yù)期面料的需求;且面料圖像的顏色、紋理、形狀等底層特征相對(duì)較為簡(jiǎn)單明晰,易于被計(jì)算機(jī)提取和區(qū)分。計(jì)算機(jī)除了能夠通過(guò)對(duì)比面料圖像實(shí)現(xiàn)相似面料的檢索之外,還可基于對(duì)部分特征明顯的面料進(jìn)行感性屬性定義,實(shí)現(xiàn)對(duì)面料的主觀情感標(biāo)注。如分析面料顏色的飽和度、對(duì)比度、色彩關(guān)系及紋理、圖案等,人工將客觀指標(biāo)歸納至感性認(rèn)知,用于面料檢索和推薦。但目前的面料檢索研究樣本仍較為單一,多為同類面料不同色彩,或同類面料不同圖案的研究,且人工定義情感屬性局限較大,可嘗試多維度多分類研究。
服裝領(lǐng)域
服裝領(lǐng)域中,對(duì)人體體型及服裝款式圖、樣板圖的識(shí)別多為服裝院校和服裝專業(yè)研究者完成;而計(jì)算機(jī)、信息技術(shù)領(lǐng)域等學(xué)者通常從識(shí)別服裝實(shí)物圖、著裝圖入手,對(duì)相關(guān)圖像進(jìn)行識(shí)別、檢索、分割、分類及標(biāo)注等。
人體體型識(shí)別
人體是服裝的基礎(chǔ),服裝的智能化生產(chǎn)離不開(kāi)對(duì)個(gè)體體型的研究及描述。對(duì)人體體型的研究多基于來(lái)源于二維測(cè)量或三維人體掃描的數(shù)據(jù),但就圖像識(shí)別技術(shù)發(fā)展以來(lái),也漸有學(xué)者致力于對(duì)圖像信息的分析以識(shí)別體型。一般是對(duì)人體二維照片進(jìn)行預(yù)處理后提取輪廓曲線,再用一定的描述方法對(duì)曲線分類、以達(dá)到對(duì)體型分類的目的。
服裝款式圖與樣版圖識(shí)別
關(guān)于服裝款式圖,可運(yùn)用shock graph技術(shù)提取形狀特征再對(duì)其分類;對(duì)于樣版圖,可對(duì)樣版邊緣進(jìn)行識(shí)別,在樣片文件中儲(chǔ)存縫紉信息以用于自動(dòng)縫紉技術(shù)。但服裝行業(yè)中的款式圖風(fēng)格不一,還未形成一個(gè)統(tǒng)一規(guī)范作為分類標(biāo)準(zhǔn);且shock graph一般用于進(jìn)行形狀外輪廓的識(shí)別與匹配,不包括內(nèi)部細(xì)節(jié),無(wú)法作為樣版庫(kù)的檢索依據(jù)。需求方面,對(duì)服裝款式圖與樣版圖的識(shí)別需求較??;識(shí)別難度方面,服裝款式圖和樣版圖像只包含黑白二色及線條,無(wú)顏色和紋理特征,就發(fā)展現(xiàn)狀而言識(shí)別難度較實(shí)物圖高,需要對(duì)比不同的圖像識(shí)別模型和方法,綜合選擇最合適的方案
服裝著裝圖檢索分類
服裝圖像識(shí)別可分為對(duì)服裝廓形、尺寸的識(shí)別,及服裝分類、檢索和標(biāo)注。服裝廓形的識(shí)別中,一般先在人體著裝照片以人臉或人體膚色為參照來(lái)確定照片中的服裝,再對(duì)服裝掃描識(shí)別特征點(diǎn)、獲取數(shù)據(jù),由人體身高比例或其他公式自動(dòng)計(jì)算測(cè)量服裝廓形相關(guān)尺寸,以此定義照片中的服裝廓形。借助計(jì)算機(jī)可實(shí)現(xiàn)部分服裝實(shí)物圖的尺寸及尺碼測(cè)量,但仍有較多人機(jī)交互工作量。
(6)安防領(lǐng)域的實(shí)踐應(yīng)用:
安防是每個(gè)行業(yè)都比較重視的問(wèn)題之一。安防領(lǐng)域,計(jì)算機(jī)圖像識(shí)別技術(shù)應(yīng)用廣泛,比如當(dāng)前很多城區(qū)和街道都安裝了監(jiān)控,主要目的是發(fā)生事故時(shí),可以準(zhǔn)確查找相關(guān)資料和圖像,為事故判定提供有效依據(jù)。現(xiàn)如今,我國(guó)大多數(shù)地區(qū)都已完成了自動(dòng)化視頻監(jiān)控,這是圖像識(shí)別技術(shù)處理應(yīng)用實(shí)踐的一個(gè)方式。將識(shí)別技術(shù)與安防結(jié)合,可以最大限度減輕人工勞動(dòng)力,提升工作時(shí)效性,為事故糾紛提供有效依據(jù)。
(7)農(nóng)業(yè)領(lǐng)域的實(shí)踐應(yīng)用:
我國(guó)是一個(gè)農(nóng)業(yè)大國(guó)。近年來(lái),我國(guó)在農(nóng)業(yè)中時(shí)常引進(jìn)現(xiàn)代技術(shù),培養(yǎng)農(nóng)業(yè)植物實(shí)驗(yàn)和新品種種植試驗(yàn)都融合了現(xiàn)代圖像識(shí)別技術(shù),以此觀察植物的生長(zhǎng)情況,從而確定影響植物生長(zhǎng)的因素。此外,圖像識(shí)別技術(shù)可鑒定農(nóng)產(chǎn)品最終質(zhì)量,為農(nóng)業(yè)發(fā)展提供相關(guān)依據(jù)和指導(dǎo)。
(8)工業(yè)領(lǐng)域:
工業(yè)領(lǐng)域,圖像識(shí)別處理技術(shù)有非常多應(yīng)用。它大大提升了工作時(shí)效性,比如自動(dòng)裝配中的質(zhì)量檢測(cè)、流體力學(xué)的阻力分析、自動(dòng)分揀、識(shí)別排列狀態(tài)以及設(shè)計(jì)、制造視覺(jué)效果等。其中,值得一提的是研究具備感官功能的機(jī)器人,給工業(yè)生產(chǎn)奠定了基礎(chǔ)。
(9)航空領(lǐng)域:
計(jì)算機(jī)圖像識(shí)別處理技術(shù)在航空領(lǐng)域的應(yīng)用,除了處理月球表面和火星圖片外,還有遙感技術(shù)等。經(jīng)過(guò)空中圖像處理,如將數(shù)字化數(shù)據(jù)轉(zhuǎn)為相應(yīng)信號(hào)并存入內(nèi)存,當(dāng)衛(wèi)星經(jīng)過(guò)地面上空時(shí),高速傳送圖片,由處理中心解析。這些圖像無(wú)論是儲(chǔ)存、傳輸還是成像判讀,都必須采用數(shù)字圖像識(shí)別技術(shù)?,F(xiàn)如今,世界各個(gè)大國(guó)都使用衛(wèi)星獲取所需圖像資源,例如災(zāi)難檢測(cè)、地質(zhì)勘探、農(nóng)城規(guī)劃等。數(shù)字圖像識(shí)別處理技術(shù)在天象預(yù)報(bào)和其他星球研究中發(fā)揮了重要作用。
(10)通信領(lǐng)域:
現(xiàn)如今,通信行業(yè)的主要發(fā)展目標(biāo)是融合聲音、文字的通信。其中,圖像通信是最復(fù)雜的技術(shù)領(lǐng)域。圖像數(shù)據(jù)量較大、較廣,目前智能電視機(jī)信號(hào)傳輸必須達(dá)到100 M/s以上,想要把輸送高速數(shù)據(jù),必須使用編碼技術(shù)壓縮信息量。
(11)軍事領(lǐng)域:
軍事行業(yè),圖像識(shí)別處理技術(shù)主要分布在導(dǎo)彈、照片解讀、具備圖像傳輸?shù)淖詣?dòng)化軍事系統(tǒng)等。目前,公安系統(tǒng)融入了圖像識(shí)別技術(shù),主要應(yīng)用于人臉識(shí)別、圖片復(fù)原等方面,例如常見(jiàn)的高速公路不停車收費(fèi)技術(shù)是圖像識(shí)別技術(shù)的應(yīng)用成果。
圖像識(shí)別算法
(1)基于度量學(xué)習(xí)核函數(shù)的圖像識(shí)別算法:通過(guò)馬氏度量學(xué)習(xí)對(duì)光學(xué)足跡圖像訓(xùn)練樣本特征進(jìn)行學(xué)習(xí)得到最優(yōu)的度量矩陣,從而構(gòu)造度量學(xué)習(xí)核函數(shù),在該核函數(shù)下再使用SVM進(jìn)行分類識(shí)別.(2)基于單步目標(biāo)識(shí)別架構(gòu)的輕量級(jí)裂紋圖像自動(dòng)識(shí)別:單步識(shí)別算法,相比于兩步式識(shí)別算法主要優(yōu)點(diǎn)在于能夠提高檢出速度與降低對(duì)硬件使用的負(fù)載,通過(guò)合理地網(wǎng)絡(luò)設(shè)計(jì)能夠提高結(jié)構(gòu)視覺(jué)檢測(cè)工作的效率與質(zhì)量,最終實(shí)現(xiàn)其自動(dòng)化。SSD算法包括以下組成部分:用于特征提取的Deep CNN(也稱為基礎(chǔ)網(wǎng)絡(luò),即Basenet)、特征層集合(Feature Layers)、識(shí)別分類器(Classifier)、非極大值抑制(Non-Maximum Suppression,NMS)。(3)改進(jìn)Mask R-CNN的火焰圖像識(shí)別算法:基于改進(jìn)Mask R-CNN的火焰圖像識(shí)別算法,算法在Mask R-CNN的基礎(chǔ)上,在特征金字塔引入一條自下向上的特征融合,同時(shí)改進(jìn)了損失函數(shù),使邊框定位更準(zhǔn)確。(4)基于RGB顏色空間:根據(jù)機(jī)場(chǎng)跑道路面上鮮明的顏色特征,采用抗噪性能好、識(shí)別速度快、識(shí)別精度高的RGB顏色空間識(shí)別方法進(jìn)行黑色膠痕的識(shí)別。(5)基于稀疏表示和多特征融合的 SAR 圖像識(shí)別:當(dāng)采用稀疏表示進(jìn)行 SAR 圖像目標(biāo)識(shí)別時(shí),可采用的特征包括灰度特征、局部特征(HOG 特征)及基于信號(hào)變換提取的特征(單演信號(hào)特征)等。進(jìn)行多特征融合時(shí),主要采用基于聯(lián)合稀疏表示的識(shí)別方法(7)基于邊緣學(xué)習(xí)的低分辨率圖像識(shí)別算法:提出了一種基于GAN結(jié)構(gòu)的邊緣學(xué)習(xí)低分辨率圖像識(shí)別算法,將通過(guò)生成網(wǎng)絡(luò)學(xué)習(xí)到的低分辨率圖像的幻想邊緣信息融入到識(shí)別網(wǎng)絡(luò)中,得到清晰的特征圖紋理輪廓,從而豐富了低分辨率圖像的高頻信息(8)基于方向梯度直方圖和灰度共生矩陣混合特征的金文圖像識(shí)別:用HOG提取金文的全局結(jié)構(gòu)特征,用GLCM提取金文的局部紋理特征,并將兩者進(jìn)行融合,對(duì)金文的特征描述更為全面。最后選取支持向量機(jī)(SVM)分類器對(duì)金文圖像進(jìn)行分類識(shí)別(9)基于WGAN的圖像識(shí)別方法:在GAN的生成器和判別器中加入了相同的類別標(biāo)簽,指導(dǎo)樣本的生成,使GAN具有了生成多類數(shù)據(jù)的能力。(10)傳統(tǒng)算法:機(jī)器學(xué)習(xí)算法K最鄰近(K-NearestNeighbor, KNN),支持向量機(jī)(Support Vector Machine, SVM)和多層感知機(jī)(MultilayerPerceptron,MLP)等,以及近幾年比較熱門的基于深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network, CNN)的圖像識(shí)別算法。深度學(xué)習(xí)模型包括深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)等。這些模型通過(guò)構(gòu)建一個(gè)更深層次的網(wǎng)絡(luò),在此基礎(chǔ)上由計(jì)算機(jī)學(xué)習(xí)得到圖像更深層次的特征信息以及數(shù)據(jù)隱含的內(nèi)部關(guān)系,使學(xué)習(xí)到的特征更具有表達(dá)能力,從而分類更加準(zhǔn)確。基于特征匹配的,比如 ORB、SIFT+SURF等等。
傳統(tǒng)圖像分割方法
基于閾值的分割方法
基于邊緣的分割方法
基于區(qū)域的分割方法
基于聚類分析的圖像分割方法
基于小波變換的分割方法
基于數(shù)學(xué)形態(tài)學(xué)的分割方法
基于人工神經(jīng)網(wǎng)絡(luò)的分割方法
以上就是給大家整理的AI計(jì)算機(jī)視覺(jué)發(fā)展的應(yīng)用,圖像識(shí)別算法以及傳統(tǒng)圖像分割的一些方法,小伙伴們可以自取呦~
李秋鍵,CSDN博客專家,CSDN達(dá)人課作者。碩士在讀于中國(guó)礦業(yè)大學(xué),開(kāi)發(fā)有taptap競(jìng)賽獲獎(jiǎng)等。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。