有關(guān)機(jī)器視覺的四個真相,你知道幾個?
在人們從自然界獲取的各種信息中,視覺獲取量最高,約占總信息量的80%。隨著信息技術(shù)的發(fā)展,人類的視覺功能逐步被賦予計算機(jī)、機(jī)器人或其他智能機(jī)器。目前正處在行業(yè)風(fēng)口的機(jī)器視覺就是這樣一種技術(shù),它通過圖像處理實現(xiàn)自動檢測和分析應(yīng)用,包括自動檢測、過程控制和機(jī)器人導(dǎo)航等。目前,機(jī)器視覺(MV)技術(shù)已經(jīng)實現(xiàn)產(chǎn)品化。視覺傳感器、鏡頭、高速相機(jī)、光源、視覺軟件、圖像采集卡、視覺處理器等都變得越來越完善。在工業(yè)自動化環(huán)境中,機(jī)器視覺越來越受到行業(yè)的關(guān)注,并被大量用于諸如自動駕駛汽車、食品生產(chǎn)、包裝和物流、機(jī)器人和無人機(jī)等。
當(dāng)提到機(jī)器視覺時,技術(shù)人員可能會很多理解,本文嘗試著從四個方面逐一解釋有關(guān)機(jī)器視覺應(yīng)了解的真相。
真相一:機(jī)器視覺≠計算機(jī)視覺
機(jī)器視覺是一種通過光學(xué)設(shè)備和非接觸傳感器自動接收和處理真實物體圖像的設(shè)備,以獲取所需信息或控制機(jī)器人的運(yùn)動。自20世紀(jì)50年代開始運(yùn)行,從1980年到1990年,這項技術(shù)真正開始起飛并逐漸普及。經(jīng)過數(shù)十年的發(fā)展,機(jī)器視覺已經(jīng)為它是什么以及它是如何工作的積累了各種定義。
自動化成像協(xié)會(AIA)給出了一個更具廣義意味的定義,即:機(jī)器視覺包括所有工業(yè)和非工業(yè)應(yīng)用,其中硬件和軟件的組合為設(shè)備執(zhí)行基于圖像捕獲和處理的功能提供操作指導(dǎo)。而SearchEnterpriseAI則給出了機(jī)器視覺的狹義定義,將其稱之為“計算機(jī)的視覺能力”,該系統(tǒng)使用一個或多個攝像機(jī)、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號處理(DSP),將產(chǎn)生的數(shù)據(jù)傳輸?shù)接嬎銠C(jī)或機(jī)器人控制器。
在實際應(yīng)用中,機(jī)器視覺通常需要與其他先進(jìn)的技術(shù)協(xié)同工作,包括自然語言處理、機(jī)器人過程自動化(RPA)、人工智能(AI)和機(jī)器學(xué)習(xí)(ML)等,以實現(xiàn)自動化所需的“視覺”功能。你可以把機(jī)器視覺看作是自動化的眼睛,AI和ML是大腦,RPA提供了完成工作所需的“鍵盤手”。近年來,自動化的采用速度不斷加快,這對企業(yè)保持行業(yè)競爭力至關(guān)重要。如果把自動化想象成“數(shù)字化員工”在工作,假如不增加機(jī)器視覺,那么所有這些“數(shù)字化員工”都會處于失明狀態(tài)。
計算機(jī)視覺也是近年來的行業(yè)大熱門,那么它與機(jī)器視覺又有什么關(guān)聯(lián)呢?宏觀來講,機(jī)器視覺是一種以新的方式與現(xiàn)有技術(shù)集成并應(yīng)用于解決現(xiàn)實世界問題的技術(shù)能力,是一門系統(tǒng)工程學(xué)科。而計算機(jī)視覺是計算機(jī)科學(xué)的一種形式,不是通過固定在機(jī)器人上的視覺設(shè)備如攝像頭等有形硬件來實現(xiàn)的。
更具體來說,機(jī)器視覺是一個系統(tǒng)的主體,而計算機(jī)視覺是系統(tǒng)的智能,是處理信息的大腦。沒有計算機(jī)視覺,機(jī)器視覺將無法工作。機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)是通過機(jī)器視覺系統(tǒng)以更快的速度處理項目的三種技術(shù)。這三種技術(shù)可用于擴(kuò)大機(jī)器視覺對要定位的內(nèi)容的理解,使其成為機(jī)器視覺的寶貴資產(chǎn)。隨著計算機(jī)視覺技術(shù)的進(jìn)步,機(jī)器視覺潛在應(yīng)用的可能性也相應(yīng)增加。
值得注意的是,機(jī)器視覺與圖像處理同樣是兩個不同的概念,圖像處理是一個輸出圖像的過程,而機(jī)器視覺系統(tǒng)可以檢測和分類廣泛行業(yè)中的各種物體和項目,包括汽車、電子和半導(dǎo)體、食品和飲料、道路和車輛交通或智能運(yùn)輸系統(tǒng)(ITS)、醫(yī)療成像、包裝、標(biāo)簽和印刷、制****、電視廣播等,基于機(jī)器視覺的技術(shù)正在成為自動化創(chuàng)建的核心。
真相二:硬件和軟件的發(fā)展促成了機(jī)器視覺的進(jìn)步
機(jī)器視覺是工業(yè)自動化的眼睛。其主要工作流程是:系統(tǒng)通過機(jī)器視覺產(chǎn)品(如攝像頭、CMOS或CCD)將拍攝的目標(biāo)轉(zhuǎn)換為圖像信號,然后將圖像信號傳輸?shù)綄S脠D像處理系統(tǒng)。根據(jù)像素分布、亮度和顏色等信息,再將圖像信號轉(zhuǎn)換為數(shù)字化信號,最終使機(jī)器(機(jī)器人或其他工業(yè)工具)能夠完成制造和質(zhì)量驗證等工業(yè)任務(wù)。
機(jī)器視覺是工業(yè)4.0的關(guān)鍵要素,它正以多種方式幫助工業(yè)自動化系統(tǒng),例如通過改善庫存、檢測故障產(chǎn)品和提高制造質(zhì)量來提高效率。若要準(zhǔn)確地模擬人類的感知,機(jī)器視覺需要一系列設(shè)備和軟件的幫助。而這些軟硬件技術(shù)的不斷發(fā)展進(jìn)一步推動了機(jī)器視覺技術(shù)的演進(jìn)。
#01 智能攝像頭
攝像頭(camera)是機(jī)器視覺系統(tǒng)中檢查物體或物品的主要設(shè)備。有時,一個特定的檢查點(diǎn)可能需要安裝多個攝像頭,以確??梢哉_檢查每一個細(xì)節(jié)。當(dāng)機(jī)器視覺系統(tǒng)需要從圖像中捕獲和提取特定應(yīng)用程序的信息時,這時就需要智能攝像頭的支持。智能攝像頭通常包含所有必要的通信接口,并可連接到Wi-Fi或服務(wù)器,以便傳輸捕獲的圖像數(shù)據(jù)。作為一種強(qiáng)大工具,深度學(xué)習(xí)能使系統(tǒng)設(shè)計師快速實現(xiàn)復(fù)雜且主觀決策的自動化,同時有效提高產(chǎn)品質(zhì)量和產(chǎn)能。由Teledyne Flir公司提供的FLIR Firefly DL攝像頭,內(nèi)建的深度學(xué)習(xí)推斷使得該產(chǎn)品不再需要任務(wù)分類的主機(jī)系統(tǒng),大大降低了系統(tǒng)的成本和復(fù)雜性。Firefly DL攝像頭尺寸小巧、重量輕且功耗低,非常適合嵌入移動、桌面和手持系統(tǒng)。
圖1:Teledyne公司FLIR Firefly DL攝像頭具有尺寸小巧、功耗低等特點(diǎn)(圖源:Teledyne)
Omron Industrial Automation公司的S133 UVC彩色CMOS攝像頭同樣是一款智能攝像頭產(chǎn)品,它內(nèi)置CMOS傳感器,采用超緊湊結(jié)構(gòu),即插即用,是尋找具有機(jī)器視覺功能攝像頭的理想選擇。由于使用方便,S133 UVC彩色CMOS攝像頭深受工業(yè)/機(jī)器視覺應(yīng)用、汽車、生命科學(xué)等領(lǐng)域的歡迎。
圖2:S133 UVC彩色CMOS攝像頭(圖源:Omron)
#02 3D攝像頭
3D攝像頭可以在圖像中顯示被檢測物的深度,以顯示圖像的不同角度。通過在機(jī)器視覺系統(tǒng)中使用3D攝像頭,將帶來不同的視角和深度感知。飛行時間(ToF)攝像頭是使用飛行時間原理測量距離的3D攝像頭。ToF成像技術(shù)允許它在不掃描物體的情況下進(jìn)行3D成像,該技術(shù)通??筛采w幾米到約40米的距離,每秒最多100張圖像,距離分辨率約為5到10毫米,橫向分辨率約為200 x 200。
歷史上,因?qū)oF的準(zhǔn)確性存在一些質(zhì)疑,人們通常將其視為精度較低的3D傳感技術(shù)。當(dāng)然,近些年很多頭部企業(yè)已經(jīng)開發(fā)出高達(dá)130萬像素的高分辨率產(chǎn)品,用于機(jī)器視覺系統(tǒng)的高精度ToF攝像頭能顯著提高生產(chǎn)的靈活性和自動化程度。索尼公司的IMX556 DepthSense ToF傳感器采用CAPD和背面照明(BSI)技術(shù),與市場上現(xiàn)有的ToF解決方案相比,能夠提供精確到毫米的精度,在6米工作距離下,以30fps的速度提供640 x 480的分辨率。
圖3:索尼IMX556 DepthSense ToF傳感器能夠更可靠地以3D格式,更詳細(xì)更快速的幀率重建被測物體(圖源:Sony)
Texas Instruments的OPT8241飛行時間 (ToF) 傳感器,將ToF傳感與模數(shù)轉(zhuǎn)換器和可編程定時發(fā)生器(TG)相結(jié)合,該器件能以高達(dá)150幀/秒的幀速率提供320 x 240分辨率的圖像。內(nèi)置的TG可控制復(fù)位、調(diào)制和讀出數(shù)字化序列。同時,TG具備可編程性,可靈活優(yōu)化各項深度感知性能指標(biāo),例如功率、運(yùn)動穩(wěn)健性、信噪比和環(huán)境消除等。
圖4:TI公司OPT8241 ToF傳感器系統(tǒng)框圖(圖源:TI)
#03 視覺傳感器
視覺傳感器是機(jī)器視覺系統(tǒng)的核心,是最大化環(huán)境特性的來源,其核心設(shè)備是CCD、CMOS等圖像傳感器。這些分辨率較高的視覺傳感器通常能夠生成包含更多像素的圖像,非常有助于提高圖像質(zhì)量,更容易識別視覺細(xì)節(jié)。
長期以來,CCD傳感器是捕獲高質(zhì)量、低噪聲圖像的主流技術(shù)。但是CCD傳感器的制造成本很高,因此價格普遍較高,功耗也要比CMOS傳感器高很多。如今,CMOS傳感器技術(shù)已經(jīng)發(fā)展到可以快速接近CCD技術(shù)的質(zhì)量和功能,并且價格更低,體積更小,功耗更低。CMOS相機(jī)的幀速率通常要高于CCD相機(jī),對于那些依賴實時圖像處理進(jìn)行自動化或圖像數(shù)據(jù)分析的機(jī)器視覺系統(tǒng)而言,此功能至關(guān)重要。另外,CMOS傳感器比CCD傳感器對紅外波長更敏感,CMOS芯片和相機(jī)制造商利用這一優(yōu)勢可捕獲紅外線,為圖像識別提供了額外的成像能力。兩相權(quán)衡,CMOS傳感器可能更加適合機(jī)器視覺應(yīng)用。
安森美(onsemi)AR0130是一款1/3英寸CMOS數(shù)字圖像傳感器,有源像素陣列為1280H x 960V,使用滾動快門讀數(shù)捕獲圖像。該產(chǎn)品包括復(fù)雜的相機(jī)功能,如自動曝光控制,窗口,以及視頻和單幀模式。AR0130能夠拍攝非常清晰的數(shù)字圖像,并且能夠捕獲連續(xù)視頻和單幀,尤其適合高性能機(jī)器視覺應(yīng)用。
#04 光源
作為一種輔助成像設(shè)備,光源對成像質(zhì)量往往起到至關(guān)重要的作用。以LED照明產(chǎn)品為例,它們具有更高的靈活性,具有可調(diào)角度和附加波長,更一致的光譜響應(yīng)。市場上有多種波長和形狀的光源可供選擇,產(chǎn)品的選擇并不難。
#05 圖像采集卡
圖像采集卡通常以電腦插卡的形式存在,它的主要工作是將圖像輸出傳送到計算機(jī)主機(jī)。圖像采集卡需要將來自相機(jī)的模擬或數(shù)字信號轉(zhuǎn)換為特定格式的圖像數(shù)據(jù)流,還可以控制相機(jī)的一些參數(shù),例如觸發(fā)信號、曝光/積分時間、快門速度等。圖像采集卡通常針對不同類型的相機(jī)具有不同的硬件結(jié)構(gòu),同時也具有不同的總線形式,如PCI、PCI64、Compact PCI、PC104、ISA等。
#06 視覺處理軟件
機(jī)器視覺軟件用于完成輸入圖像數(shù)據(jù)的處理,然后通過一定的計算就可以得到需要的結(jié)果。通用機(jī)器視覺軟件以C/C++圖像庫、ActiveX控件和基于圖形的編程環(huán)境等形式出現(xiàn),可以專用,例如僅用于LCD檢測、BGA檢測、模板對齊等,或通用,包括定位、測量、條形碼/字符識別、斑點(diǎn)檢測等。
真相三:機(jī)器視覺市場發(fā)展迅速,汽車行業(yè)功不可沒
機(jī)器視覺在自動化方面的價值在于它能夠快速高效地捕獲和處理大量文檔、圖像和視頻,其數(shù)量和速度遠(yuǎn)遠(yuǎn)超過人類的能力。
廣闊的應(yīng)用前景和巨大的市場潛力決定了機(jī)器視覺必將是一個不斷增長的市場,Markets and Markets的數(shù)據(jù)表明,機(jī)器視覺的市場規(guī)模預(yù)計將從2020年的107億美元增長到2025年的147億美元,復(fù)合年增長率為6.5%。
根據(jù)grand view research的數(shù)據(jù),2021年,全球機(jī)器視覺市場規(guī)模為132.3億,預(yù)計2022年至2030年將以7.7%的復(fù)合年增長率(CAGR)增長。汽車、食品和飲料、制****和化工以及包裝領(lǐng)域?qū)σ曈X引導(dǎo)機(jī)器人系統(tǒng)的需求是推動市場增長的主要動力。其中,汽車行業(yè)依然是全球最大的機(jī)器視覺系統(tǒng)采用者,在2021年,來自汽車行業(yè)的收入份額超過了15.0%,預(yù)計未來幾年仍將繼續(xù)穩(wěn)步增長。
圖5:按照行業(yè)劃分,2020年--2030年美國機(jī)器視覺市場發(fā)展趨勢(圖源:grand view research)
真相四:機(jī)器視覺在機(jī)器人應(yīng)用中將大顯身手
在市場范圍和應(yīng)用方面,機(jī)器視覺有很多機(jī)會可以擴(kuò)展。這些機(jī)會需要一些想象力,這意味著機(jī)器視覺不僅僅是取代技術(shù)人員的眼睛,而是充分利用機(jī)器人完成技術(shù)人員無法完成的任務(wù)。機(jī)器視覺使得機(jī)器人擁有實時、高細(xì)節(jié)地“看到”的能力,它允許機(jī)器人根據(jù)對象或環(huán)境的綜合視圖做出決策。如今,機(jī)器人在世界上的使用越來越多。當(dāng)機(jī)器人配備機(jī)器視覺時,會給它們帶來更高的精確度、方向感和理解力,能夠更準(zhǔn)確地抓取物品,以更高的精度放置物品,并更快地執(zhí)行更復(fù)雜的任務(wù)。
機(jī)器視覺在機(jī)器人應(yīng)用中正變得越來越重要,根據(jù)自動化促進(jìn)協(xié)會(A3)最近的一份報告,與2020年相比,機(jī)器人和機(jī)器視覺市場在2021年第二季度取得了實質(zhì)性增長。工業(yè)機(jī)器人已經(jīng)被廣泛使用,隨著協(xié)作機(jī)器人的出現(xiàn)和3D機(jī)器視覺的快速發(fā)展,它們將被更多地結(jié)合使用。
機(jī)器視覺體現(xiàn)的是一種技術(shù)能力,自動化、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等其他能力也是如此。這是一種可以集成到其他技術(shù)和流程中的能力,用以造福行業(yè)并提高業(yè)務(wù)效率。現(xiàn)在的機(jī)器人已經(jīng)越來越多地內(nèi)置機(jī)器視覺,機(jī)器視覺使機(jī)器人能夠執(zhí)行更復(fù)雜的任務(wù)。如果沒有機(jī)器視覺告訴機(jī)器人物品的確切位置,這些任務(wù)是不可能完成的。機(jī)器視覺是釋放自動化全部潛力的關(guān)鍵,為智能自動化添加了更多智能。
來源:貿(mào)澤電子
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。