新聞中心

EEPW首頁 > 智能計算 > 設計應用 > 基于機器學習農(nóng)田驅(qū)鳥系統(tǒng)設計與實現(xiàn)*

基于機器學習農(nóng)田驅(qū)鳥系統(tǒng)設計與實現(xiàn)*

作者:徐 溢,錢 成,王澤海,鄭 英 (東南大學成賢學院,南京 211800) 時間:2021-04-27 來源:電子產(chǎn)品世界 收藏
編者按:糧食經(jīng)常因為各類鳥類的啄食而丟失,研究發(fā)現(xiàn)鳥眼對532 nm的綠色激光束最敏感,通過綠色激光束可以達到驅(qū)鳥效果。本課題通過3D打印機械模型,利用嵌入式系統(tǒng)完成鳥類識別算法,通過機器學習的方式識別鳥類,用雙自由度舵機控制系統(tǒng)驅(qū)趕鳥類。精準的激光束定位“打擊”,很好實現(xiàn)了驅(qū)鳥的任務。

*本論文基于江蘇省大學生創(chuàng)新實踐項目scx1901 《一個通過卷積神經(jīng)網(wǎng)絡進行鳥類識別的農(nóng)田系統(tǒng)》。

本文引用地址:http://m.butianyuan.cn/article/202104/424913.htm

1   課題介紹

1.1 題目來源

據(jù)可考數(shù)據(jù),每年農(nóng)田里已經(jīng)成熟的農(nóng)作物差不多會有25% 被鳥兒偷偷地啄食。經(jīng)過鳥類學家無數(shù)試驗證明,鳥眼對最敏感[1],掃射過來時,鳥類猶如看到一根綠色大棒,可以達到效果,并且國內(nèi)外并沒有針對農(nóng)田成熟的方案。

1.2 應用背景

目前市面上已存在一些具有相同功能的產(chǎn)品,大多都使用紅外傳感器、微波運動傳感器來探測是否有鳥飛入,其均能實現(xiàn)探測是否有鳥類存在的效果,但是都具有以下缺點:探測范圍小,多數(shù)產(chǎn)品探測半徑小于 10 m,只有少數(shù)能達到 20~30 m;探測目標不明確,僅能夠探測是否有溫度較高的運動物體靠近,無法判斷靠近的物體是鳥類還是人類。而通過的算法使用攝像頭識別鳥類的方法即可以完美克服這些缺點。

2   平臺選擇

2.1 嵌入式平臺選擇

2.1.1 NVIDIA Jetson Nano

NVIDIA Jetson Nano 是NVIDIA 為新一代自主機器設計的嵌入式系統(tǒng),是一個低成本的AI 計算機,具備的性能和能效可以運行現(xiàn)代 AI 工作負載,并行運行多個神經(jīng)網(wǎng)絡,以及同時處理來自多個高清傳感器的數(shù)據(jù),開發(fā)板價格在600~700 元之間。

2.1.2 勘智K210

勘智K210 采用RISC-V出庫器架構(gòu),具備試聽一體,自主IP 核與可編程能力強三大特點,支持機器視覺與聽覺的多模態(tài)識別,可廣泛應用于智能家居、智能園區(qū)、智能能耗和智能農(nóng)業(yè)等場景,價格相對較低,開發(fā)板價格在70~150 元之間。

2.1.3 Rockchip RK3399 SoC

RK3399 是瑞芯微推出的一款低功耗、高性能的應用處理器芯片,該芯片基于big.LITTLE 架構(gòu),即具有獨立的NEON 協(xié)同處理器的雙核Cortex-A72 及四核Cortex-A53 組合架構(gòu),主要應用于計算機、個人互聯(lián)網(wǎng)移動設備、VR、廣告機等智能終端設備。RK3399 內(nèi)置多個高性能硬件處理引擎,能夠支持多種格式的視頻解碼,如:4K×2K@60 fps 的H.264/H.265/VP9,也支持1 080 P@30 fps 的H.264/MVC/VP8 以及高質(zhì)量的JPEG編解碼和圖像的前后處理器。芯片價格昂貴,開發(fā)板價格在900~1 000 元之間。

綜合考究,我們決定在初步搭建中選擇成本較低的K210 作為開發(fā)平臺,如果后期想要增加探測半徑,可以使用價格相對昂貴,性能更加強悍,可以驅(qū)動更優(yōu)秀攝像頭的嵌入式系統(tǒng)。

2.2 模型選擇

2.2.1 官方模型

使用官方已經(jīng)訓練好的20class.kfpkg 下載進K210的kflash 來檢測檢測鳥類,因為是識別20 種物體的檢測模型,經(jīng)常出現(xiàn)誤判,識別不及時等現(xiàn)象。

2.2.2 自己訓練的鳥類模型

自己在網(wǎng)上下載包含20 978 個鳥類的15 698 張照片作為訓練集,使用yolo 算法進行訓練,再轉(zhuǎn)化成可以下載進K210 的kflash 的Kmodel 文件,解決了誤判,識別不及時等問題。

顯而易見,我們選擇了自己訓練的BIRD.kmodel 作為我們鳥類模型的選擇。

3   采用方案

3.1 研究方案

第1 步: 由于使用Haar、SSD、YOLO、R-CNN等算法均能通過鳥類本身的形狀對鳥類進行識別,算法的開發(fā)流程[2-3]:

1) 收集一組正樣本(鳥類圖片)和負樣本(非鳥類的圖片)作為訓練集;

2) 選擇一個合適的算法(可根據(jù)實際應用進行一定的修改);

3) 把訓練集作為樣本,去訓練模型,并評估模型性能,不斷優(yōu)化;

4) 當模型的性能能夠滿足一定要求后,部署模型。最后形成的算法模型即可以用來進行鳥類識別。

第2 步:通過算法給出鳥類的坐標,利用雙舵機系統(tǒng)驅(qū)動激光器進行全方位立體的精確“打擊”。

3.2 系統(tǒng)架構(gòu)

該嵌入式系統(tǒng)的主處理器是K210,該處理器與用于捕獲圖像的相機、雙舵機控制電路、步進電機驅(qū)動電路連接。它還連接到顯示屏之類的外圍設備,以方便用戶觀看設備狀態(tài),圖1 是驅(qū)鳥系統(tǒng)總體架構(gòu)。圖2 是驅(qū)鳥系統(tǒng)成品圖。

image.png

圖1 驅(qū)鳥系統(tǒng)圖

image.png

圖2 驅(qū)鳥系統(tǒng)成品圖

3.3 硬件平臺設計

3.3.1 雙自由度云臺舵機驅(qū)動電路

舵機控制精度對于本系統(tǒng)的關(guān)鍵部件,舵機的輸出準確性直接關(guān)系到本系統(tǒng)是否可以完成預定動作指令,因此我們設計了這一塊雙自由度云臺舵機驅(qū)動電路板。硬件電路設計在軟件上完成,包括電路原理圖的繪制和印刷電路板文件的制作,電子元器件選型和焊接由人工完成。

該模塊( 如圖3) 具有以下的電氣參數(shù):輸入電壓:3.6~23 V;輸出電壓:0.8 V~VIN;輸出最大電流:5 A。

1619504156994428.png

圖3 舵機驅(qū)動電路電路原理圖

3.3.2 步進電機驅(qū)動電路

A4988 是一款帶轉(zhuǎn)換器和過流保護的DMOS 微步驅(qū)動器( 如圖4), 可在全、半、1/4、1/8 及1/16 步進模式時操作雙極步進電動機,輸出驅(qū)動性能可達35±2 V,A4988 包括一個固定關(guān)斷時間電流穩(wěn)壓器,該穩(wěn)壓器可在慢或混合衰減模式下工作。轉(zhuǎn)換器是A4988 易于實施的關(guān)鍵。只要在“步進”輸入中輸入一個脈沖,即可驅(qū)動電動機產(chǎn)生微步。無須進行相位順序表、高頻率控制行或復雜的界面編程。該模塊具有以下的電氣參數(shù):工作電壓:8~35 V;連續(xù)電流:1 A;最大電流:2 A。

image.png

圖4 A4988模塊

3.3.3 激光模組

選擇了符合輸出 波長,達到驅(qū)鳥目的的綠色激光器,使用綠光TTL 調(diào)制(如圖5)。該模塊具有以下的電氣參數(shù):波長:;輸出功率:30 mW;工作電壓:2.7~5.0 V;工作電流:<280 mA。



image.png

圖5 激光模組

3.4 機械結(jié)構(gòu)

3.4.1 升降機

部分機械結(jié)構(gòu)設計在SolidWorks 軟件上完成,包括零部件設計和整體運動仿真,零部件選型和裝配由人工完成,機械結(jié)構(gòu)制作由3D 打印完成(如圖6、圖7)。

image.png

圖6 機械建模


image.png

圖7 3D打印實物

3.4.2 自由度云臺

使用由多功能支架、長U 型支架、平面軸承和鋁板組成的2 自由度云臺,如圖9。

image.png

圖9 自由度云臺

3.5 軟件設計

3.5.1 模型訓練

在計算機上創(chuàng)建虛擬環(huán)境,并安裝必要軟件包與庫。將互聯(lián)網(wǎng)上下載的包含20 978 個鳥類的15 698 張照片作為訓練集,使用labelImg 進行注釋,再通過yolo 算法進行訓練獲得.tfile 文件,通過ncc_0.1_win 將.tfile文件轉(zhuǎn)為可以燒錄進K210 flash 的.kmodel 文件[4]。

3.5.2 模型部署

在K210 上移植最新的可以運行micropython 的MaixPy-0.5.0,然后將訓練好的.kmodel 模型燒錄進K210,再使用K210 通過雙自由度云臺舵機驅(qū)動電路控制舵機,使用識別到鳥類獲得的坐標與捕獲到圖像中點進行誤差分析,通過PID 算法控制激光模塊一直鎖定鳥類(如圖10)。

image.png

圖10 程序設計框圖

4   實驗評估

4.1 仿真測試

使用鳥模型對系統(tǒng)的瞄準精確度進行多次實驗,發(fā)現(xiàn)在10 m內(nèi)系統(tǒng)的瞄準精度非常高,識別速度非??欤す饷闇蔬\動鳥類十分平滑,每秒幀率達到10 幀以上。

4.2 進步空間

當前系統(tǒng)使用QVGA 的圖像,分辨率非常的低,如果使用性能更加優(yōu)秀的類似于NVIDIA Jetson Nano的嵌入式平臺,并且提升下分辨率,再修改下PID 參數(shù),這套方案完全可以解決半徑50 m 以上的驅(qū)鳥任務,

5   結(jié)論

為了解決農(nóng)田驅(qū)鳥這一問題,參考了鳥眼對532 nm的敏感這一研究結(jié)果,設計出了一套既可以低成本又可以高成本的解決方案,將來使用這一方案的農(nóng)田驅(qū)鳥系統(tǒng)一定會在驅(qū)鳥領域占有一席之地。

參考文獻:

[1] 于建友.一種基于532nm激光技術(shù)的智能驅(qū)鳥方法:中國,CN201510832622.5[P].2017-6-6,

[2] HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J]. Neural Comput., 2006(18):1527-1554.

[ 3 ] 周志華. 機器學習: = M a c h i n elearning[M].北京:清華大學出版社,2016.

[4] JOSEPH R,FARHADI A.YOLOv3: An incremental improvement [ Z ] . p r e p r i n t ,arXiv:1804.02767.

(本文來源于《電子產(chǎn)品世界》雜志2021年3月期)



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉