IEEE 2023 I 立體三角測量為什么在無人機(jī)距離估計(jì)中不起作用?(2)
本實(shí)驗(yàn)中,作者構(gòu)建了UAVDE數(shù)據(jù)集,該數(shù)據(jù)集旨在幫助研究無人機(jī)場景中的距離估計(jì)。數(shù)據(jù)集包含2815個訓(xùn)練樣本、541個驗(yàn)證樣本和539個評估樣本,分辨率為1280×720。每個樣本都有距離注釋以及左右圖像中的無人機(jī)邊界框注釋。作者使用驗(yàn)證子集來進(jìn)行超參數(shù)和模型選擇。為了評估距離估計(jì)的性能,作者采用了兩個常用的評估指標(biāo):AbsRel和SqRel。其中,AbsRel表示絕對相對誤差,SqRel表示平方相對誤差。這些評估指標(biāo)可以通過計(jì)算距離估計(jì)值與真實(shí)距離之間的差異來評估算法的準(zhǔn)確性。
5.2. 實(shí)驗(yàn)細(xì)節(jié)在本實(shí)現(xiàn)中,作者選擇了YOLOX-Nano作為無人機(jī)檢測器,因?yàn)樗谛阅芎陀?jì)算效率之間達(dá)到了良好的平衡。作者先在UAVDE數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,然后固定檢測器,用于生成訓(xùn)練所需的位置矯正機(jī)制。為了實(shí)現(xiàn)位置矯正機(jī)制和門控模塊,作者采用了相同的多層感知器MLP-Mixer。通過利用MLP-Mixer的混合機(jī)制,作者可以捕捉生成的位置矯正機(jī)制中的內(nèi)部關(guān)系,并預(yù)測位置偏移。為了提高計(jì)算效率,作者將原始的8層MLP-Mixer變體減少到2層,并避免了過擬合問題。在訓(xùn)練過程中,采用SGD優(yōu)化器,并配合梯度裁剪、余弦學(xué)習(xí)率調(diào)度和線性預(yù)熱等策略。通過在驗(yàn)證子集上進(jìn)行驗(yàn)證,確定了閾值T和λ的取值,使得在困難樣本上能夠獲得明顯的改進(jìn)。
5.3. 性能比較在本實(shí)驗(yàn)中,為了展示作者提出的方法的優(yōu)越性,作者與兩種經(jīng)典方法進(jìn)行了比較。根據(jù)比較結(jié)果,作者觀察到經(jīng)典方法在無人機(jī)場景中表現(xiàn)不佳,受到位置偏移和環(huán)境干擾的影響。相比之下,基線方法展現(xiàn)出更好的性能,但仍然受到位置偏移問題的困擾。注釋的邊界框在性能上只有輕微的改善,無法解決位置偏移問題。與其他方法相比,作者的方法能夠通過補(bǔ)償位置偏移帶來顯著的性能提升,達(dá)到38.84%的改進(jìn)效果,這證明了作者方法的優(yōu)越性和有效性。
5.4. 消融實(shí)驗(yàn)本文通過進(jìn)行消融實(shí)驗(yàn)來驗(yàn)證作者提出的方法的有效性。實(shí)驗(yàn)結(jié)果表明,通過引入PCM組件可以顯著改善距離估計(jì)精度,特別是解決位置偏差問題。同時,DIC組件在對困難樣本進(jìn)行多次修正后,可以進(jìn)一步提升性能。對于修正階段數(shù)量的選擇,進(jìn)行兩次修正可以帶來明顯的改進(jìn),進(jìn)一步的修正效果不明顯。閾值T的選擇不同范圍對方法的改進(jìn)均有一定影響,表明方法對T值的選擇具有魯棒性。此外,通過資源消耗分析,作者發(fā)現(xiàn)我們提出的PCM和門控模塊在計(jì)算成本上幾乎可以忽略不計(jì),有助于輕量級設(shè)計(jì)。針對困難樣本,作者提出的DIC機(jī)制可以進(jìn)一步改善估計(jì)性能,特別是對于距離較遠(yuǎn)的樣本。最后,通過可視化分析,作者展示了我們的方法在易樣本和難樣本上的修正效果,證明了其有效性。
6 總結(jié)在本文中,作者專注于無人機(jī)距離估計(jì)問題,這在實(shí)際中非常重要但卻很少被研究。為了幫助研究,作者建立了一個新穎的無人機(jī)距離估計(jì)數(shù)據(jù)集,令人驚訝的是作者發(fā)現(xiàn)常用的立體三角化范式在無人機(jī)場景中不起作用。主要原因是圖像畸變現(xiàn)象和立體三角化中的內(nèi)部幾何模糊導(dǎo)致的位置偏移問題,在無人機(jī)場景中很常見。為了解決這個問題,作者提出了一個新穎的位置校正模塊(PCM),來明確預(yù)測圖像和目標(biāo)無人機(jī)實(shí)際位置之間的偏移量。此外,作者設(shè)計(jì)了一個動態(tài)迭代校正(DIC)機(jī)制,進(jìn)一步改善對難樣本的校正效果。大量實(shí)驗(yàn)證實(shí)了作者方法的有效性和優(yōu)越性。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。