新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 進(jìn)階指南 > OpenVINO?工具包英特爾預(yù)訓(xùn)模型概述

OpenVINO?工具包英特爾預(yù)訓(xùn)模型概述

作者: 時(shí)間:2021-06-17 來(lái)源:英特爾 收藏

  ?工具包提供了一組預(yù)先訓(xùn)練好的模型,您可以將其用于學(xué)習(xí)和演示目的,或者用于開(kāi)發(fā)深度學(xué)習(xí)軟件。

本文引用地址:http://m.butianyuan.cn/article/202106/426378.htm

  GitHub上的回購(gòu)中提供了最新版本。

  可以通過(guò)Model Downloader下載模型(<OPENVINO_INSTALL_DIR&gt>/deployment_tools/open_model_zoo/tools/downloader).

  提示:您還可以在?深度學(xué)習(xí)工作臺(tái)(DL工作臺(tái))中下載和配置英特爾?。DL Workbench是基于?構(gòu)建的平臺(tái),提供基于web的圖形環(huán)境,使您能夠在各種Intel?架構(gòu)配置下優(yōu)化、微調(diào)、分析、可視化和比較深度學(xué)習(xí)模型的性能。在DL工作臺(tái)中,您可以使用大多數(shù)OpenVINO?工具箱組件。

  從Docker開(kāi)始進(jìn)行一個(gè)簡(jiǎn)單的安裝。

目標(biāo)檢測(cè)模型

  幾個(gè)檢測(cè)模型可以用來(lái)檢測(cè)一組最受歡迎的對(duì)象——例如,人臉、人、車(chē)輛。大多數(shù)網(wǎng)絡(luò)都基于固態(tài)硬盤(pán),并提供合理的精度/性能權(quán)衡。檢測(cè)相同類(lèi)型對(duì)象的網(wǎng)絡(luò)(例如,face-detection-adas-0001和face-detection-retail-0004)以較慢的性能為代價(jià),提供更高精度/更廣泛適用性的選擇,因此您可以期望“更大”的網(wǎng)絡(luò)更好地檢測(cè)相同類(lèi)型的對(duì)象。

1623921849306589.jpg

1623921849506536.jpg

目標(biāo)識(shí)別模型

  目標(biāo)識(shí)別模型用于分類(lèi)、回歸和字符識(shí)別。在各自的檢測(cè)器之后使用這些網(wǎng)絡(luò)(例如,人臉檢測(cè)之后的年齡/性別識(shí)別)。

1623921910950348.jpg

再識(shí)別模型

  精確跟蹤視頻中的對(duì)象是計(jì)算機(jī)視覺(jué)的一個(gè)常見(jiàn)應(yīng)用(例如,用于人數(shù)統(tǒng)計(jì))。它通常被一系列事件復(fù)雜化,這些事件可以被描述為“相對(duì)長(zhǎng)時(shí)間沒(méi)有物體”。例如,它可以由遮擋或幀外移動(dòng)引起。在這種情況下,最好將對(duì)象識(shí)別為“以前見(jiàn)過(guò)”,而不管它在圖像中的當(dāng)前位置或自上次已知位置以來(lái)經(jīng)過(guò)的時(shí)間。

  以下網(wǎng)絡(luò)可用于此類(lèi)場(chǎng)景。他們拍攝一個(gè)人的圖像,并評(píng)估一個(gè)嵌入——在高維空間中表示這個(gè)人的外觀的向量。該向量可用于進(jìn)一步評(píng)估:對(duì)應(yīng)于同一個(gè)人的圖像將具有“接近”L2度量(歐幾里德距離)的嵌入向量。

  有多種模型可以在性能和準(zhǔn)確性之間進(jìn)行各種權(quán)衡(期望更大的模型性能更好)。

1623921945441982.jpg

語(yǔ)義分割模型

  語(yǔ)義分割是目標(biāo)檢測(cè)問(wèn)題的擴(kuò)展。

  語(yǔ)義分割模型不返回邊界框,而是返回輸入圖像的“繪制”版本,其中每個(gè)像素的“顏色”表示某個(gè)類(lèi)別。

  這些網(wǎng)絡(luò)比各自的目標(biāo)檢測(cè)網(wǎng)絡(luò)大得多,但它們提供了更好的(像素級(jí))目標(biāo)定位,并且它們可以檢測(cè)形狀復(fù)雜的區(qū)域(例如,道路上的空閑空間)。

1623921970504861.jpg

實(shí)例分割模型

  實(shí)例分割是目標(biāo)檢測(cè)和語(yǔ)義分割問(wèn)題的延伸。與預(yù)測(cè)每個(gè)對(duì)象實(shí)例周?chē)倪吔缈虿煌瑢?shí)例分割模型為所有實(shí)例輸出像素級(jí)掩碼。

1623922043411763.jpg

人體姿態(tài)估計(jì)模型

  人體姿態(tài)估計(jì)任務(wù)是為輸入圖像或視頻中的每個(gè)人預(yù)測(cè)一個(gè)姿態(tài):由關(guān)鍵點(diǎn)和關(guān)鍵點(diǎn)之間的聯(lián)系組成的人體骨架。重點(diǎn)是身體關(guān)節(jié),即耳朵,眼睛,鼻子,肩膀,膝蓋等。這種方法主要有兩類(lèi):自上而下和自下而上。首先檢測(cè)給定幀中的人、作物或重標(biāo)檢測(cè),然后運(yùn)行每次檢測(cè)的姿態(tài)估計(jì)網(wǎng)絡(luò)。這些方法非常精確。第二種方法查找給定幀中的所有關(guān)鍵點(diǎn),然后根據(jù)個(gè)人實(shí)例對(duì)它們進(jìn)行分組,因此比前一種方法更快,因?yàn)榫W(wǎng)絡(luò)只運(yùn)行一次。

1623922070808861.jpg

圖像處理

  深度學(xué)習(xí)模型在各種圖像處理任務(wù)中得到應(yīng)用,以提高輸出的質(zhì)量。

1623922082122011.jpg

文本檢測(cè)

  深度學(xué)習(xí)模型的文本檢測(cè)在各種應(yīng)用。

1623922178884245.jpg

文本識(shí)別

  深度學(xué)習(xí)模型在文本識(shí)別中的應(yīng)用。

1623922092782891.jpg

文本定位

  深度學(xué)習(xí)模型的文本定位(同時(shí)檢測(cè)和識(shí)別)。

1623922105966691.jpg

動(dòng)作識(shí)別模型

  動(dòng)作識(shí)別模型預(yù)測(cè)正在短視頻剪輯上執(zhí)行的動(dòng)作(通過(guò)堆疊來(lái)自輸入視頻的采樣幀形成的張量)。一些模型(例如driver-action-recognition-adas-0002可以使用從單個(gè)剪輯片段預(yù)先計(jì)算的高級(jí)空間或時(shí)空特征(嵌入),然后將它們聚合到一個(gè)時(shí)間模型中,以預(yù)測(cè)具有分類(lèi)評(píng)分的向量。計(jì)算嵌入的模型稱為編碼器,而預(yù)測(cè)實(shí)際標(biāo)簽的模型稱為解碼器。

1623922200309816.jpg

圖像檢索

  用于圖像檢索的深度學(xué)習(xí)模型(根據(jù)“圖庫(kù)”圖像與一些“探測(cè)”圖像的相似性對(duì)它們進(jìn)行排序)。

1623922212349797.jpg

壓縮模型

  深度學(xué)習(xí)壓縮模型

1623922225909340.jpg

問(wèn)答

1623922235289876.jpg

機(jī)器翻譯

1623922246774878.jpg

文本到語(yǔ)音轉(zhuǎn)換

  語(yǔ)音合成的深度學(xué)習(xí)模型(mel聲譜圖生成和波形生成)。

1623922246974069.jpg



評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉