最新OpenVINO 2021發(fā)行版介紹
英特爾分發(fā)版OpenVINO 2021工具套件發(fā)布說明
OpenVINO工具套件介紹
英特爾分發(fā)版OpenVINO工具套件用于解決計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理以及推薦系統(tǒng)等應(yīng)用方案的快速部署?;谧钚碌娜斯ど窠?jīng)網(wǎng)絡(luò),包括卷積神經(jīng)網(wǎng)絡(luò)、序列神經(jīng)網(wǎng)絡(luò)和基于注意力機(jī)制的網(wǎng)絡(luò)等,該套件在跨英特爾硬件平臺(tái)上支持計(jì)算機(jī)視覺和非視覺負(fù)載,并支持從邊緣到云的高性能AI和深度學(xué)習(xí)推理。
下載地址 |
https://software.intel.com/content/www/cn/zh/develop/tools/openvino-toolkit/download.html?cid=other&source=eepw_web-res_ceds&campid=prc_q2_iotg_ov-da&content=web-reg_all
主要特性:
1. 支持從邊緣到云的深度學(xué)習(xí)推理。
2. 使用通用API,支持跨英特爾各類加速器的異構(gòu)執(zhí)行,包括英特爾CPU、英特爾集成圖形處理器、英特爾高斯和神經(jīng)網(wǎng)絡(luò)加速器、英特爾第二代神經(jīng)網(wǎng)絡(luò)計(jì)算棒和基于英特爾Movidius視覺處理單元的英特爾視覺加速器設(shè)計(jì)。
3. 通過易于使用的CV函數(shù)庫和預(yù)優(yōu)化的計(jì)算核心,加快上市時(shí)間。
4. 包含對(duì)標(biāo)準(zhǔn)CV的優(yōu)化調(diào)用,以及OpenCV和OpenCL。
第1版中的更新和更改
要點(diǎn)綜述
2020年10月推出的一個(gè)主要版本(2021版)。建議您升級(jí)到此版本,因?yàn)樗肓艘恍┬碌闹匾δ?,以及不兼容的更改?/span>
對(duì)TensorFlow 2.2.x的支持。正式支持在 TensorFlow 2.2.x 框架中訓(xùn)練的模型。
支持最新硬件。正式支持用于物聯(lián)網(wǎng)應(yīng)用的第11代英特爾酷睿處理器家族(之前代號(hào)為 Tiger Lake),可通過新的英特爾Iris Xe圖形處理器和英特爾 DL Boost 指令集獲得推理性能的增強(qiáng),以及通過第二代英特爾高斯和神經(jīng)網(wǎng)絡(luò)加速器獲得低功耗語音處理的加速。
不止是計(jì)算機(jī)視覺。針對(duì)計(jì)算機(jī)視覺之外的負(fù)載,比如音頻、語音、語言和推薦,通過OpenVINO工具套件也實(shí)現(xiàn)了端到端部署。為此提供了新的預(yù)訓(xùn)練模型、公開模型的支持、代碼示例和演示以及對(duì)非視覺DL Streamer的支持。
深度學(xué)習(xí)工作臺(tái)DL Workbench與Intel DevCloud for the Edge的集成(Beta版)將在2020年第4季度發(fā)布。開發(fā)人員現(xiàn)在可以使用圖形化的方式來分析模型。您可以通過Intel DevCloud for the Edge平臺(tái)上(而不是在本地開發(fā)機(jī)上)的深度學(xué)習(xí)工作臺(tái)DL Workbench對(duì)同一應(yīng)用方案的多種遠(yuǎn)程硬件配置進(jìn)行比較、可視化和性能微調(diào)等分析。
OpenVINO模型服務(wù)器。作為OpenVINO工具套件的一個(gè)附加組件,它是一個(gè)可擴(kuò)展的微服務(wù),提供了用于推理的gRPC或HTTP/REST端口,從而使在云服務(wù)器或邊緣服務(wù)器環(huán)境中部署模型變得更容易。它現(xiàn)在是用C++實(shí)現(xiàn)的,以減少容器資源占用(例如,小于500 MB),并提供更高的吞吐量和更低的延遲。
現(xiàn)在也支持Gitee和PyPI渠道下載。建議從適合您的分發(fā)方法中選擇并下載。
與2020.4版相比,不兼容的更改
棄用API列表和API更改。(見原英文版介紹)
自2020.3版本以來,IRv7已經(jīng)棄用,并且當(dāng)前版本也不再支持,建議遷移到最高版本IRv10。IRv10提供了流線型同時(shí)也是面向未來的操作集,兼容通用的框架,并且對(duì)量化模型的運(yùn)行提供更好的低精度表示,同時(shí)也支持可變形(reshape)的模型。
移除了Inference Engine NNBuilder API。
移除了一些Inference Engine公共API。(見原英文版介紹)
從2020.2版本開始,之前所有通過nGraph實(shí)現(xiàn)的功能都已經(jīng)合并到了OpenVINO工具套件。因此之前的ONNX RT Execution Provider for nGraph也已經(jīng)合并到了ONNX RT Execution Provider for OpenVINO,所以O(shè)NNX RT Execution Provider for nGraph 從2020年6月1日起就被棄用了并且會(huì)在2020年12月1日移除。建議遷移到ONNX RT Exectuion Provider for OpenVINO,它將作為所有英特爾硬件上AI推理的統(tǒng)一方案。
棄用或移除了一些nGraph公共API。(見原英文版介紹)
更新了nGraph公共API的結(jié)構(gòu)。
更新了系統(tǒng)需求。
為提高基于FPGA的深度學(xué)習(xí)方案的定制化水平,英特爾將轉(zhuǎn)移到下一代可編程深度學(xué)習(xí)方案。作為這個(gè)計(jì)劃的一部分,以后的非LTS標(biāo)準(zhǔn)發(fā)布將不再支持Intel Vision Accelerator Design with Intel Arria 10和Intel Programmable Acceleration Card with Intel Arria 10 GX FPGA。不過在LTS版本中還將繼續(xù)支持。關(guān)于下一代基于FGPA可編程深度學(xué)習(xí)方案的問題,可咨詢您的銷售代表或聯(lián)系我們。
模型優(yōu)化器
公共更改
實(shí)現(xiàn)了一些優(yōu)化轉(zhuǎn)換,將操作的子圖替換為HSwish、Mish、Swish和SoftPlus操作。
模型優(yōu)化器生成的IR中會(huì)默認(rèn)保持子圖的形狀計(jì)算。
使用推理引擎的可變形API修復(fù)了模型優(yōu)化器生成不能改變形狀的模型中間表示的轉(zhuǎn)換問題。
實(shí)現(xiàn)了原始網(wǎng)絡(luò)中不可變形模式的變換。
增加了TensorFlow 2.x的依賴信息。
用ScatterNDUpate 4替換了SparseToDense操作。
ONNX
增加了使用“–output”命令行參數(shù)指定模型輸出張量名稱的功能。
添加了對(duì)以下操作的支持:
o Acosh
o Asinh
o Atanh
o DepthToSpace-11, 13
o DequantizeLinear-10 (zero_point must be constant)
o HardSigmoid-1,6
o QuantizeLinear-10 (zero_point must be constant)
o ReduceL1-11, 13
o ReduceL2-11, 13
o Resize-11, 13 (except mode="nearest" with 5D+ input, mode="tf_crop_and_resize", and attributes exclude_outside and extrapolation_value with non-zero values)
o ScatterND-11, 13
o SpaceToDepth-11, 13
TensorFlow
添加了對(duì)以下操作的支持:
Acosh
Asinh
Atanh
CTCLoss
EuclideanNorm
ExtractImagePatches
FloorDiv
MXNet
添加了對(duì)以下操作的支持:
Acosh
Asinh
Atanh
Kaldi
修復(fù)了對(duì)ParallelComponent支持的Bug?,F(xiàn)在已經(jīng)完全支持了。
推理引擎
公共更改
遷移到了 Microsoft Studio C++(MSVC)2019 編譯器并將其作為 Windows 平臺(tái)的默認(rèn)選項(xiàng),這使得 OpenVINO 運(yùn)行時(shí)庫的二進(jìn)制大小減小了2.5倍。
將基于CPU的預(yù)處理操作(包含不同通道數(shù)圖片的大小調(diào)整、布局轉(zhuǎn)換和顏色空間轉(zhuǎn)換等)移植到AVX2和AVX512指令集。
推理引擎Python API
增加了nGraph Python API,提供了訪問nGraph Function的Python接口,方便對(duì)加載的網(wǎng)絡(luò)圖進(jìn)行分析。支持設(shè)置網(wǎng)絡(luò)圖的節(jié)點(diǎn)參數(shù)。
支持使用Python API直接讀取ONNX模型。
推理引擎C API
CPU插件
添加了對(duì)新操作的支持:
ScatterUpdate-3
ScatterElementsUpdate-3
ScatterNDUpdate-4
Interpolate-4
CTC-Loss-4
Mish-4
HSwish-4
GPU插件
支持面向物聯(lián)網(wǎng)應(yīng)用的第11代英特爾酷睿處理器家族(之前代號(hào)為Tiger Lake)。
支持 INT8 推理。這是英特爾DL Boost技術(shù)在英特爾集成圖形處理器上的優(yōu)化和應(yīng)用。
支持新操作:
o Mish
o Swish
o SoftPlus
o HSwish1234
MYRIAD 插件
增加了對(duì) ONNX下Faster R-CNN網(wǎng)絡(luò) 的支持,其具有固定的輸入形狀和動(dòng)態(tài)的輸出形狀。
增加了用于實(shí)現(xiàn)自定義 OpenCL 層的自動(dòng) DMA 的支持。
增加了對(duì)新操作的支持:
o Mish
o Swish
o SoftPlus
o Gelu
o StridedSlice
o I32 data type support in Div
提升了已有操作的性能:
o ROIAlign
o Broadcast
o GEMM
為myriad_compile添加了一個(gè)新選項(xiàng) VPU TILING_uCMX_ LIMIT_uKB,從而限制 DMA 傳輸大小。
提供了僅用于英特爾第二代神經(jīng)網(wǎng)絡(luò)計(jì)算棒中的SHAVE處理器的OpenCL編譯器。
HDDL 插件
支持用于自定義OpenCL層的自動(dòng)DMA。
與MYRIAD插件中相同的新增操作和優(yōu)化。
提供了僅用于Intel Vision Accelerator Design with Intel Movidius VPUs中的SHAVE處理器的OpenCL編譯器。
GNA插件
支持面向物聯(lián)網(wǎng)應(yīng)用的第11代英特爾酷睿處理器家族(之前代號(hào)為Tiger Lake)。增加了對(duì)多個(gè)新的網(wǎng)絡(luò)層以及層間融合的支持。
增加了從流中直接導(dǎo)入模型的支持。
在Windows上增加了對(duì)QoS機(jī)制的支持。在Python基準(zhǔn)測(cè)試程序中增加了對(duì)GNA特定參數(shù)的支持。
nGraph
引入opset4。這個(gè)新的操作集包含了以下操作。注意并不是所有的OpenVINO插件都支持這些操作。
o Acosh-4
o Asinh-4
o Atanh-4
o CTCLoss-4
o HSwish-4
o Interpolate-4
o LSTMCell-4
o Mish-4
o Proposal-4
o Range-4
o ReduceL1-4
o ReduceL2-4
o ScattenNDUpdate-4
o SoftPlus-4
o Swish-4
增加了nGraph Python API,提供了訪問nGraph Function的Python接口,方便對(duì)加載的網(wǎng)絡(luò)圖進(jìn)行分析。
重構(gòu)了nGraph轉(zhuǎn)換API,使得它的結(jié)構(gòu)更加透明并且使用起來更友好。
改變了nGraph文件夾的結(jié)構(gòu)。nGraph公共API從其它代碼中分離了出來,并且ONNX導(dǎo)入器也移到了前端文件夾。
神經(jīng)網(wǎng)絡(luò)壓縮框架(NNCF)
發(fā)布了1.4版本的NNCF,主要面向PyTorch框架。
支持導(dǎo)出剪枝后的模型到ONNX。
增加了基于FP16數(shù)據(jù)類型的量化微調(diào)。
增加了通用壓縮算法中初始化環(huán)節(jié)的批量歸一化適配。
提升了基本通道量化的訓(xùn)練性能。
增加了對(duì)Embedding和Conv1D權(quán)重的默認(rèn)量化。
訓(xùn)練后優(yōu)化工具(POT)
在精度敏感算法中增加了量化參數(shù)的自動(dòng)調(diào)整。
加速了Honest偏差糾正算法。相比于在2020.4版本中使用use_fast_bias=false的情況,平均量化時(shí)間縮短了4倍。
POT API產(chǎn)品化,并提供了如何使用此API的示例和文檔。
默認(rèn)量化策略對(duì)應(yīng)于兼容模式,需要在不同硬件上得到幾乎一致的準(zhǔn)確率。
覆蓋了44個(gè)新的模型。
深度學(xué)習(xí)工作臺(tái)
添加了對(duì)以下操作的支持:
- Acosh
- Asinh
- Atanh
- CTCLoss
- EuclideanNorm
- ExtractImagePatches
- FloorDiv
OpenCV
已將版本更新到4.5.0。
將上游許可證更改為 Apache 2。
在 OpenCV 應(yīng)用程序中添加了對(duì)多個(gè) OpenCL 上下文的支持。
Samples
更新了推理引擎C++示例演示如何直接加載ONNX模型。
Open Model Zoo
通過新增CNN預(yù)訓(xùn)練模型和重新生成中間表示(xml+bin)擴(kuò)展了Open Model Zoo:
o 替代了2020.4中的模型:
-face-detection-0200
-face-detection-0202
-face-detection-0204
-face-detection-0205
-face-detection-0206
-person-detection-0200
-person-detection-0201
-person-detection-0202
-person-reidentification-retail-0277
-person-reidentification-retail-0286
-person-reidentification-retail-0287
-person-reidentification-retail-0288
o 增加了新的模型:
-bert-large-uncased-whole-word-masking-squad-emb-0001
-bert-small-uncased-whole-word-masking-squad-0002
-formula-recognition-medium-scan-0001-im2latex-decoder
-formula-recognition-medium-scan-0001-im2latex-encoder
-horizontal-text-detection-0001
-machine-translation-nar-en-ru-0001
-machine-translation-nar-ru-en-0001
-person-attributes-recognition-crossroad-0234
-person-attributes-recognition-crossroad-0238
-person-vehicle-bike-detection-2000
-person-vehicle-bike-detection-2001
-person-vehicle-bike-detection-2002
-person-vehicle-bike-detection-crossroad-yolov3-1020
-vehicle-detection-0200
-vehicle-detection-0201
-vehicle-detection-0202
o 生命周期結(jié)束了的模型:
-face-detection-adas-binary-0001
-pedestrian-detection-adas-binary-0001
-vehicle-detection-adas-binary-0001
增加了新的演示程序:
o bert_question_answering_embedding_demo, Python
o formula_recognition_demo, Python
o machine_translation_demo, Python
o sound_classification_demo, Python
o speech_recognition_demo, Python
Open Model Zoo工具:
o 增加了模型下載速度。
o 在每個(gè)模型的文件夾下增加了精度檢查的配置文件。
o 簡化了精度檢查配置文件,不再需要給出模型IR的路徑、目標(biāo)硬件以及數(shù)據(jù)精度等配置信息。
o 通過推理引擎預(yù)處理API使得精度檢查工具支持優(yōu)化的預(yù)處理操作。
o 不需要將ONNX模型轉(zhuǎn)成IR格式就可以在精度檢查工具中進(jìn)行ONNX模型評(píng)估。
深度學(xué)習(xí)流管道分析器(DL Streamer)
通過增加對(duì)音頻分析的支持,擴(kuò)大了DL Streamer的使用范圍,不止限于視頻。增加了一個(gè)新的gvaaudiodetect元素用于音頻事件的檢測(cè)(AclNet模型)。在示例文件夾下增加了一個(gè)這個(gè)管道的示例。
增加了一個(gè)新的gvametaaggregate元素用于整合來自一個(gè)管道不同分支上的結(jié)果。這樣就可以支持創(chuàng)建復(fù)雜的管道,比如將一個(gè)管道分拆成多個(gè)分支進(jìn)行并行處理,然后整合結(jié)果。
實(shí)現(xiàn)了GPU內(nèi)存共享,即zero-copy,使得數(shù)據(jù)在VAAPI解碼、大小調(diào)整、CSC以及DL Streamer的各推理元素間可以更高效的共享,達(dá)到整體管道性能的提升。
在gvatrack和gvawatermark元素的輸入和輸出處增加GPU內(nèi)存,這樣在GPU進(jìn)行推理的時(shí)候,就可以不用調(diào)用gvaapipostproc元素顯示地將數(shù)據(jù)從GPU內(nèi)存轉(zhuǎn)移到CPU內(nèi)存。
[預(yù)覽]擴(kuò)展DL Streamer支持 Ubuntu 20.4。
更多信息請(qǐng)參考開源代碼庫。
OpenVINO模型服務(wù)器
模型服務(wù)器是一種可擴(kuò)展且高性能工具,用以提供經(jīng)OpenVINO工具套件優(yōu)化后的模型。它提供的基于gRPC或HTTP/REST端口的推理服務(wù),可以幫助您快速將模型產(chǎn)品化。
主要功能和提升:
o 提升了單服務(wù)器示例的擴(kuò)展性。通過新的C++實(shí)現(xiàn),您可以以線性擴(kuò)展的效果充分利用已有資源,避免前端的性能瓶頸。
o 降低客戶端和服務(wù)器之間的時(shí)延。
o 降低資源占用。通過切換到C++實(shí)現(xiàn)或減少依賴,Docker鏡像大小可以降低到450MB。
o 增加對(duì)線上模型進(jìn)行更新的支持。服務(wù)檢測(cè)器的配置文件可以根據(jù)需要而不需要重啟服務(wù)就可以更改或重新加載模型。
更多信息請(qǐng)參考開源代碼庫。
評(píng)論