《IDC Innovator:智能文檔處理(IDP),2022》正式發(fā)布
隨著數(shù)字化轉(zhuǎn)型的不斷推進(jìn),企業(yè)數(shù)據(jù)量呈現(xiàn)出爆炸式增長(zhǎng)。IDC Global DataSphere顯示,2021年,全球數(shù)據(jù)總量達(dá)到了84.5ZB,預(yù)計(jì)到2026年,全球結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)總量將達(dá)到221.2ZB。在快速增長(zhǎng)的數(shù)據(jù)中,由于格式復(fù)雜、標(biāo)準(zhǔn)多樣,非結(jié)構(gòu)化數(shù)據(jù)處理起來(lái)既困難又耗時(shí)。面對(duì)海量非結(jié)構(gòu)化數(shù)據(jù),如果沒(méi)有自動(dòng)化解決方案,人工手動(dòng)處理將面臨巨大挑戰(zhàn)。智能文檔處理可以把關(guān)鍵信息從半結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)中提取出來(lái),形成結(jié)構(gòu)化數(shù)據(jù),進(jìn)一步實(shí)現(xiàn)業(yè)務(wù)流程的端到端自動(dòng)化。
本文引用地址:http://m.butianyuan.cn/article/202301/442663.htmIDC定義的智能文檔處理(IDP),是指能夠從各種文檔格式中捕捉、提取和處理數(shù)據(jù),它利用自然語(yǔ)言處理 (NLP)、計(jì)算機(jī)視覺(jué)(CV)、深度學(xué)習(xí)(DL)和機(jī)器學(xué)習(xí) (ML) 等人工智能技術(shù),對(duì)相關(guān)信息進(jìn)行分類(lèi)、歸類(lèi)和提取,并對(duì)提取數(shù)據(jù)進(jìn)行驗(yàn)證。
本次研究IDC對(duì)眾多安全廠商和最終用戶進(jìn)行了深入訪談,發(fā)現(xiàn)最終用戶在其數(shù)據(jù)安全建設(shè)前或建設(shè)過(guò)程中普遍面臨數(shù)據(jù)安全建設(shè)無(wú)從入手、摸清家底難、分類(lèi)分級(jí)落地難、對(duì)于數(shù)據(jù)安全風(fēng)險(xiǎn)和建設(shè)成果的無(wú)感知以及缺乏專(zhuān)業(yè)的數(shù)據(jù)安全建設(shè)治理人才等問(wèn)題。
針對(duì)以上痛點(diǎn),IDC給出以下幾點(diǎn)建議供技術(shù)買(mǎi)家參考:
1.多模態(tài):能夠利用NLP/CV/OCR等多模態(tài)算法對(duì)全域非結(jié)構(gòu)化大數(shù)據(jù)進(jìn)行充分且統(tǒng)一的結(jié)構(gòu)化處理和精準(zhǔn)索引;
2.超大規(guī)模預(yù)訓(xùn)練:感知+決策完整智能化流水線閉環(huán),讓模型在專(zhuān)業(yè)領(lǐng)域擁有接近技能專(zhuān)家的性能表現(xiàn)及復(fù)雜工作場(chǎng)景的替代能力;
3.Auto Automation:將遷移學(xué)習(xí)和自動(dòng)機(jī)器學(xué)習(xí)應(yīng)用到智能文檔領(lǐng)域,大幅降低整體擁有成本和定制化效率,并提供跨組織、跨領(lǐng)域的規(guī)?;瘮U(kuò)展能力和持續(xù)學(xué)習(xí)迭代能力。
智能文檔處理技術(shù)的應(yīng)用價(jià)值主要在于:
1.構(gòu)建統(tǒng)一的面向全域非結(jié)構(gòu)化數(shù)據(jù)處理的基礎(chǔ)設(shè)施能力避免重復(fù)投資
2.可帶來(lái)直觀的生產(chǎn)力替代與人均產(chǎn)能提升,滿足降本增效剛需;
3.提升部分行業(yè)/業(yè)務(wù)/流程核心生產(chǎn)要素,實(shí)現(xiàn)重構(gòu)與智能化升級(jí)。目前在金融、政府和大型企業(yè)已獲得技術(shù)驗(yàn)證并處于業(yè)務(wù)需求爆發(fā)的早期階段,隨著與應(yīng)用和流程自動(dòng)化的深度整合,潛在的應(yīng)用場(chǎng)景廣泛普及空間較大。
本報(bào)告聚焦智能文檔處理領(lǐng)域,介紹目前在技術(shù)、商業(yè)模式等方面有一定創(chuàng)新性的中國(guó)公司。本報(bào)告提供了北京數(shù)據(jù)項(xiàng)素智能科技有限公司、來(lái)也科技(北京)有限公司、全面智能(廈門(mén))科技有限公司三家企業(yè)的研究概述(排名不分先后),體現(xiàn)了各廠商在智能文檔處理方面的差異化特征。
分析師觀點(diǎn)
IDC中國(guó)人工智能高級(jí)分析師程蔭表示,智能文檔處理(IDP)技術(shù)能夠更高效地將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),幫助企業(yè)解決數(shù)據(jù)方面的挑戰(zhàn),目前已處于業(yè)務(wù)需求爆發(fā)的早期階段,隨著與應(yīng)用和流程自動(dòng)化的深度整合,潛在的應(yīng)用場(chǎng)景將變得越來(lái)越普及,各個(gè)行業(yè)用戶應(yīng)當(dāng)積極關(guān)注。技術(shù)供應(yīng)商也應(yīng)升級(jí)多模態(tài)、超大規(guī)模預(yù)訓(xùn)練模型、圖神經(jīng)網(wǎng)絡(luò)、自動(dòng)化等方面的底層能力,給行業(yè)用戶帶來(lái)更具差異化的產(chǎn)品和服務(wù),幫助企業(yè)實(shí)現(xiàn)數(shù)據(jù)處理的效率提升和成本節(jié)約?!?/p>
評(píng)論