基于XML和本體的物聯(lián)網(wǎng)數(shù)據(jù)交換標準體系研究
摘要:針對當前物聯(lián)網(wǎng)應用層中相關數(shù)據(jù)交換標準紛繁復雜,相關標準主體各行其是的問題,從XML(可擴展標記語言)和本體的角度出發(fā),從互聯(lián)網(wǎng)、語義網(wǎng)和物聯(lián)網(wǎng)的關系入手,提出了建立物聯(lián)網(wǎng)數(shù)據(jù)交換標準體系的思路,即標準應以XML為語法格式,以標準化的本體為語義共識;標準體系應以頂級本體為基礎,以縱向的領域本體和橫向的任務本體為支撐,建立起各種不同的應用本體標準。文章最后通過一個應用實例分析了所述標準體系發(fā)展的若干關鍵要點。
本文引用地址:http://m.butianyuan.cn/article/160572.htm關鍵詞:物聯(lián)網(wǎng);數(shù)據(jù)交換標準;可擴展標記語言;標準本體
0 引言
2009年被稱為中國的物聯(lián)網(wǎng)元年,這一年,溫家寶總理在無錫視察時提出了“感知中國”戰(zhàn)略。2010年的“兩會”期間,物聯(lián)網(wǎng)首次被寫入政府工作報告中,被確定為國家要大力發(fā)展的戰(zhàn)略性新興產(chǎn)業(yè)。近年來,從中央到地方、從政府到企業(yè),一餳物聯(lián)網(wǎng)建設的熱潮正在如火如荼地展開。然而,當前物聯(lián)網(wǎng)的發(fā)展仍處于初級階段,還面臨著傳感器技術(shù)不成熟、缺乏商業(yè)應用模式、信息安全和隱私等諸多問題與挑戰(zhàn),其中制約物聯(lián)網(wǎng)發(fā)展的最大瓶頸,則是缺乏統(tǒng)一的技術(shù)標準,尤其是數(shù)據(jù)表達、交換和處理標準。因為傳感器關鍵技術(shù)的突破、商業(yè)應用模式的推廣等等,都只是物聯(lián)網(wǎng)中“物”的問題,而數(shù)據(jù)交換標準則涉及物聯(lián)網(wǎng)中“聯(lián)”的問題。如果不能實現(xiàn)物與物之間暢通無阻的信息交換,就不能稱之為真正的物聯(lián)網(wǎng)。
1 物聯(lián)網(wǎng)數(shù)據(jù)交換標準現(xiàn)狀
物聯(lián)網(wǎng)系統(tǒng)主要分為三個層面:感知層、傳輸層和應用層。感知層主要是對物體進行識別或數(shù)據(jù)采集;傳輸層是通過現(xiàn)有的通信網(wǎng)絡將信息進行可靠傳輸;應用層則是對采集的數(shù)據(jù)進行智能處理或展示。在這三層體系中,感知層中基于物理、化學、生物等技術(shù)發(fā)明的傳感器“標準”多已成為專利。而傳輸層的各種通信標準也已基本成熟,建立新的物聯(lián)網(wǎng)通信標準難度較大,可行性較小。因此,物聯(lián)網(wǎng)標準的關鍵和亟待統(tǒng)一的是關于應用層的標準,而其中尤以數(shù)據(jù)表達、交換和處理標準為核心。
目前,針對物聯(lián)網(wǎng)應用層的數(shù)據(jù)交換標準主要有PML、EDDL、M2MXML、NGTP等。其中,PML是實體標注語言,它是EPC(產(chǎn)品電碼)物聯(lián)網(wǎng)中交換信息的共同語言,用來描述人及機器都可以使用的自然物體的描述標準。EDDL是電子設備描述語言,它可以描述現(xiàn)場設備中的數(shù)據(jù),以用于工程、調(diào)試、監(jiān)視運行和診斷。M2MXML是一種用于終端設備間的通信協(xié)議,它包含一個用于分析協(xié)議的、與語義無關的JavaAPI。NGTP是寶馬公司推出的開放式Telematics協(xié)議架構(gòu)平臺,它使用統(tǒng)一、開放的接口來區(qū)分Telematics服務供應鏈的各個環(huán)節(jié)。此外,還有智能建筑領域的OB1X標準、公共安全與應急領域的CAP標準以及PCM(脈碼調(diào)制)遙測技術(shù)的IRIG標準等。
可以看出,現(xiàn)有的物聯(lián)網(wǎng)應用層的數(shù)據(jù)交換標準大多是針對某一特定領域或行業(yè)業(yè)務提出的,有一定的局限性,所以當前物聯(lián)網(wǎng)缺少的是一個統(tǒng)一的物聯(lián)網(wǎng)數(shù)據(jù)交換大集成應用標準(或標準體系)。歐盟有關機構(gòu)正在進行數(shù)據(jù)交換標準“融合”的研究,目標是綜合考慮相關領域已有的基于XML的數(shù)據(jù)交換標準,以便為那些在不同的標準中語義上具有等價性的數(shù)據(jù)元素(盡管他們可能有不同的名字)提供全球唯一的交叉引用方式和標識結(jié)構(gòu),從而提煉出一個基礎的元數(shù)據(jù)標準,把這個標準作為物聯(lián)網(wǎng)數(shù)據(jù)交換的核心,那么,對于不同的行業(yè)應用,就可以基于元數(shù)據(jù)擴展出相應的行業(yè)數(shù)據(jù)交換標準。
總體來說,物聯(lián)網(wǎng)的標準化工作已經(jīng)得到了業(yè)界的普遍重視,但對于應用層的標準化工作來說,還需要客觀分析物聯(lián)網(wǎng)標準的整體需求,從國際標準、國家標準、行業(yè)標準、地區(qū)標準等多個層次進行統(tǒng)籌設計;其次,還需要協(xié)調(diào)各個標準的推進策略,優(yōu)化資源配置。
2 物聯(lián)網(wǎng)數(shù)據(jù)交換標準體系的構(gòu)建
2.1 構(gòu)建物聯(lián)網(wǎng)數(shù)據(jù)交換標準體系的基石
XML技術(shù)是為了克服HTML在互聯(lián)網(wǎng)信息交換和表示方面的缺陷而設計的,本體論最初也是起源于哲學領域,隨后在研究人工智能時被引入計算機領域。雖然兩者的出現(xiàn)都不是為了解決物聯(lián)網(wǎng)領域的數(shù)據(jù)交換標準問題,但它們卻為這一問題的解決提供了必要的理論基礎和技術(shù)手段。
2.1.1 物聯(lián)網(wǎng)數(shù)據(jù)交換標準的語法基礎——XML
XML(eXtensible Markup Language,可擴展標記語言)是W3C組織于1998年推出的一種用于數(shù)據(jù)描述的元標記語言標準。作為SGML(Stan dard Generalized Markup Language,標準通用標識語言)的一個簡化子集,它結(jié)合了SGML豐富的功能和HTML的簡單易用,同時具有可擴展性、自描述性、開放性、互操作性、可支持多國語言等特點,因而得到了廣泛地支持與應用。
對于作為物聯(lián)網(wǎng)數(shù)據(jù)交換標準的格式來說,XML具有以下顯著優(yōu)點:
(1)可定義行業(yè)或領域標記語言
XML可以用DTD或者Schema來定義,一份遵循DTD或者Schema定義的XML文檔才是有效的。因此,XML可以針對不同的應用建立相關的標準語言,如化學標記語言(CML)、數(shù)學標記語言(MathML)、語音標識語言(VoiceXML)等,包括目前物聯(lián)網(wǎng)中很多已經(jīng)存在的標準都是基于XML定義的。
(2)具有結(jié)構(gòu)化的通用數(shù)據(jù)格式
XML使用樹形目錄結(jié)構(gòu)形式,可以自行定義文字標簽并指定元素間的關系,同時它也是W3C公開的一種數(shù)據(jù)格式,沒有版權(quán)的使用限制,因而十分適合作為小同應用程序之間的信息交換格式。
(3)可提供整套方案
XML擁有一整套技術(shù)體系,如可擴展樣式表語言XSL、數(shù)據(jù)查詢技術(shù)xQuery、文檔對象模型DOM等等。
2.1.2 物聯(lián)網(wǎng)數(shù)據(jù)交換標準的語義基礎——本體
本體(Ontology)起源于哲學,被Neches等人引入計算機科學領域后,在人工智能、語義Web、軟件工程、圖書館學以及信息架構(gòu)等領域得到了廣泛應用。關于本體最流行的定義是Gruber在1993年給出的,即“本體是概念模型的明確的規(guī)范說明”。Studer在對前人的定義進行概括后提出:本體的概念包括四個方面:
(1)概念模型:它是客觀世界現(xiàn)象的抽象模型,其表示的含義獨立于具體的環(huán)境狀態(tài);
(2)明確:所使用的概念及使用這些概念的約束都有明確的定義;
(3)形式化:本體的表示是形式化的,可以被計算機處理;
(4)共享:本體中體現(xiàn)的是共同認可的知識,反映的是相關領域中公認的概念集,它所針對的是團體而不是個體。
本體的目標是獲取相關的領域知識,提供對該領域知識的共同理解,確定該領域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯間相互關系的明確定義。所以,本體是具有小同知識表示的Web應用系統(tǒng)之間進行數(shù)據(jù)或知識交換共享的基礎結(jié)構(gòu)。通過定義共享和公共的領域知識,本體可幫助機器之間或機器與人之間更加精確地交流,實現(xiàn)相互之間的語義交換,而不只是語法級的交互。
按照領域依賴程度,Guarino將本體劃分為四類:第一類是頂級本體,用于描述通用的概念和概念之間的關系,如時間、空間、物質(zhì)、對象、事件、動作等,頂級本體獨立于特定的問題和領域,與具體的應用無關;第二類是領域本體,用于描述特殊領域(如教育或金融)中的概念,即陳述性知識;第三類是任務本體,用于描述特定任務或活動(如入學或取款)中的概念,即過程性知識;第四類是應用本體,應用本體可通過進一步特殊化領域本體和任務本體,將其用于描述既依賴于特定領域,又依賴于特定任務的概念,這些概念通常對應于領域個體執(zhí)行特定活動時所扮演的角色(如學生入學或客戶取款)。
2.2 構(gòu)建物聯(lián)網(wǎng)數(shù)據(jù)交換標準體系的思路
顧名思義,物聯(lián)網(wǎng)就是物與物相連的網(wǎng)絡,要想實現(xiàn)物與物之間暢通無阻的“交流”,就需要在語法上相同,在語義上互通。通俗的說,就是用相同的格式表達同一個意思。
XML在語法上的結(jié)構(gòu)化信息表達能力和本體在語義上的透明性之間的優(yōu)勢互補為物聯(lián)網(wǎng)數(shù)據(jù)交換標準的建立提供了很好的解決思路。
評論