SAX PULL DOCUMENT解析XML總結(jié)
一、SAX解析
本文引用地址:http://m.butianyuan.cn/article/201609/303742.htm1、繼承DefaultHandler類,重寫(xiě)startDocument、startElement、character、endElement、endDocument方法,startDocument在讀取時(shí)調(diào)用,可寫(xiě)一些實(shí)例化列表等;startElement在讀取每個(gè)標(biāo)簽時(shí)調(diào)用,通過(guò)判斷歷史標(biāo)簽需要是否為需要獲取的值的頭;characters用來(lái)讀取標(biāo)簽中的值;endElement讀取標(biāo)簽的結(jié)束,用來(lái)保存characters獲取的值;endDocument一般不做處理。
2、調(diào)用,用SAXParser或者XMLReader來(lái)解析
SAXParser解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService(); SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParse = spf.newSAXParser(); saxParse.parse(input, saxForHandler); ListMapString, Object>> userList = saxForHandler.getUser(); |
XMLReader解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService();
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParse = spf.newSAXParser();
// 為xmlReader設(shè)置內(nèi)容處理器
XMLReader reader = saxParse.getXMLReader();
reader.setContentHandler(saxForHandler);
// 開(kāi)始賦值
reader.parse(new InputSource(new StringReader(xml)));
List> userList = saxForHandler.getUser();
在解析時(shí),一定要小心,不要忽略空白的地方,Sax解析器會(huì)把它認(rèn)為是一個(gè)TextNod
二、PULL解析
與SAX類似,同樣有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT
1、實(shí)例化XmlPullParser解析器,設(shè)置輸入編碼(setInput),獲得事件類型(getEventType),用SAX相同的處理進(jìn)行,next()方法往下繼續(xù)讀取
三、DOCUMENT解析
1、實(shí)例化DocumentBuilderFactory,代碼如下:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(input);
Element root = document.getDocumentElement();
2、跟xml傳入的數(shù)據(jù)結(jié)構(gòu)進(jìn)行處理
3、返回需要的列表值即可
工程下載:ParseTest.rar
四、三者區(qū)別
DOM:
解析器讀入整個(gè)文檔,然后構(gòu)建一個(gè)駐留內(nèi)存的樹(shù)結(jié)構(gòu),然后代碼就可以使用 DOM 接口來(lái)操作這個(gè)樹(shù)結(jié)構(gòu)。
優(yōu)點(diǎn):整個(gè)文檔樹(shù)在內(nèi)存中,便于操作;支持刪除、修改、重新排列等多種功能;
缺點(diǎn):將整個(gè)文檔調(diào)入內(nèi)存(包括無(wú)用的節(jié)點(diǎn)),浪費(fèi)時(shí)間和空間;
使用場(chǎng)合:一旦解析了文檔還需多次訪問(wèn)這些數(shù)據(jù);硬件資源充足(內(nèi)存、CPU)
SAX/PULL:
事件驅(qū)動(dòng)。當(dāng)解析器發(fā)現(xiàn)元素開(kāi)始、元素結(jié)束、文本、文檔的開(kāi)始或結(jié)束等時(shí),發(fā)送事件,程序員編寫(xiě)響應(yīng)這些事件的代碼,保存數(shù)據(jù)。
優(yōu)點(diǎn):不用事先調(diào)入整個(gè)文檔,占用資源少
缺點(diǎn):不是持久的;事件過(guò)后,若沒(méi)保存數(shù)據(jù),那么數(shù)據(jù)就丟了;無(wú)狀態(tài)性;從事件中只能得到文本,但不知該文本屬于哪個(gè)元素;
使用場(chǎng)合:只需XML文檔的少量?jī)?nèi)容,很少回頭訪問(wèn);一次性讀取;機(jī)器內(nèi)存少;
注意:SAX 解析器不創(chuàng)建任何對(duì)象。
評(píng)論