发新帖回复

javaee

普通会员

225648 帖子	334 回复	348 积分

[技术汇总] Jsp 复习材料一： XML解析

楼主

发表于 2019-11-18 08:53:59 | 查看: 1331 | 回复: 0

1.规范：

所有的XML文件都应该有结束标签便签大小写有区别，并且前后要一致规定XML只有一个根节点元素属性值必须加引号，可通过节点加getAttributes()。获得属性对象特殊字符需要转义解析时空格和回车换行会被保留

2.XML和HTML的差异

XML是对HTML的补充，即对数据进行存储和传输，可自行定义标签，不能通过浏览器显示，区别于HTML。

3.命名规范

名称可以含字母、数字以及其他的字符名称不能以数字或者标点符号开始名称不能以字符“xml”（或者XML、Xml）开始名称不能包含空格可使用任何名称，没有保留的字词<?xmlversion="1.0"encoding="utf-8"?><!DOCTYPEjava1705[<!ELEMENTjava1705(student+)><!ELEMENTstudent(name,age,sex,height)><!ATTLISTstudentidCDATA"10086"><!ATTLISTstudentuserCDATA"jack"><!ELEMENTname(#PCDATA)><!ELEMENTage(#PCDATA)><!ELEMENTsex(#PCDATA)><!ELEMENTheight(#PCDATA)>]>//DTD约束<java1705><studentid="1001"user="zhangsan"><name>张三</name><age>19</age><sex>男</sex><height>180</height></student><studentid="1002"user="lisi"><name>李四</name><age>21</age><sex>男</sex><height>178</height></student><studentid="1003"user="wangwu"><name>王五</name><age>22</age><sex>男</sex><height>182</height></student></java1705>2.xml解析2.1DOM解析1.特点

W3C认可的规范。适合于小型文件。基于树形结构。非一次性处理，简单。

2.代码：publicclassDOM4jParse{publicstaticvoidmain(String[]args){try{///创建XML的DOM4J解析器SAXReadersaxReader=newSAXReader();//解析XML文件Documentdocument=saxReader.read(newFile("student.xml"));//得到根节点ElementrootElement=document.getRootElement();//得到根节点的所有子元素节点List<Element>elements=rootElement.elements();ArrayList<Student>list=newArrayList<>();for(inti=0;i<elements.size();i++){Elementelement=elements.get(i);//获取属性值Stringid=element.attributeValue("id");//得到节点内队形属性名的值Stringuser=element.attributeValue("user");//Elementname=element.element("name");//得到element节点下的name子元素子节点//Stringtext=name.getText();Stringname=element.elementText("name");//得到节点的内容Stringage=element.elementText("age");Stringsex=element.elementText("sex");Stringheight=element.elementText("height");list.add(newStudent(id,user,name,age,sex,height));}for(inti=0;i<list.size();i++){Studentstudent=list.get(i);System.out.println(student.toString());}}catch(DocumentExceptione){e.printStackTrace();}}}2.2SAX解析1.特点边读边解析，应用于大型XML文档解决内存问题，不需每次都访问内存事件驱动，文档读入过程就是SAX的解析过程，基于回调机制的程序运行方法只支持读、访问效率低、只能顺序访问2.代码：publicclassSAXParse{publicstaticvoidmain(String[]args){try{//NO.1创建解析工厂SAXParserFactoryfactory=SAXParserFactory.newInstance();//NO.2通过解析工厂，创建解析构造器SAXParsersaxParser=factory.newSAXParser();//No.3指定解析的文件，并指定解析规则(DefaultHandler)MyHandlermyHandler=newMyHandler();saxParser.parse(newFile("student.xml"),myHandler);//解析结束ArrayList<Student>list=myHandler.getList();for(inti=0;i<list.size();i++){Studentstudent=list.get(i);System.out.println(student.toString());}}catch(ParserConfigurationExceptione){e.printStackTrace();}catch(SAXExceptione){e.printStackTrace();}catch(IOExceptione){e.printStackTrace();}}/***SAX解析过程处理器*/privatestaticclassMyHandlerextendsDefaultHandler{ArrayList<Student>list=newArrayList<>();publicArrayList<Student>getList(){returnlist;}privateStudentstudent;@OverridepublicvoidstartDocument()throwsSAXException{System.out.println("开始解析内容");}/***解析到开始标签**@paramuri命名空间*@paramlocalName不支持*@paramqName[返回前缀:]标签名字(如果没有命名空间，返回标签名)*@paramattributes该标签的所有属性对象*@throwsSAXException*/@OverridepublicvoidstartElement(Stringuri,StringlocalName,StringqName,Attributesattributes)throwsSAXException{//System.out.println("<"+qName);if("student".equals(qName)){student=newStudent();Stringid=attributes.getValue("id");Stringuser=attributes.getValue("user");student.setId(Integer.parseInt(id));student.setUser(user);}target=qName;}//为了在characters方法中取出有效的字符内容，标记开始节点的名字privateStringtarget=null;/***解析到字符串内容（空格，回车，文字）**@paramch文档缓存在内存中的内容，长度为8192*@paramstart遇到的文本内容在缓存中的位置，*@paramlength文本内容到下一个元素节点的长度*@throwsSAXException*/@Overridepublicvoidcharacters(char[]ch,intstart,intlength)throwsSAXException{Stringcontent=newString(ch,start,length);//System.out.println(content);switch(target){case"name":student.setName(content);break;case"age":student.setAge(Integer.parseInt(content));break;case"sex":student.setSex(content);break;case"height":student.setHeight(content);break;}}@OverridepublicvoidendElement(Stringuri,StringlocalName,StringqName)throwsSAXException{if("student".equals(qName)){list.add(student);}target=null;//为了防止结束节点之后取出的无效字符再次赋值给student，所以重置target}@OverridepublicvoidendDocument()throwsSAXException{System.out.println("解析结束");}}}2.3JDOM解析1.特点基于树形结构，利用纯java技术对XML文档进行解析，它利用更为强有力的JAVA语言的诸多特性（方法重载、集合概念以及映射），把SAX和DOM的功能有效地结合起来。具有SAX的java规则没有向下兼容的限制，比DOM简单不过不能处理大于内存的文档。针对实例文档不提供DTD与模式的任何实际模型。不支持与DOM中相应遍历包2.代码publicclassJdomParse{publicstaticvoidmain(String[]args){try{//NO.1创建jDOM解析构造器SAXBuildersaxBuilder=newSAXBuilder();//NO.2解析整个XML文档org.jdom2.Documentbuild=saxBuilder.build(newFile("student.xml"));ElementrootElement=build.getRootElement();//得到根节点List<Element>children=rootElement.getChildren();//获取元素节点下的所有子元素节点ArrayList<Student>list=newArrayList<>();for(inti=0;i<children.size();i++){Elementelement=children.get(i);Stringid=element.getAttributeValue("id");Stringuser=element.getAttributeValue("user");System.out.println(""+id+""+user);//获取element元素下的name子元素节点//Elementname=element.getChild("name");//Stringtext=name.getText();//取出元素内容Stringname=element.getChildText("name");Stringage=element.getChildText("age");Stringsex=element.getChildText("sex");Stringheight=element.getChildText("height");list.add(newStudent(id,user,name,age,sex,height));}for(inti=0;i<list.size();i++){Studentstudent=list.get(i);System.out.println(student.toString());}}catch(JDOMExceptione){e.printStackTrace();}catch(IOExceptione){e.printStackTrace();}}}2.4DOM4j解析（重点掌握）

1.特点

提供了构建文档表示的选项，它通过DOM4JAPI和标准DOM接口具有并行访问功能。使用Collections类，灵活一个简单、灵活的开放源代码的库、与JDOM不同的是，dom4j使用接口和抽象的人分离出来而后独立基类，虽然Dom4j的API相对要复杂一些，但它提供了比JDOM更好的灵活性。

2.代码

publicclassDOM4jParse{publicstaticvoidmain(String[]args){try{///创建XML的DOM4J解析器SAXReadersaxReader=newSAXReader();//解析XML文件Documentdocument=saxReader.read(newFile("student.xml"));//得到根节点ElementrootElement=document.getRootElement();//得到根节点的所有子元素节点List<Element>elements=rootElement.elements();ArrayList<Student>list=newArrayList<>();for(inti=0;i<elements.size();i++){Elementelement=elements.get(i);//获取属性值Stringid=element.attributeValue("id");//得到节点内队形属性名的值Stringuser=element.attributeValue("user");//Elementname=element.element("name");//得到element节点下的name子元素子节点//Stringtext=name.getText();Stringname=element.elementText("name");//得到节点的内容Stringage=element.elementText("age");Stringsex=element.elementText("sex");Stringheight=element.elementText("height");list.add(newStudent(id,user,name,age,sex,height));}for(inti=0;i<list.size();i++){Studentstudent=list.get(i);System.out.println(student.toString());}}catch(DocumentExceptione){e.printStackTrace();}}}3.比较DOM4J性能最好，连Sun的JAXM也在用DOM4J。目前许多开源项目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.JDOM和DOM在性能测试时表现不佳，在测试10M文档时内存溢出。在小文档情况下还值得考虑使用DOM和JDOM。虽然JDOM的开发者已经说明他们期望在正式发行版前专注性能问题，但是从性能观点来看，它确实没有值得推荐之处。另外，DOM仍是一个非常好的选择。DOM实现广泛应用于多种编程语言。它还是许多其它与XML相关的标准的基础，因为它正式获得W3C推荐(与基于非标准的Java模型相对)，所以在某些类型的项目中可能也需要它(如在JavaScript中使用DOM)。SAX表现较好，这要依赖于它特定的解析方式－事件驱动。一个SAX检测即将到来的XML流，但并没有载入到内存(当然当XML流被读入时，会有部分文档暂时隐藏在内存中)。

[技术汇总] Jsp 复习材料一： XML解析

相关帖子