1. XML基本介绍 1.1 概述 XML即可扩展标记语言(Extensible Markup Language)
W3C在1998年2月发布1.0版本,2004年2月又发布1.1版本,但因为1.1版本不能向下兼容1.0版
本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是
1.0版本 !
特点
1.2 XML的作用 XML能做什么?
功能
说明
存储数据
通常,我们在数据库中存储数据。不过,如果希望数据的可移植性更强,我们可以把数据存储 XML 文件中
配置文件
作为各种技术框架的配置文件使用 (最多)
在网络中
客户端可以使用XML格式向服务器端发送数据,服务器接收到xml格式数据,进行解析
2. XML语法 2.1 XML文档声明格式
1)语法格式
1 <?xml version="1.0" encoding="UTF-8"?>
2)属性说明
versioin :指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0
encoding :指定当前文档的编码。可选属性,默认值是utf-8;
2.2 元素 Element 元素: 是XML文档中最重要的组成部分
元素的命名规则:
不能使用空格,不能使用冒号
xml 标签名称区分大小写
XML 必须有且只有一个根元素
语法格式:
1)XML 必须有且只有一个根元素,它是所有其他元素的父元素,比如以下实例中 users 就是根元素:
1 2 3 4 5 <?xml version="1.0" encoding="utf-8" ?> <users > </users >
2)普通元素的结构开始标签、元素体、结束标签组成。
3)元素体:元素体可以是元素,也可以是文本
1 2 3 <hello > <a > 你好</a > </hello >
4)空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合
2.3 属性 1 <bean id ="" class ="" > </bean >
2.4 注释 XML的注释,以“ ”结束。注释内容会被XML解析器忽略!
2.5 使用XML描述数据表中的数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <?xml version="1.0" encoding="UTF-8" ?> <employees > <employee eid ="2" > <ename > 林黛玉</ename > <age > 20</age > <sex > 女</sex > <salary > 5000</salary > <empdate > 2019-03-14</empdate > </employee > <employee eid ="3" > <ename > 杜甫</ename > <age > 40</age > <sex > 男</sex > <salary > 15000</salary > <empdate > 2010-01-01</empdate > </employee > </employees >
3. XML约束
3.1 DTD约束 DTD(Document Type Defifinition),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。
3.1.1 编写DTD
创建约束文件 student.dtd
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 <!ELEMENT students (student+) > <!ELEMENT student (name,age,sex)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> <!ELEMENT sex (#PCDATA)> <!ATTLIST student number ID #REQUIRED> <!-- ELEMENT: 用来定义元素 students (student+) : 代表根元素 必须是 <students> student+ : 根标签中至少有一个 student子元素, + 代表至少一个 student (name,age,sex): student 标签中包含的子元素,按顺序出现 #PCDATA: 是普通文本内容 ATTLIST: 用来定义属性 student number ID #REQUIRED student子元素中 有一个ID属性叫做 number,是必须填写的 ID: 唯一 值只能是字母或者下划线开头 -->
3.2 Schema约束 3.2.1 什么是Schema约束
Schema是新的XML文档约束, 比DTD强大很多,是DTD 替代者;
Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml。
Schema 功能更强大,内置多种简单和复杂的数据类型
Schema 支持命名空间 (一个XML中可以引入多个约束文档)
3.2.2 Schema约束示例 student.xsd
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 <?xml version="1.0"?> <xsd:schema xmlns ="http://www.jasper.com/xml" xmlns:xsd ="http://www.w3.org/2001/XMLSchema" targetNamespace ="http://www.jasper.com/xml" elementFormDefault ="qualified" > <xsd:element name ="students" type ="studentsType" /> <xsd:complexType name ="studentsType" > <xsd:sequence > <xsd:element name ="student" type ="studentType" minOccurs ="0" maxOccurs ="unbounded" /> </xsd:sequence > </xsd:complexType > <xsd:complexType name ="studentType" > <xsd:sequence > <xsd:element name ="name" type ="xsd:string" /> <xsd:element name ="age" type ="ageType" /> <xsd:element name ="sex" type ="sexType" /> </xsd:sequence > <xsd:attribute name ="number" type ="numberType" use ="required" /> </xsd:complexType > <xsd:simpleType name ="sexType" > <xsd:restriction base ="xsd:string" > <xsd:enumeration value ="male" /> <xsd:enumeration value ="female" /> </xsd:restriction > </xsd:simpleType > <xsd:simpleType name ="ageType" > <xsd:restriction base ="xsd:integer" > <xsd:minInclusive value ="0" /> <xsd:maxInclusive value ="200" /> </xsd:restriction > </xsd:simpleType > <xsd:simpleType name ="numberType" > <xsd:restriction base ="xsd:string" > <xsd:pattern value ="hehe_\d{4}" /> </xsd:restriction > </xsd:simpleType > </xsd:schema >
Xml Schema元素
3.2.3 XML引入Schema约束 xml中引入schema文档约束的步骤
查看schema文档,找到根元素,在xml中写出来
1 2 3 4 <?xml version="1.0" encoding="UTF-8" ?> <students > </students >
根元素来自哪个命名空间。使用xmlns 指令来声明
1 2 3 4 5 6 <?xml version="1.0" encoding="UTF-8" ?> <students xmlns="http://www.jasper.com/xml" > </students >
引入 w3c的标准命名空间, 复制即可
1 2 3 4 5 6 7 <?xml version="1.0" encoding="UTF-8" ?> <students xmlns="http://www.lagou.com/xml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" > </students >
引入的命名空间跟哪个xsd文件对应?
使用schemaLocation来指定:两个取值:第一个为命名空间 第二个为xsd文件的路径
1 2 3 4 5 6 7 8 <?xml version="1.0" encoding="UTF-8" ?> <students xmlns="http://www.lagou.com/xml" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.jasper.com/xml student.xsd" > </students >
命名空间
1 指的是一个环境,所用的标签来自于哪个环境定义的。
student.xml
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 <?xml version="1.0" encoding="UTF-8" ?> <students xmlns ="http://www.lagou.com/xml" xmlns:xsi ="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation ="http://www.lagou.com/xml student.xsd" > <student number ="hehe_1234" > <name > 张百万</name > <age > 25</age > <sex > female</sex > </student > <student number ="hehe_0000" > <name > 小斌</name > <age > 20</age > <sex > male</sex > </student > </students >
4. XML解析 4.1 解析概述 当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
4.2 XML解析方式 开发中比较常见的解析方式有两种,如下:
4.3 XML常见的解析器 解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包
JAXP:sun公司提供的解析器,支持DOM和SAX两种思想
DOM4J:一款非常优秀的解析器 , Dom4j是一个易用的、开源的库,用于XML,XPath和XSLT。它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP。
Jsoup:jsoup 是一款Java 的HTML解析器 ,也可以解析XML
PULL:Android内置的XML解析方式,类似SAX。
4.4 dom4j的使用 4.4.1 导入JAR包
4.4.2 API介绍 使用核心类SaxReader加载xml文档获得Document,通过Document 对象获得文档的根元素,然后就可以操作了
常用API如下:
SaxReader对象
Document对象
Element对象
elements(…) 获得指定名称的所有子元素。可以不指定名称
element(…) 获得指定名称的第一个子元素。可以不指定名称
getName() 获得当前元素的元素名
attributeValue(…) 获得指定属性名的属性值
elementText(…) 获得指定名称子元素的文本值
getText() 获得当前元素的文本内容
4.4.3 准备xml文件 编写user.xsd schema约束
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 <?xml version="1.0" encoding="UTF-8" ?> <xsd:schema xmlns ="http://www.lagou.com/xml" xmlns: xsd ="http://www.w3.org/2001/XMLSchema" targetNamespace ="http://www.lagou.com/xml" elementFormDefault ="qualified" > <xsd:element name ="users" type ="usersType" /> <xsd:complexType name ="usersType" > <xsd:sequence > <xsd:element name ="user" type ="userType" minOccurs ="0" maxOccurs ="unbounded" /> </xsd:sequence > </xsd:complexType > <xsd:complexType name ="userType" > <xsd:sequence > <xsd:element name ="name" type ="xsd:string" /> <xsd:element name ="age" type ="ageType" /> <xsd:element name ="hobby" type ="hobbyType" /> </xsd:sequence > <xsd:attribute name ="id" type ="numberType" use ="required" /> </xsd:complexType > <xsd:simpleType name ="ageType" > <xsd:restriction base ="xsd:integer" > <xsd:minInclusive value ="0" /> <xsd:maxInclusive value ="100" /> </xsd:restriction > </xsd:simpleType > <xsd:simpleType name ="hobbyType" > <xsd:restriction base ="xsd:string" > <xsd:enumeration value ="抽烟" /> <xsd:enumeration value ="喝酒" /> <xsd:enumeration value ="烫头" /> </xsd:restriction > </xsd:simpleType > <xsd:simpleType name ="numberType" > <xsd:restriction base ="xsd:string" > <xsd:pattern value ="\d" /> </xsd:restriction > </xsd:simpleType > </xsd:schema >
编写user.xml 引入约束
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 <?xml version="1.0" encoding="UTF-8" ?> <users xmlns ="http://www.lagou.com/xml" xmlns:xsi ="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation ="http://www.lagou.com/xml user.xsd" > <user id ="1" > <name > 张百万</name > <age > 20</age > <hobby > 抽烟</hobby > </user > <user id ="2" > <name > 于谦</name > <age > 50</age > <hobby > 喝酒</hobby > </user > <user id ="3" > <name > 刘能</name > <age > 40</age > <hobby > 烫头</hobby > </user > </users >
4.4.4 读取XML 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 public class TestDOM4j { @Test public void test1 () throws DocumentException { SAXReader reader = new SAXReader(); document Document document = reader.read("H:\\jdbc_work\\xml_task03\\src\\com\\lagou\\xml03\\user.xml" ); Element rootElement = document.getRootElement(); System.out.println(rootElement.getName()); List<Element> elements = rootElement.elements(); for (Element element : elements) { System.out.println("根标签下的子节点: " + element.getName()); List<Element> eList = element.elements(); for (Element e : eList) { System.out.println("user标签下的子节点" + e.getName()); } break ; } } @Test public void test2 () throws DocumentException { SAXReader sr = new SAXReader(); Document document = sr.read("src\\com\\lagou\\xml02\\user.xml" ); Element rootElement = document.getRootElement(); List<Element> elements = rootElement.elements(); Element user = elements.get(0 ); String id = user.attributeValue("id" ); String name = user.elementText("name" ); String age = user.elementText("age" ); String hobby = user.element("hobby" ).getText(); System.out.println(id+" " + name +" " + age +" " + hobby); } }
4.5 xpath方式读取xml 4.5.1 xpath介绍 XPath 是一门在 XML 文档中查找信息的语言 。 可以是使用xpath查找xml中的内容。 XPath 的好处
由于DOM4J在解析XML时只能一层一层解析,所以当XML文件层数过多时使用会很不方便,结合XPATH就可以直接获取到某个元素
1)需要再导入 jaxen-1.1-beta-6.jar
4.5.2 XPath基本语法介绍 2)使用dom4j支持xpath的操作的几种主要形式
语法
说明
/AAA/DDD/BBB
表示一层一层的,AAA下面 DDD下面的BBB
//BBB
表示和这个名称相同,表示只要名称是BBB,都得到
//*
所有元素
BBB[1] , BBB[last()]
第一种表示第一个BBB元素, 第二种表示最后一个BBB元素
//BBB[@id]
表示只要BBB元素上面有id属性,都得到
//BBB[@id=’b1’]
表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1
4.5.3 API介绍
常用方法
描述
selectSingleNode(query)
查找和 XPath 查询匹配的一个节点。参数是Xpath 查询串。
selectNodes(query)
得到的是xml根节点下的所有满足 xpath 的节点
4.5.4 Xpath读取XML 3)数据准备book.xml
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <?xml version="1.0" encoding="UTF-8" ?> <bookstore > <book id ="book1" > <name > 金瓶梅</name > <author > 金圣叹</author > <price > 99</price > </book > <book id ="book2" > <name > 红楼梦</name > <author > 曹雪芹</author > <price > 69</price > </book > <book id ="book3" > <name > Java编程思想</name > <author > 埃克尔</author > <price > 59</price > </book > </bookstore >
4)代码示例
使用selectSingleNode方法 查询指定节点中的内容
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 @Test public void test1 () throws DocumentException { SAXReader sr = new SAXReader(); Document document = sr.read("H:\\jdbc_work\\xml_task03\\src\\com\\lagou\\xml03\\book.xml" ); Node node1 = document.selectSingleNode("/bookstore/book/name" ); System.out.println("节点: " + node1.getName()); System.out.println("书名: " + node1.getText()); Node node2 = document.selectSingleNode("/bookstore/book[2]/name" ); System.out.println("第二本书的书名为: " + node2.getText()); }
使用selectSingleNode方法 获取属性值,或者属性值对应的节点
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 @Test public void test2 () throws DocumentException { SAXReader sr = new SAXReader(); Document document = sr.read("H:\\jdbc_work\\xml_task03\\src\\com\\lagou\\xml03\\book.xml" ); Node node1 = document.selectSingleNode("/bookstore/book/attribute::id" ); System.out.println("第一个book的id值为: " + node1.getText()); Node node2 = document.selectSingleNode("/bookstore/book[last()]/attribute::id" ); System.out.println("最后一个book节点的id值为: " + node2.getText()); Node node3 = document.selectSingleNode("/bookstore/book[@id='book2']" ); String name = node3.selectSingleNode("name" ).getText(); System.out.println("id为book2的书名是: " + name); }
使用 selectNodes()方法 获取对应名称的所有节点
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 @Test public void test3 () throws DocumentException { SAXReader sr = new SAXReader(); Document document = sr.read("H:\\jdbc_work\\xml_task03\\src\\com\\lagou\\xml03\\book.xml" ); List<Node> list = document.selectNodes("//*" ); for (Node node : list) { System.out.println("节点名: " + node.getName()); } List<Node> names = document.selectNodes("//name" ); for (Node name : names) { System.out.println(name.getText()); } List<Node> book1 = document.selectNodes("/bookstore/book[@id='book1']//*" ); for (Node node : book1) { System.out.println(node.getName()+" = " + node.getText()); } }
5. JDBC自定义XML 5.1 定义配置文件 1)创建自定义xml文件,保存数据库连接信息
jdbc-config.xml
1 2 3 4 5 6 7 8 <?xml version="1.0" encoding="UTF-8" ?> <jdbc > <property name ="driverClass" > com.mysql.jdbc.Driver</property > <property name ="jdbcUrl" > jdbc:mysql://localhost:3306/db5? characterEncoding=UTF-8</property > <property name ="user" > root</property > <property name ="password" > 123456</property > </jdbc >
5.2 编写工具类(配置式) 2)编写工具类 ,使用xpath 读取数据库信息
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 public class JDBCUtils { public static String DRIVERNAME; public static String URL; public static String USER; public static String PASSWORD; static { try { SAXReader sr = new SAXReader(); Document document = sr.read("H:\\workspace01\\JDBC_day02\\src\\com\\lagou\\xml03\\jdbc-config.xml" ); Node node = document.selectSingleNode("/jdbc/property[@name='driverClass']" ); DRIVERNAME = node.getText(); URL = document.selectSingleNode("/jdbc/property[@name='jdbcUrl']" ).getText(); USER = document.selectSingleNode("/jdbc/property[@name='user']" ).getText(); PASSWORD = document.selectSingleNode("/jdbc/property[@name='password']" ).getText(); Class.forName(DRIVERNAME); } catch (Exception e) { e.printStackTrace(); } } public static Connection getConnection () { try { Connection connection = DriverManager.getConnection(URL, USER, PASSWORD); return connection; } catch (SQLException e) { e.printStackTrace(); return null ; } } }
5.3 测试工具类 3)测试:获取所有员工的姓名
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 public static void main (String[] args) { try { Connection connection = JDBCUtils.getConnection(); Statement statement = connection.createStatement(); String sql = "select * from employee" ; ResultSet resultSet = statement.executeQuery(sql); while (resultSet.next()){ String ename = resultSet.getString("ename" ); System.out.println(ename); } } catch (SQLException e) { e.printStackTrace(); } }