创建解析器:
SAXReader reader = new SAXReader();
利用解析器读入xml文档:
Document document =reader.read(new File("input.xml"));
获取文档的根节点:
Element root =document.getRootElement();
接口继承结构:
Node ---
Branch
--Document
--Element
----
Attribute
Node接口
asXML() 将一个节点转换为字符串 | |
getName() 获取节点的名称,如果是元素则获取到元素名,如果是属性获取到属性名 | |
short | getNodeType() 获取节点类型,在Node接口上定义了一些静态short类型的常量用来表示各种类型 |
getParent() 获取父节点,如果是根元素调用则返回null,如果是其他元素调用则返回父元素,如果是属性调用则返回属性所依附的元素。 | |
getText() 返回节点文本,如果是元素则返回标签体,如果是属性则返回属性值 | |
selectNodes(String xpathExpression) 利用xpath表达式,选择节点 | |
void | setName(String name) 设置节点的名称,元素可以更改名称,属性则不可以,会抛出UnsupportedOperationException 异常 |
void | setText(String text) 设置节点内容,如果是元素则设置标签体,如果是属性则设置属性的值 |
void | write(Writer writer) 将节点写出到一个输出流中,元素、属性均支持 |
Branch接口(实现了Node接口)
void | add(Element element) 增加一个子节点 |
addElement(QName qname) 增加一个给定名字的子节点,并且返回这个新创建的节点的引用 | |
int | indexOf(Node node) 获取给定节点在所有直接点中的位置号,如果该节点不是此分支的子节点,则返回-1 |
boolean | remove(Element element) 删除给定子元素,返回布尔值表明是否删除成功。 |
void | add(Attribute attribute) 增加一个属性 |
addAttribute(QName qName, String value) 为元素增加属性,用给定的属性名和属性值,并返回该元素 | |
addAttribute(String name, String value) 为元素增加属性 | |
attribute(int index) 获取指定位置的属性 | |
attribute(QName qName) 获取指定名称的属性 | |
attributeIterator() 获取属性迭代器 | |
attributes() 获取该元素的所有属性,以一个list返回 | |
attributeValue(QName qName) 获取指定名称属性的值,如果不存在该属性返回null,如果存在该属性但是属性值为空,则返回空字符串 | |
element(QName qName) 获取指定名称的子元素,如果有多个该名称的子元素,则返回第一个 | |
element(String name) 获取指定名称的子元素,如果有多个该名称的子元素,则返回第一个 | |
elementIterator() 获取子元素迭代器 | |
elementIterator(QName qName) 获取指定名称的子元素的迭代器 | |
elements() 获取所有子元素,并用一个list返回 | |
elements(QName qName) 获取所有指定名称的子元素,并用一个list返回 | |
getText() 获取元素标签体 | |
boolean | remove(Attribute attribute) 移除元素上的属性 |
void | setAttributes(List attributes) 将list中的所有属性设置到该元素上 |
Attribute接口(实现了Node接口)
getQName() 获取属性名称 | |
getValue() 获取属性的值 | |
void | setValue(String value) 设置属性的值 |
DocumentHelper 类
static Attribute | createAttribute(Element owner, QName qname, String value) 创建一个Attribute |
|
static Document | 创建一个Document |
|
static Document | createDocument(Element rootElement) 以给定元素作为根元素创建Document |
|
| static Element | createElement(QName qname) 以给定名称创建一个Element |
static Document | parseText(String text) 将一段字符串转化为Document |
|
将节点写出到XML文件中去
方法1:
调用Node提供的write(Writerwriter) 方法,使用默认方式将节点输出到流中:
node.write(newFileWriter("book.xml"));
乱码问题:
Dom4j在将文档载入内存时使用的是文档声明中encoding属性声明的编码集进行编码, 如果在此时使用writer输出时writer使用的内部编码集与encoding不同则会有乱码问题。
FileWriter默认使用操作系统本地码表即gb2312编码,并且无法更改。
此时可以使用OutputStreamWriter(FileOutputStream("filePath"),"utf-8");的方式自己封装 一个指定码表的Writer使用,从而解决乱码问题。
方式2:
利用XMLWriter写出Node:
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(node);
writer.close();
乱码问题:
(1)使用这种方式输出时,XMLWriter首先会将内存中的docuemnt翻译成UTF-8 格式的document,在进行输出,这时有可能出现乱码问题。
可以使用OutputFormat 指定XMLWriter转换的编码为其他编码。
OutputFormat format =OutputFormat.createPrettyPrint();
format.setEncoding("GBK");
XMLWriterwriter = new XMLWriter(new FileWriter("output.xml"),format);
(2)Writer使用的编码集与文档载入内存时使用的编码集不同导致乱码,使用字节流 或自己封装指定编码的字符流即可(参照方法1)。