当前位置: 代码迷 >> Web前端 >> org.w3c.dom 中Node的Text构造
  详细解决方案

org.w3c.dom 中Node的Text构造

热度:415   发布时间:2012-09-01 09:33:03.0
org.w3c.dom 中Node的Text结构
在官方自带的解析xml是org.w3c.dom包。是使用其包下的Node接口表示Xml文档中的元素。
在Node类解析XML文档时,使用getNodeName方法打印总是会打印出#Text的类型,莫名其妙的,明明在Xml文档中没有这种类型额?
后来,经过测试发现,Node在解析XML文档元素时,即使是空的那一部分内容,同样解析成了Node,只不过Node中的那部分内容文本形式,即Text格式。而Xml中的原始中的内容,是使用Element的格式表达的。但是Element格式到最后,(即如果使用getChildren这种方法显示得到的元素信息)得到的仍然为Text格式的内容。

总的来说,就是这个包下的元素在解析XML文档时,所有的原子性的数据都是使用Text(文本信息)记录的,而在记录Text文本内容是,即使不是<>标签中的元素数据,同样被记录了下来。
多出来的那些Text内容是(包括,但不限于)一个结束标签与另一个开头标签的之间的空白部分。恩,大概就这个意思了。

这种方式解析XML的话,无疑多了很多无用数据啊。怪不得用官方包解析XML文档的人那么少额。
  相关解决方案