XML简明教程(6)

目录


发展历史

XML和HTML对比之可扩展

XML和HTML对比之语法细节

XML验证之DTD

XML名称空间

XML语法结构

DOM4J读写配置文件

关于SLT

XML语法结构





<?xmlversion="1.0" encoding="gb2312"standalone="no"?>
<!DOCTYPEstudent SYSTEM "test.dtd">
<!--这是XML文档-->
<student>
         <name>张三</name>
         <age>24</age>
</student>

上面是一个基本的XML,我们就以这个为例来详细说明XML文档的结构和语法。


XML声明(第1行)

XML文档总是以一个XML声明开始,其中指明所用的XML版本、文档的编码、文档的独立性信息。

其格式为:版本信息[编码信息][文档独立性信息]?>其中,括号([])中的部分表示可选信息。

1.版本说明:

需要注意的是前后都有问号,而且问号和括号中间能有空格,否则会出错。截至笔者发博客前XML的版本有两个1.01.1,不同的版本之间其实现细节是不一样的。当一个低版本的XML处理器解析一个高版本的XML文档的时候可能会碰到一些不能识别的符号或语法,从而导致解析的结果不正确。通过在XML文档的开始处写上XML声明,XML处理器就可以根据声明来判断该文档所遵守的XML规范,如果遇到不支持的版本就不再解析处理,会直接给出错误信息。

2.文档编码声明

XML声明中还可以加上文档编码信息,默认是UTF-8,如果要使用中文,可以在声明中加上encoding=gb2312”需要注意的是XML编辑时的编码和encoding属性的编码要对应,否则会报如下错误“不支持从当前编码到指定编码的切换。处理资源……”。

例如:用记事本保存XMLANSIencoding的属性应为gb2312;当用记事本保存为UTF-8encoding属性应为UTF-8,其他编码同理。

3.独立文档声明

如果我们的文档不依赖于外部文档,在XML声明中,可以通过standalone=yes”来声明这个文档是独立的文档。如果文档依赖于外部文档,可以通过standalone=no”来声明。完整的XML声明如下所示:

文档类型声明(第2行)

通过前面文章的介绍,我们知道可以用DTDDocument Type Definition,文档类型定义)来规范XML文档。XMLSGML继承了用于定义语法规则的DTD机制,DTD本身并不要求遵循XML规则,几乎所用的XML应用都是使用DTD来定义的.HTML就有一个标准的DTD文件,苏伊其组织结构和所有的标签都是固定的。DTD文件也是一个文本文件,通常用“.dtd”作为其扩展名。

指出XML文档所用的DTD就是通过文档类型声明。文档类型声明有两种方式,一种是声明DTD在一个外部文件中,另一中是直接在XML文档中给出DTD。(关于具体DTD的内容见上一篇文章)

元素

XML中元素由开始标签、元素内容和结束标签构成。空元素则由空元素标签构成。每一个元素都有一个用名字标志的类型,同时它可以有一个属性说明集,每一个属性说明有一个名字和一个值。

在给元素命名的时候要注意,以“xml”或其他任何匹配的字符开头的名字都保留用于XML规范的当前版本或后续版本的标准化。另外,在给元素命名时还需要注意以下几点:

1. 名称只能以字母、下划线,或者冒号开头。

2. 名称中不能包含空格。

3. 不要引起歧义

注释(第3行)

注释可以帮助我们更好的阅读文档,在注释当中几乎可以写一切帮助我们阅读的字符,但是为了避免XML编辑器引起歧义,在写注释的时候需要注意一下几点

1.不能出现在XML声明之前,XML声明必须是文档最前面的部分。

2.注释不能出现在标记中

3.注释可以包围和隐藏标记,但要注意的是,在注释掉标记之后,要保证剩余的文本仍然是一个结构完整的XML文档。

4.字符串“--”(双连接字符)不能在注释中出现。

5.XML中不允许注释以“-->”结尾。

小技巧

其实判断命名或者注释是否规范的最好办法就是用浏览器将写好的XML打开,如果可以打开说明命名没有问题,否则需要根据提示修改XML文件,直到能用浏览器正常打开为止。

以上就是XML简明教程(6)的内容,更多相关内容请关注硕下网()!