深入解析XML中的DTD文檔類型定義

XML 文檔類型定義,俗稱 DTD,它是一種準確描述 XML 語言的方式。DTDs 根據(jù)適當 XML 語言的語法規(guī)則檢查 XML 文檔的詞匯和結(jié)構(gòu)的有效性。
XML DTD 可以指定在文檔內(nèi)部,也可以保存在獨立的文檔中然后單獨鏈接。
語法
DTD 的基本語法如下所示:
- <!DOCTYPE element DTD identifier
- [
- declaration1
- declaration2
- ........
- ]>
上述語法中:
DTD 以 <!DOCTYPE 定界符開始。
element 用于告訴解析器從指定的根元素開始解析文檔。
DTD identifier 是一個用于文檔類型定義的標示符,它可以是一個指向系統(tǒng)中某個文件的路徑或者連接到互聯(lián)網(wǎng)上某個文件的 URL。如果 DTD 指向外部路徑,則被稱為外部子集。 _ [] 內(nèi)是一個可選的實體聲明列表,被稱為內(nèi)部子集。
內(nèi)部 DTD
如果一個元素聲明在 XML 文檔的內(nèi)部則 DTD 被稱為內(nèi)部 DTD。為了把它作為內(nèi)部 DTD,XML 聲明中的 standalone 屬性必須設置為 yes。這意味著,聲明的工作獨立于外部源。
語法
內(nèi)部 DTD 語法如下所示:
- <!DOCTYPE root-element [element-declarations]>
這里 root-element 是根元素的名稱,element-declarations 表示我們聲明的元素。
示例
下面是一個內(nèi)部 DTD 的簡單示例:
- <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
- <!DOCTYPE address [
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone (#PCDATA)>
- ]>
- <address>
- <name>Tanmay Patil</name>
- <company>TutorialsPoint</company>
- <phone>(011) 123-4567</phone>
- </address>
我們來看一下上面的代碼:
開始聲明 - 使用如下語句開始 XML 聲明:
- <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
DTD - 緊跟在 XML 頭后面,_文檔類型聲明_如下,通常被稱為 DOCTYPE:
<!DOCTYPE address [
DOCTYPE 聲明在元素名稱的開頭包含一個感嘆號(!)。DOCTYPE 會通知解析器有一個 DTD 與這個文檔相關(guān)聯(lián)。
DTD Body - DOCTYPE 聲明后面緊跟 DTD 體,這里我們聲明元素,屬性,實體和符號:
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone_no (#PCDATA)>
許多元素都在這里通過 <name> 文檔詞匯聲明。<!ELEMENT name (#PCDATA)> 定義元素_名稱_為 "#PCDATA" 類型。這里 #PCDATA 意味著可解析的文本數(shù)據(jù)。
結(jié)束聲明 - 最后,DTD 的聲明部分使用方括號和尖括號(]>)閉合。這是一個有效的結(jié)束定義,后面緊跟的就是 XML 文檔內(nèi)容。
規(guī)則
文檔類型聲明必須出現(xiàn)在文檔的開頭部分(只先與 XML 頭),不允許出現(xiàn)在文檔的任意其他位置。
類似于 DOCTYPE 聲明,元素聲明必須以感嘆號開始。
文檔類型聲明中的 Name 必須與根元素的類型匹配。
外部 DTD
在外部 DTD 中元素聲明在 XML 文檔的外部。通過指定 system 屬性來訪問,這個屬性值可以是合法的 .dtd 文件或者有效的 URL。為了指示它是外部 DTD,XML 聲明的 standalone 屬性必須設置為 no。這就意味著,聲明包含來自外部源的信息。
語法
下面是外部 DTD 的語法:
<!DOCTYPE root-element SYSTEM "file-name">
這里 file-name 就是 .dtd 擴展的文件。
示例
下面的示例展示了外部 DTD 的用法:
- <?xml version="1.0" encoding="UTF-8" standalone="no" ?>
- <!DOCTYPE address SYSTEM "address.dtd">
- <address>
- <name>Tanmay Patil</name>
- <company>TutorialsPoint</company>
- <phone>(011) 123-4567</phone>
- </address>
- DTD 文件 address.dtd 的內(nèi)容如下所示:
- <!ELEMENT address (name,company,phone)>
- <!ELEMENT name (#PCDATA)>
- <!ELEMENT company (#PCDATA)>
- <!ELEMENT phone (#PCDATA)>
類型
我們可以通過使用系統(tǒng)標示符或者公共標示符引用一個外部DTD。
系統(tǒng)標示符
系統(tǒng)標示符允許我們指定包含 DTD 聲明的外部文件的位置。語法如下:
- <!DOCTYPE name SYSTEM "address.dtd" [...]>
正如我們可以看到的,它包含 SYSTEM 關(guān)鍵字和一個指向文檔位置的 URI 引用。
公共標示符
公共標示符提供了一種定位 DTD 資源的機制,寫法如下:
- <!DOCTYPE name PUBLIC "-//Beginning XML//DTD Address Example//EN">
正如我們可以看到的,它以 PUBLIC 關(guān)鍵字開始,后面緊跟的是專門的標識符。公共標識符被用來標識目錄中的條目。公共標識符可以遵循任意格式,但是常用的格式是正式公用標識符(或者 FPIs)。
聲明元素
在dtd中聲明元素(在一個xml如果一個元素想要讓它是合法的,則需要在dtd中聲明)
語法:<!ELEMENT 元素名稱 類別>和<!ELEMENT 元素名稱 (元素內(nèi)容)>這兩種方式
<!ELEMENT 元素名稱 EMPTY>
例如:
- <!ELEMENT br EMPTY>
則xml可以寫成:
- <br/>
注意點
在dtd中
所有的 XML 文檔(以及 HTML 文檔)均由以下簡單的構(gòu)建模塊構(gòu)成:
元素
屬性
實體
PCDATA
CDATA
下面是一些注意點:
(1)實體是用來定義普通文本的變量。實體引用是對實體的引用。
大多數(shù)同學都了解這個 HTML 實體引用:" "。這個“無折行空格”實體在 HTML 中被用于在某個文檔中插入一個額外的空格。
當文檔被 XML 解析器解析時,實體就會被展開。
(2) PCDATA
PCDATA 的意思是被解析的字符數(shù)據(jù)(parsed character data)。
可把字符數(shù)據(jù)想象為 XML 元素的開始標簽與結(jié)束標簽之間的文本。
PCDATA 是會被解析器解析的文本。這些文本將被解析器解析成實體以及標記。
文本中的標簽會被當作標記來處理,而實體會被展開。
不過,被解析的字符數(shù)據(jù)不應當包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 實體來分別替換它們。
(3)CDATA
CDATA 的意思是字符數(shù)據(jù)(character data)。
CDATA 是不會被解析器解析的文本。在這些文本中的標簽不會被當作標記來對待,其中的實體也不會被展開。
相關(guān)文章
- 這篇文章主要介紹了XML代碼編寫的編碼與驗證問題,與HTML類似,XML文件的編碼也能在序言部分被指定,需要的朋友可以參考下2016-02-15
- 這篇文章主要介紹了XML中的處理指令,處理指令在XML中并不常用,稍作了解即可,需要的朋友可以參考下2016-02-15
- 這篇文章主要介紹了XML對代碼中的空白處理,文中介紹到了XML書寫中的有效空白與無效空白的區(qū)分,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的字符實體與字符數(shù)據(jù),文中所說的CDATA片段即是指字符數(shù)據(jù)即不由解析器解析的文本塊,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了詳解XML中的代碼注釋書寫方法,文章中總結(jié)了注釋使用的一些注意點,比如XML不支持嵌套注釋等,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的屬性學習教程,包括使用屬性將數(shù)據(jù)存儲在子元素中的例子,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的標簽與元素的使用,是XML入門學習中的基礎知識,需要的朋友可以參考下2016-02-14
- 這篇文章主要介紹了XML中的文檔與聲明用法,是XML入門學習中的基礎知識,需要的朋友可以參考下2016-02-04
- 這篇文章主要介紹了XML標記語言的基本概念及語法入門教程,XML同時也被廣泛用作標記數(shù)據(jù)來作為XML數(shù)據(jù)交換格式,需要的朋友可以參考下2016-02-04