DTD - การสร้างบล็อค XML
โครงสร้างหลักของเอกสาร XML และ HTML เป็นองค์ประกอบ
การสร้างบล็อคของเอกสาร XML
เมื่อมองจากมุมมองของ DTD เอกสาร XML ทั้งหมดจะประกอบขึ้นโดยองค์ประกอบต่อไปนี้:
- องค์ประกอบ
- คุณลักษณะ
- หน่วยงาน
- PCDATA
- CDATA
องค์ประกอบ
องค์ประกอบเป็นส่วนประกอบหลักของเอกสาร XML และ HTML
ตัวอย่างขององค์ประกอบ HTML คือ "เนื้อหา" และ "ตาราง" ตัวอย่างขององค์ประกอบ XML อาจเป็น "บันทึก" และ "ข้อความ" องค์ประกอบสามารถมีข้อความ องค์ประกอบอื่นๆ หรือว่างเปล่าได้ ตัวอย่างขององค์ประกอบ HTML ที่ว่างเปล่าคือ "hr", "br" และ "img"
ตัวอย่าง:
<body>some text</body>
<message>some text</message>
คุณลักษณะ
แอตทริบิวต์ให้ข้อมูลเพิ่มเติมเกี่ยวกับองค์ประกอบ
แอตทริบิวต์จะอยู่ในแท็กเปิดขององค์ประกอบเสมอ คุณลักษณะมาในคู่ของชื่อ/ค่าเสมอ องค์ประกอบ "img" ต่อไปนี้มีข้อมูลเพิ่มเติมเกี่ยวกับไฟล์ต้นฉบับ:
<img src="computer.gif" />
ชื่อขององค์ประกอบคือ "img" ชื่อของแอตทริบิวต์คือ "src" ค่าของแอตทริบิวต์คือ "computer.gif" เนื่องจากตัวองค์ประกอบว่างเปล่าจึงถูกปิดโดย " /"
หน่วยงาน
อักขระบางตัวมีความหมายพิเศษใน XML เช่นเครื่องหมายน้อยกว่า (<) ที่กำหนดจุดเริ่มต้นของแท็ก XML
พวกคุณส่วนใหญ่รู้จักเอนทิตี HTML: " " เอนทิตี "no-break-space" นี้ใช้ใน HTML เพื่อแทรกช่องว่างเพิ่มเติมในเอกสาร เอนทิตีถูกขยายเมื่อเอกสารถูกแยกวิเคราะห์โดยตัวแยกวิเคราะห์ XML
เอนทิตีต่อไปนี้ถูกกำหนดไว้ล่วงหน้าใน XML:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA หมายถึงข้อมูลอักขระที่แยกวิเคราะห์
คิดว่าข้อมูลอักขระเป็นข้อความที่พบระหว่างแท็กเริ่มต้นและแท็กปิดขององค์ประกอบ XML
PCDATA เป็นข้อความที่จะแยกวิเคราะห์โดย parser ข้อความจะถูกตรวจสอบโดย parser สำหรับเอนทิตีและมาร์กอัป
แท็กภายในข้อความจะถือเป็นมาร์กอัปและเอนทิตีจะขยายออก
อย่างไรก็ตาม ข้อมูลอักขระที่แยกวิเคราะห์ไม่ควรมีอักขระ &, < หรือ >; สิ่งเหล่านี้จำเป็นต้องแสดงโดย & < และ > หน่วยงาน ตามลำดับ
CDATA
CDATA หมายถึงข้อมูลอักขระ
CDATA เป็นข้อความที่จะไม่ถูกแยกวิเคราะห์โดย parser แท็กภายในข้อความจะไม่ถือเป็นมาร์กอัปและเอนทิตีจะไม่ถูกขยาย