Hiện nay người ta hay sử dụng JSON hơn là XML nhưng mình đã có một loạt bài viết về JSON rồi nên trong loạt bài viết này ta sẽ khám phá về XML. Bài tiên phong này ta sẽ tìm hiểu và khám phá khái niệm về XML là gì và cách tạo một file XML đơn thuần .

Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.
Bạn đang đọc: Bài 01: XML là gì? Cú pháp căn bản của XML
Mục lục
1. XML là gì ?
XML là viết tắt của từ eXtensible Markup Language, hay còn gọi là ngôn ngữ đánh dấu mở rộng do W3C đề nghị với mục đích tạo ra các ngôn ngữ đánh dấu khác. Đây là một tập hợp con đơn giản có thể mô tả nhiều loại dữ liệu khác nhau nên rất hữu ích trong việc chia sẻ dữ liệu giữa các hệ thống. Ví dụ khi bạn xây dựng một ứng dụng bằng C# và một ứng dụng bằng PHP thì hai ngôn ngữ này không thể hiểu nhau, vì vậy ta sẽ sử dụng XML để trao đổi dữ liệu.
Tất cả những đặc tả tài liệu XML đều phải tuân theo quy luật và cú pháp của nó nên phần đông những file XML đều rất nghiêm khắc trong việc biên dịch. Tuy nhiên công nghệ tiên tiến này cần phải được xem xét do tại trong quy trình thao tác và truyền tài liệu nó có tỉ lệ sai sót lên tới 5 % – 7 %. Con số này không cao nhưng cũng rất đáng để cân nhức khi sử dụng .
Điển hình nhất là ngôn từ ghi lại siêu văn bản HTML sử dụng cú pháp của XML để tạo nên và nó có những bộ thành phần và thuộc tính không mềm dẻo nên chỉ có công dụng trong việc trình diễn tài liệu trên trình duyệt Browser .
Để rõ hơn về khái niệm XML là gì thì bạn nên đọc ở bài viết trên Wiki nhé .
2. Cú pháp của tài liệu XML
Nếu bạn đã học qua HTML rồi thì rất thuận tiện hiểu cú pháp của XML chính do HTML được thiết kế xây dựng dựa trên cú pháp của XML .
File XML sẽ có phần mở rộng là .xml
. Tuy nhiên bạn hoàn toàn có thể sử dụng ngôn ngữ lập trình để thay đổi phần mở rộng cho nó (sẽ tìm hiểu sau).
Cú pháp của thẻ XML:
XML được thiết kế xây dựng dựa vào cấu trúc NODE lồng nhau, mỗi node sẽ có một thẻ mở và một thẻ đóng như sau :
nội dung
Trong đó :
là thẻ mở, tên của thẻ này do bạn tự định nghĩa.
là thẻ đóng, tên của thẻ này phải trùng với tên của thẻ mở.
content
là nội dung của thẻ nàyVí dụ mình tàng trữ domain của mình thì cấu trúc như sau :
freetuts.net
Bạn hoàn toàn có thể bổ sung các thuộc tính vào các thẻ XML bằng cách sử dụng cú pháp sau:
content
Ví dụ bạn tàng trữ thông tin domain và chủ sở hữu của nó thì hoàn toàn có thể lưu như sau :
freetuts.net
Khai báo Header (Chỉ thị xử lý):
Trên đầu mỗi file XML bạn phải khai báo một thẻ để thông tin version XML đang sử dụng ( thường là version 1.0 ), và còn hoàn toàn có thể chứa những thông tin về mã hóa ký tự hoặc những phụ thuộc vào bên ngoài khác ( sẽ tìm hiểu và khám phá sau ). Giá trị của encoding ( kiểu mã hóa ký tự ) thuộc một trong những định dạng sau : UTF-8, UTF-16, ISO-10646-UCS-2, ISO-10646-UCS-4, ISO-8859-1 to ISO-8859-9, ISO-2022-JP, Shift_JIS, EUC-JP .
Cú pháp của thẻ thông tư giải quyết và xử lý như sau :
Như vậy với những ví dụ trên thì cấu trúc đúng sẽ phải là :
freetuts.net
Và :
freetuts.net
Root node:
Mỗi tài liệu XML nên có một thẻ ngoài cùng và ta gọi thẻ này là root node. Thẻ này sẽ khai báo tên chính của tài liệu XML.
Ví dụ mình cần tàng trữ list domain thì hoàn toàn có thể viết như sau :
freetuts.net qa.freetuts.net
Không có một quy tắc đặt tên nào cả mà quy tắt do lập trình viên đặt ra, tuy nhiên lời khuyên là bạn nên đặt tên sao cho ngữ nghĩa tương thích với nội dung của file .
Phần này tất cả chúng ta sẽ tìm hiểu và khám phá rõ hơn ở bài tiếp theo .
3. Lời kết
Về khái niệm XML là gì thì bạn nên tìm hiểu thêm thêm ở trang trên trang W3C, riêng với bài thứ nhất này mục tiêu là ra mắt cú pháp cơ bản của một tài liệu XML nên mình không viết nhiều. Bài tiếp theo tất cả chúng ta sẽ khám phá cấu trúc cây của tài liệu XML .
Source: https://vn.exp.gg
Category: Thông tin