Трансформация XML документов — страница 6

  • Просмотров 3801
  • Скачиваний 306
  • Размер файла 49
    Кб

рабочих проектов новых языков, находящихся на рассмотрении W3C, постоянно пополняется. 2. Структура XML-документа Хотя XML, сильно отличается по своим возможностям и предназначению от языка гипертекстовой разметки, оба эти языка являются подмножествами SGML, и, следовательно, наследуют его базовые принципы. Простейший XML-документ может выглядеть так: <?xml version="1.0"?> <list_of_items> <item id="1"> <first/>Первый</item> <item

id="2">Второй <sub_item>подпункт 1</sub_item> </item><item id="3">Третий</item> <item id="4"><last/>Последний</item> </list_of_items> Этот документ очень похож на обычную HTML-страницу. Так же, как и в HTML, инструкции, заключенные в угловые скобки называются тэгами и служат для разметки основного текста документа. В XML существуют открывающие, закрывающие и пустые тэги (в HTML понятие пустого тэга тоже существует, но специального его

обозначения не требуется). Тело документа XML состоит из элементов разметки(markup) и непосредственно содержимого документа - данных(content). XML - тэги предназначены для определения элементов документа, их атрибутов и других конструкций языка. Любой XML-документ должен всегда начинаться с инструкции <?xml?>, внутри которой также можно задавать номер версии языка, номер кодовой страницы и другие параметры, необходимые

программе-анализатору в процессе разбора документа. В общем случае XML-документы должны удовлетворять следующим требованиям: В заголовке документа помещается объявление XML, в котором указывается язык разметки документа, номер его версии и дополнительная информация; Каждый открывающий тэг, определяющий некоторую область данных в документе обязательно должен иметь закрывающий тэг; В XML учитывается регистр символов ; Все

значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки; Вложенность тэгов в XML строго контролируется, поэтому необходимо следить за порядком следования открывающих и закрывающих тэгов; Вся информация, располагающаяся между начальным и конечными тэгами, рассматривается в XML как данные, и поэтому учитываются все символы форматирования (т.е. пробелы, переводы строк, табуляции не игнорируются, как в

HTML). Если XML-документ не нарушает приведенные правила, то он называется формально-правильным и все анализаторы, предназначенные для разбора XML- документов, смогут работать с ним корректно. Однако кроме проверки на формальное соответствие грамматике языка, в документе могут присутствовать средства контроля над содержанием документа, за соблюдением правил, определяющих необходимые соотношений между элементами и формирующих