Технология XSLT - страница 13

стр.

Следующий текст в документе

>Покупайте наших слонов!

будет воспринят как разметка. Для того чтобы избежать этого, достаточно написать

>Покупайте наших слонов!]]>

Такая конструкция уже будет воспринята как символьные данные. Другим примером может быть использование символов "><" и ">&":

>

Секции символьных данных задаются четырьмя довольно простыми правилами:

>[18] CDSect  ::= CDStart CData CDEnd

>[19] CDStart ::= '

>[20] CData   ::= Char* - (Char* ']]>' Char*))

>[21] CDEnd   ::= ']]>'

Содержимое секции символьных данных, отвечающее продукции CData, может состоять из любых символов, в том числе "><" и ">&", которые не будут восприниматься как разметка. Единственное, чего секции CDATA не могут включать — это последовательность ">]]>", которая завершает символьную секцию.

Комментарии (comments)

XML-документ может содержать комментарии, которые записываются следующим образом:

>

Текст комментария может состоять из любых символов, кроме двух минусов

подряд (">--"). Кроме этого, комментарий не должен заканчиваться символом ">-" .

Пример комментария:

>...

>

>...

Продукция комментария называется в XML >Comment и имеет следующий вид:

>[15] Comment ::= ''

Выражение >((Char - '-') | ('-' (Char - '-')))* означает, что содержимое комментария не должно оканчиваться на знак ">-" или содержать два таких знака последовательно.

Пространства имён

XML позволяет создавать наборы элементов с любыми синтаксически допустимыми именами и определять с их помощью логическую структуру документов практически произвольной сложности.

За время существования XML была создана разметка для большого числа задач. На таких Web-сайтах, как http://www.xml.org, http://www.schema.net и http://www.ebxml.org можно с большой вероятностью найти определения структуры документов для огромного количества предметных областей. Во многих случаях уже созданные схемы помогут сократить этап концептуального моделирования документов.

Часто случается, что различные логические схемы документов используют одни и те же имена элементов в различных смыслах. Это не является проблемой, если в документе используется только одна схема. Но представьте себе ситуацию, когда в одном и том же документе необходимо использовать элементы нескольких различных схем — будет попросту невозможно определить, какой элемент относится к какой схеме, и, вообще, какие схемы были использованы в документе. Для решения этих проблем в XML используются пространства имен (англ. namespaces).

Чтобы различать схемы документов, каждой из них ставится в соответствие уникальный идентификатор ресурса (URI). Две схемы будут считаться тождественными тогда и только тогда, когда их уникальные идентификаторы будут совпадать, поэтому нужно осторожно выбирать URI для создаваемой схемы документа. Очень часто в качестве URI используются URL различных Web-сайтов. Это совсем не означает, что по указанному адресу должно что-либо находиться, просто такой способ практически гарантирует уникальность — вряд ли кому придет в голову использовать адрес чужого сервера в качестве идентификатора своей схемы.

Пример

Уникальный идентификатор языка XSLT, которому посвящена эта книга, имеет вид:

>http://www.w3.org/1999/XSL/Transform

Для того чтобы определить, какой схеме принадлежит тот или иной элемент в документе, можно использовать механизм префиксов. Префиксы пространств имен задаются как атрибуты с именами, начинающимися последовательностью >xmlns, и имеют следующий вид:

><префикс:элемент xmlns:префикс="URI">

> ...

>префикс:элемент>

Пример

В XSLT чаще всего используется префикс >xsl, который задается, как правило, следующим образом:

>

> xmlns:xsl="http://www.w3.org/1999/XSL/Transform"

> version="1.0">

> ...

>

При этом ничто не мешает использовать любой другой префикс. Например, следующий фрагмент документа будет совершенно идентичен предыдущему:

>

> xmlns:www="http://www.w3.org/1999/XSL/Transform"