Дополнительные элементы и функции
В этой главе разбираются дополнительные элементы и функции языка XSLT, которые выполняют в преобразованиях различные задачи, непосредственно не связанные с созданием узлов выходящего документа. Дополнительные элементы и функции XSLT расширяют возможности преобразования, предоставляя разного рода вспомогательный сервис.
К дополнительным элементам XSLT мы отнесем следующие:
□ xsl:preserve-space и xsl:strip-space — работа с пробельными символами;
□ xsl:message — сообщения процессора;
□ xsl:sort — сортировка множеств перед обработкой;
□ xsl:namespace-alias — определение псевдонимов пространств имен;
□ xsl:key — определение ключей;
□ xsl:number — нумерация;
□ xsl:decimal-format — определение десятичного формата;
□ xsl:output — контроль сериализации.
В XSLT также определяются дополнительные функции, расширяющие базовую библиотеку функций XPath:
□ key — использование ключей;
□ format-number — форматирование чисел;
□ document — обращение к внешним документам;
□ current — обращение к текущему узлу преобразования;
□ unparsed-entity-uri — получение URI неразбираемой сущности по ее имени;
□ generate-id — генерация уникального идентификатора узла документа;
□ system-property — получение информации о свойствах системы, окружения.
Обработка пробельных символов
В XSLT выделяются четыре пробельных символа, обработка которых несколько отличается от обработки других символов. Их Unicode-коды и описания сведены в табл. 8.1.
Таблица 8.1 . Unicode-коды пробельных символов
| Unicode-коды | Описание | |
| Десятичный | Шестнадцатеричный | |
| #9 | #x9 | Горизонтальная табуляция |
| #10 | #xA | Перевод строки |
| #13 | #xD | Возврат каретки |
| #32 | #x20 | Пробел |
Отличие обработки пробельных символов заключается в том, что после разбора и создания логической модели для входящего документа и для самого преобразования, узлы, которые содержат только пробельные символы, будут удалены из дерева.
Пример
Рассмотрим шаблон преобразования, содержащий пробельные символы ("□" обозначает пробел, а "¶" — перевод строки).
Листинг 8.1. Шаблон преобразования с пробельными символами
¶
□□□¶
□□□¶
□□□□□□□□□¶
□□□□□□¶
□□□□□□□□□¶
¶
Поскольку текстовые узлы этого шаблона содержат только пробельные символы, они будут удалены из дерева преобразования, и результат будет иметь вид:
Вообще, текстовый узел будет сохранен при выполнении хотя бы одного из следующих условий.
□ Он содержит хотя бы один непробельный символ.
□ Он принадлежит элементу, в котором сохранение пробельных символов задано средствами XML, а именно атрибутом xml:space со значением preserve.
□ Он принадлежит элементу, имя которого включено во множество имен элементов, для которых нужно сохранять пробельные символы.
Во всех остальных случаях текстовый узел будет удален.
Продемонстрируем все три случая сохранения текстового узла на примерах.
Первый случай довольно прост. Шаблон
¶
¶
создаст в выходящем документе фрагмент
<а/>
безо всяких пробельных символов, в то время как шаблон
¶
¶
создаст фрагмент вида
¶
¶
¶
Различие двух этих шаблонов в том, что в первом текстовые узлы содержат текст "¶ ¶ □□" и "¶ ¶ " соответственно, а во втором — "¶ ¶ □□|" и "| ¶ ¶". Текстовые узлы второго шаблона не будут удалены, поскольку они содержат непробельные символы (символы "|").
Второй случай сохранения текстовых узлов основан на использовании возможностей XML по управлению пробельными символами. Если в элементе задан атрибут xml:space со значением "preserve", обрабатывающее программное обеспечение должно сохранять в нем и в его потомках пробельные символы. Единственным исключением из этого правила может быть опять же атрибут xml:space, заданный в элементе-потомке со значением "default".
Пример
Шаблон
□□<а>¶
□□□□¶
□□□□□□
□□□□□□□□
□□□□□□¶
□□□□¶
□□¶
создаст в выходящем документе фрагмент вида:
Если же шаблон будет определен в виде:
□□<а xml:space="preserve">¶
□□□□¶
□□□□□□
□□□□□□□□
□□□□□□¶
□□□□¶
□□¶
то в выходящем фрагменте в элементах а и b пробельные символы будут сохранены, а в элементах с и d — удалены:
<а xml:space="preserve">¶
□□□□¶
□□□□□□
□□□□¶
□□а>
В третьем случае сохранение пробельных символов текстового узла зависит от того, принадлежит ли имя родительского элемента особому множеству, называемому множеством имен элементов, для которых следует сохранять пробельные символы или, для краткости, сохраняющее множество.
Для преобразований сохраняющее множество состоит из единственного элемента xsl:text, то есть единственный элемент в преобразовании, для которого пробельные текстовые узлы не будут удаляться, — это элемент xsl:text. Поэтому его часто используют для вывода в выходящем документе пробельных символов.
Для входящих документов сохраняющее множество состоит из имен всех элементов. То есть по умолчанию преобразования сохраняют все пробельные текстовые узлы. Для изменения сохраняющего множества элементов входящего документа используются элементы xsl:preserve-space и xsl:strip-space.
Элементы
xsl:preserve-space
и
xsl:strip-space
Синтаксические конструкции этих элементов очень похожи:
elements =" токены "/>
elements =" токены "/>
Элемент xsl:preserve-space добавляет, a xsl:strip-space удаляет имя элемента из сохраняющего множества входящего документа. Пример
Предположим, нам нужно сохранять пробельные символы во всех элементах d и удалять их в элементах с. Тогда в преобразовании достаточно указать
Вообще, обязательные атрибуты elements элементов xsl:strip-space и xsl:preserve-space содержат не сами имена элементов, а так называемые проверки имен. Проверка имени имеет три варианта синтаксиса.
□ Синтаксис "*" используется для выбора произвольных имен. Ей будут соответствовать любые имена элементов.
□ Синтаксис " имя " используется для выбора элементов с заданным именем. К примеру, проверке имени "d" будут соответствовать все элементы с именем "d".
□ Синтаксис " префикс :*" используется для выбора всех элементов в данном пространстве имен. К примеру, если в документе определен префикс пространства имен upr в виде атрибута xmlns:upr="http://www.upr.com", проверке имени "upr:*" будут соответствовать все элементы пространства имен, определяемого идентификатором "http://www.upr.com". Пример
Предположим, что нам необходимо сохранить пробельные символы в элементе с именем с и удалить их в элементе e и элементах, принадлежащих пространству имен, определяемому идентификатором "urn:d". Листинг 8.2. Входящий документ
<а xmlns:d="urn:d">¶
□□
□□□□
□□□□□□¶
□□□□¶
□□¶
Листинг 8.3. Преобразование
version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
xmlns:t="urn:d"/>
Листинг 8.4. Выходящий документ
□□
□□□□□□
□□□□¶
Сообщения процессора
По большому счету, мы не можем контролировать процесс преобразования. Процессор может сам выбирать, как и в какой последовательности он будет выполнять те или иные шаблоны — таковы особенности декларативного программирования. Вместе с тем мы все-таки можем получить кое-какую информацию о ходе преобразования, используя механизм, называемый в XSLT сообщениями.
Элемент
xsl:message
Синтаксис этого элемента дан ниже:
terminate="yes" | "no">
Элемент xsl:message указывает процессору на то, что он должен вывести сообщение, которое является результатом обработки шаблона, содержащегося в этом элементе. Механизм вывода сообщения зависит от реализации того или иного процессора и может быть различным — от вывода текста сообщения на экран до вызова внешнего модуля для обработки сообщения.
Пример
Иногда в процессе отладки преобразования бывает полезно выводить сообщения о том, какой элемент обрабатывается в данный момент.
Листинг 8.5. Входящий документ
Листинг 8.6. Преобразование
version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
Листинг 8.7. Выходящий документ
Листинг 8.8. Сообщения процессора
Processing element a.
Processing element b which has a parent element a.
Processing element с which has a parent element b.
Processing element d which has a parent element c.
Атрибут terminate указывает на то, должен ли процессор прекратить дальнейшую обработку документа или нет. Значением этого атрибута по умолчанию является "no", что означает, что процессор должен просто вывести сообщения и продолжать дальнейшее выполнение шаблона. Если же в xsl:message указано terminate="yes", то процессор, выведя сообщение, прервет обработку. Этот прием может использоваться, например, для того, чтобы проверять входящие документы на соответствие определенной схеме.
Пример
При помощи xsl:message мы можем запретить обработку документов, которые не имеют в корне элемент с именем "html" в любом регистре символов.
Листинг 8.9. Шаблон преобразования
Если мы будем обрабатывать документ вида
обработка не будет прервана, в то время как преобразование документа
будет прервано сообщением:
Document has no root HTML element:
Processing terminated using xsl:message