Как связать XML-документ со своей схемой?
Как связать теперь созданную нами схему с теми XML-файлами, которые должны будут ей соответствовать? Дадим XSD-файлу нашей схемы имя chess.xsd и положим его в каталог ‘ToolBar/0809/XML/’ журнального сайта www.lki.ru. Добавим к нашему корневому элементу POSITION в XML-документе следующие атрибуты:
Как видите, вначале мы задействовали новое пространство имен с аббревиатурой xsi — уже не для определения схем, а для их экземпляров (XMLSchema-instance) и в рамках этого пространства имен присвоили атрибуту noNamespaceSchemaLocation URL нашей схемы.
Если бы мы захотели создать XSD-схему для второй версии нашего XML-словаря (напомню, в ней упор сделан на атрибуты элемента FIGURE), то ее отличия от данной схемы состояли бы лишь в том, что вместо элементов NAME, COLOR и PLACE составной тип FigureType описывал бы соответствующие атрибуты name, color и place:
XSD-атрибут use установлен для атрибутов наших шахматных фигур в значение «required», чтобы гарантировать обязательность их использования. Этим, собственно, и исчерпываются различия в схемах для двух версий нашего словаря шахматных позиций.
Достоинства и недостатки XML
Из нашего описания видны как достоинства, так и недостатки XML-стандарта. Достоинством является легкость восприятия такого описания. Его легко можно проанализировать даже без комментариев, легко исправить вручную. Так как формат текстовый, то он практически не зависит от платформы, на которой будет использован. Кодировка символьных строк, чисел и дат в нем оговорена заранее. Еще одним достоинством является иерархический характер описания информации. Это делает формат практически универсальным.
Недостатки вытекают все из того же текстового представления. Файлы имеют большой размер. Теговая разметка делает их особенно «рыхлыми». При представлении очень большого объема информации возникнут сложности с быстрым доступом к отдельным элементам, так как для анализа файла все содержимое придется помещать в оперативную память компьютера.
XML-cловарь шахматных позиций, первая версия
Попробуем теперь описать реальную позицию. Для определенности я возьму задачу-двухходовку Д. Шумера, опубликованную впервые в «Transvaal Leader» в 1906, и попытаюсь сконструировать XML-файл, ее описывающий.
Шахматная позиция (задача-двухходовка Шумера).
Табличное представление XML-документа (1-я версия).
Разберем теперь созданный нами XML-словарь для описания шахматных позиций. В данном формате используются необязательные элементы AUTHOR, SOURCE и NOTE для указания автора позиции, ее источника и краткого пояснения соответственно. Затем следует множество элементов FIGURE, каждый из которых описывает отдельную фигуру или пешку. На количество элементов FIGURE мы не накладываем здесь никаких ограничений. Каждый из этих элементов содержит в себе 3 вложенных элемента: NAME, COLOR и PLACE, описывающие соответственно название фигуры, ее цвет и положение на шахматной доске. Например, составной элемент … описывает черного короля на поле b8
Обратите внимание, что каждый из этих трех элементов используется в элементе FIGURE ровно один раз. В самом деле, бессмысленным будет описание фигуры, название, цвет или позиция которой не оговорены вообще или определены дважды
Строка <!— Описание шахматной позиции —> и другие аналогичные строки являются комментариями. В отличие от элемента NOTE, они не являются частью информации, передаваемой XML-форматом. Такие комментарии игнорируются всеми XML-анализаторами и нужны только разработчикам и людям, которые будут просматривать XML-файл глазами. Этим они напоминают комментарии, используемые в языках программирования.
Итак, используя общие принципы построения XML, определяющие лишь правила построения элементов, мы практически создали свой специализированный XML-словарь со своими, только этому словарю присущими элементами и со своими особыми правилами. Этим форматом теперь можно пользоваться для обмена шахматными позициями между различными приложениями. Это может понадобиться и для онлайновой игры в шахматы, и для заполнения какой-нибудь шахматной базы данных. Программисты смогут на основе наших правил произвести грамматический разбор (parsing) нашего файла и при необходимости представить его в виде, привычном для шахматистов (тестовая нотация, диаграмма).
Открытие файлов для редактирования
Иногда пользователю необходимо не только открыть файл XML, но и отредактировать его. Сделать это можно в простом приложении «Блокнот». Вот только работать там не очень удобно. Лучше сразу использовать более мощные инструменты:
- Notepad++;
- онлайн-сервисы.
Notepad++
Указанное приложение — классическая программа для работы с документами XML. В Notepad++ можно редактировать файлы и других форматов, например YML. Чтобы открыть нужный документ, необходимо воспользоваться следующим алгоритмом:
Запускаем Notepad++, нажимаем на кнопку «Файл» и в контекстном меню выбираем опцию «Открыть».
Находим нужный документ.
После этого можно вносить требуемые корректировки, добавлять или удалять теги. Программа выделяет корневую структуру, что упрощает работу с файлами XML.
Онлайн-сервисы
Сейчас создано множество ресурсов, позволяющих работать с разными документами онлайн. Например, некоторые сервисы помогут быстро открыть файлы PDF, DjVu и многих других форматов. Для редактирования и чтения XML чаще всего используют:
- XML Grid;
- TutorialsPoint.
Оба сайта дают возможность открыть и изменить документы с расширением XML в режиме онлайн. Естественно, без подключения к Интернету воспользоваться представленными инструментами не получится.
XML Grid
Очень простой и лаконичный ресурс. Открыть документ XML с его помощью можно в несколько кликов мышью:
Переходим на сайт XML Grid — xmlgrid.net и нажимаем на кнопку «Open File».
Кликаем на «Выберите файл».
Находим документ XML.
Выбираем опцию «Submit».
В итоге перед пользователем будет представлена нормальная табличная форма документа.
Чтобы отредактировать сам код и внести в него правки, нужно нажать на корневую ветку и выбрать опцию «Show XML Source Code».
Откроется новое окно, где и можно вести всю работу.
TutorialsPoint
Еще один удобный инструмент, позволяющий работать с файлами формата XML онлайн. Ресурс обладает интуитивным и приятным интерфейсом. Открыть нужный документ не составит никакого труда:
Заходим на сайт TutorialsPoint — tutorialspoint.com и нажимаем на кнопку «Online Tutors».
В открывшемся окне выбираем раздел «Tools».
Переходим в «XML Editor».
Нажимаем на кнопку «Загрузить файл» и выбираем опцию «Загрузить с компьютера».
Ищем документ.
После этого можно вносить нужные корректировки и изменять структуру файла.
При необходимости удастся загрузить документ XML не с компьютера, а со стороннего ресурса. Для этого в разделе «Загрузить файл» нужно указать адрес документа (URL) и нажать на кнопку Enter.
2.2 Использование
2.2.1 Внутренний DTD
Внутренняя декларация DOCTYPE
Синтаксис объявления элемента
-
Квантор
- +: указывает на одно или несколько вхождений, хотя бы один раз
- ?: указывает на 0 или 1 вхождение
- *: появляется любое количество раз
-
Синтаксис объявления свойства
- Тип атрибута: CDATA, который представляет символьные данные (символьные данные)
- Значение по умолчанию:
- # ТРЕБУЕТСЯ, которая должна появиться
- # ПРЕДПОЛАГАЕТСЯ, показывая, что это не нужно
пример
быть осторожен:
- Должен быть пробел между элементом и (
- Разница между PCDATA и CTATA
Смотрите для деталей;Разница между PCDATA и CDATA
2.2.2 Внешний DTD
*1. Создайте файл dtd
2. Создайте файл
3. Ввести формат
В XML имя элемента определяется разработчиком. Когда два разных документа используют одно и то же имя элемента, возникает конфликт имен. Когда два документа XML с одинаковым именем элемента используются вместе, анализатор XML не может определить, как справляться с такими конфликтами.
simpleType
Простые типы в основном используются для сужение типов (restriction)
Схема:
<?xml version="1.0"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:simpleType name="SalaryType"> <xs:restriction base="xs:decimal"> <xs:minInclusive value="10000"/> <xs:maxInclusive value="90000"/> </xs:restriction> </xs:simpleType> <xs:element name="Employee"> <xs:complexType> <xs:sequence> <xs:element name="Salary" type="SalaryType"/> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
XML:
<?xml version="1.0"?> <Employee xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <Salary>55000</Salary> </Employee>
Cужение типов (restriction)
С помощью сужение типов (restriction) Мы можем контролировать любой тип данных на наличие его значения то есть ограничивать его значения
Приме: Схема
<?xml version="1.0"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs:simpleType name="SalaryType"> <xs:restriction base="xs:decimal"> <xs:minInclusive value="10000"/> <xs:maxInclusive value="90000"/> </xs:restriction> </xs:simpleType> <xs:element name="Employee"> <xs:complexType> <xs:sequence> <xs:element name="Salary" type="SalaryType"/> </xs:sequence> </xs:complexType> </xs:element> </xs:schema>
XML:
<?xml version="1.0"?> <Employee xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <Salary>55000</Salary> </Employee>
Название фасетки | Описание |
---|---|
<maxExclusive> | Наибольшее значение, которое больше не входит в определяем тип |
<maxInclusive> | Наибольшее значение определяемого типа |
<minExclusive> | Наименьшее значение, которое больше не входит в Определяемый тип |
<minInclusive> | Наименьшее значение определяемого типа |
<totalDigits> | Общее количество цифр в определяемого числовом типе; сужение типа decimal |
<fractionDigits> | Количество цифр в дробной части числа |
<length> | Длина значений определяемого типа |
<maxLength> | Наибольшая длина значений определяемого типа |
<minLength> | Наименьшее длина значений определяемого типа |
<enumeration> | Одно из перечисленных значений |
<pattern> | Регулярное выражение |
<whiteSpace> | — — — |
В тегах-фасетка также могут иметь атрибуты. Эти атрибуты называют базисными фасетками (fundamental facets).
Среди них выделяют:
Базисная фасетка | Описание |
---|---|
ordered | Задает упорядоченность определяет моего типа и может принимать одно из следующих значений: False — тип неупорядоченный; Partial — тип частично упорядоченное; Total — тип полностью упорядочен. |
bounded | Задает ограниченность или неограниченность типа значением true или false |
cardinality | Задает конечность или бесконечность типа значением finite или countably infinite |
numeric | Показывает, значение является числовым типом. Может принимать значения true или false |
Пример:
<xs:simpleType name="Year"> <xs:restriction base="xs:gYear"> <xs:minInclusive value="1700"/> <!-- минимального введения значения года - 1700--> </xs:restriction> </xs:simpleType> <xs:simpleType name="DateType"> <xs:restriction base="xs:date"> <xs:minInclusive value="2003-01-01"/> <!-- минимальная дата --> <xs:maxInclusive value="2003-12-31"/> <!-- максимальная дата --> </xs:restriction> </xs:simpleType> <xs:simpleType name="TypeId"> <xs:restriction base="xs:integer"> <xs:minInclusive value="10000" /> <!-- минимальное значение >= 10 000 --> <xs:pattern value="{4}" /> <!-- шаблон на ввод --> </xs:restriction> </xs:simpleType> <xs:simpleType name="genderType"> <xs:restriction base="xs:string"> <xs:pattern value="male|female"/> <!--шаблон на ввод одного из двух значений--> </xs:restriction> </xs:simpleType>
Определение Big Data, или больших данных
К большим данным относят информацию, чей объем может быть свыше сотни терабайтов и петабайтов. Причем такая информация регулярно обновляется. В качестве примеров можно привести данные, поступающие из контакт-центров, медиа социальных сетей, данные о торгах фондовых бирж и т. п. Также в понятие «большие данные» иногда включают способы и методики их обработки.
Если же говорить о терминологии, то «Big Data» подразумевает не только данные как таковые, но и принципы обработки больших данных, возможность дальнейшего их использования, порядок обнаружения конкретного информационного блока в больших массивах. Вопросы, связанные с такими процессами, не теряют своей актуальности. Их решение носит важный характер для тех систем, которые многие годы генерировали и копили различную информацию.
Определение Big Data, или больших данных
Существуют критерии информации, определенные в 2001 году Meta Group, которые позволяют оценить, соответствуют ли данные понятию Big Data или нет:
- Volume (объем) — примерно 1 Петабайт и выше.
- Velocity (скорость) — генерация, поступление и обработка данных с высокой скоростью.
- Variety (разнообразие)— разнородность данных, различные форматы и возможное отсутствие структурированности.
Бесплатный онлайн-интенсив
Ваш Путь в IT начинается здесь
Подробнее
Следует отметить, что такие формулировки весьма условны, т. к. четкого и единого определения не существует. Есть даже мнение о необходимости отказа от термина «Big Data», т. к. происходит подмена понятий и Big Data часто путают с другими продуктами.
Структура XML
В реальности файл XML представляет собой хранилище данных – если сохранить его с расширением архива (.zip) и открыть в соответствующей программе, то станет видно много файлов с текстовой и прочей информацией:
- таблицами;
- ссылками;
- гиперссылками.
Это нужно для удобства хранения и безопасности – повредить безвозвратно всю информацию в нем значительно сложнее. Средний размер файлов допускает рассылку по электронной почте. Но главный плюс – легкость работы с данными. И веб-дизайнер, и верстальщик легко способны добиться требуемой структуры редактируемой страницы. Язык XML оптимизирован и стандартизирован, применение не зависит от установленной ОС, для использования не нужно лицензирование, нет никаких ограничений.
Минусы XML:
- Избыточный синтаксис ограничивает применение его в приложениях, которые требуют малого размера файлов и скоростной работы.
- Чрезмерная вариативность: одни и те же структуры представляются программистами по-разному.
- Нет поддержки типов данных.
- У XML большое число конкурентов – YAML, JSON и другие.
У пользователей редко возникает необходимость открывать файлы XML, но иногда приходится с ними сталкиваться. Изучение языка не займет много времени, а способов просмотра XML-файлов в любой ОС предостаточно. Скачать программы для открытия файлов XML можно на нашем сайте.
Мэппинг данных
Мэппинг (data mapping) – в общем случае процесс сопоставления данных исторических систем и системы-приемника. То есть, исходных данных и данных для загрузки.
Этап мэппинга — наиболее трудоёмкий этап и может занимать более 50% всех работ по задаче миграции.
На данном этапе в полной мере задействуется вся рабочая группа проекта по миграции.
В процессе мэппинга данных необходимо выделить подэтапы мэппинга таблиц и мэппинга полей.
·Мэппинг таблиц, или мэппинг шаблонов – сопоставление таблиц исходных данных и шаблонов данных для загрузки. Соответствие может быть как 1:1, так и N:N. В результате данной работы составляется и поддерживается реестр мэппинга таблиц. Данный подэтап необходим для следующего подэтапа мэппинга полей и для отслеживания общего состояния дел по мэппингу.
Примерное содержание реестра мэппинга таблиц может быть следующее:
Группа шаблонов 1С |
Наименование шаблона 1С |
Наименование файла- источника |
Правила формирования файла-источника |
Ответственный |
Статус |
Примечание |
НСИ |
Шаблон_ Номенклатура |
Номенк латура.xls |
• В системе N установить отбор • Сохранить в txt • Открыть в xls, колонки — текстовые • Первая строка — шапка • Кол-во столбцов — 15 • Сверить кол-во строк в txt и xls • Наименование листа всегда «Лист1» |
Иванов И.И. |
в работе |
·Мэппинг полей – сопоставление полей таблиц в рамках уже определенного мэппинга таблиц. Результатом данной работы является реестр мэппинга полей.
Примерное содержание реестра мэппинга полей может быть следующее:
№пп |
Кл. поле |
Обязательный |
Имя поля шаблона 1С «Шаблон_Номенклатура» |
Описание |
Имя поля «Номенклатура.xls» |
Алгоритм заполнения |
||||||||
Код |
Код элемента справочника |
Код |
||||||||||||
Наименование |
Наименование элемента справочника |
Наименование |
||||||||||||
Да |
Это группа |
Содержит одно из значений: • 1 – для групп • 0 – для элементов |
Если длина кода=11 символов и последние 4 символа <> «0000», то это элемент — «0», иначе группа — «1». |
|||||||||||
Полное наименование |
Наименование элемента справочника |
Наименование |
Если ЭтоГруппа =1 , То «», ИначеЕсли ЭтоГруппа=0, то Наименование. |
|||||||||||
В рамках данного этапа также следует провести возможные работы по нормализации данных.
Официальные редакторы для открытия XML
Список программ, специализирующихся на взаимодействии с XML огромен, из-за чего невозможно перечислить и половины вариантов. А потому – инструкция по использованию на примере XML Marker, бесплатно распространяемом инструменте, воспринимаемом разную кодировку, подсвечивающем синтаксис, отображающем одновременно и древо документа, и всю текстовую информацию. Кроме того, разработчики обещают автоматические обновления, исправляющие некоторые ошибки и недоработки, целую коллекцию дополнительных советов и рекомендаций, позволяющих, к примеру, избавиться от каких-нибудь ошибок при вводе (даже некоторые неправильно заданные теги в конце информационного кода могут привести к проблемам при воспроизведении).
Из дополнительных плюсов – поддержка разных языков, возможность менять формат, а еще – невероятная скорость обработки данных (даже состоящие из тысячи ячеек таблицы открываются за считанные секунды). И, раз уж подобный редактор настолько всесилен, почему бы не приступить к установке?
На открывшейся странице остается лишь выбрать необходимую для загрузки версию. Доступно несколько вариантов – и совсем «древние» и «тестируемые», и последние со всеми необходимыми обновлениями. Вариантов, с какого сервера все сохранять, тоже несколько – тут уж дело вкуса (в любом случае, дистрибутив весит всего несколько десятков мегабайт).
2. Дальше – запустить дистрибутив, прочитать строки приветствия, нажать Next.
Принять все лицензии и пользовательское соглашение.
Выбрать папку для установки (какой-то гигантской разницы нет).
Последний этап – выбрать, нужны ли ярлыки на рабочем столе и в меню «Пуск», и стоит ли ассоциировать формат «XML» с программой. Если подобной необходимости нет, то все галочки можно спокойно поснимать.
После завершения установки останется лишь запустить инструмент и приступить к непосредственному использованию.
3. Итак, для запуска нужного файла нужно нажать на пункт «File» и вызвать выпадающее меню, затем – кликнуть на «Open» для непосредственного перехода к поиску.
После открытия на экране появится все сохраненная в документе информация, с поддержкой всех атрибутов и тегов. Кроме того, любые данные разрешат править и изменять, а затем – просматривать визуальные копии в дополнительном окне.
Ну, и коротко о ключевых возможностей. Слева – иерархия всех данных (какие теги складываются, какая информация важнее и все остальное), справа – выделенный код, снизу – отображение. Если появятся какие-то ошибки, то система сразу же обо всем предупредит, да еще и выделит место, где нужны срочные изменения.
В общем, идеальный инструмент для тех, кто не просто что-то открывает, а реально взаимодействует и применяет.
Из минусов – цена. Разработчики предлагают или абонентскую плату с переводом денег каждый месяц, или одноразовый платеж. Впрочем, опробовать инструмент можно совершенно бесплатно без функциональных ограничений, но на основе пробного периода.
Чем открыть расширение XML?
Такой файл может создаваться совершенно разными программами, и он используется для обмена данными или для создания баз данных . Этот файл представляет собой текстовый документ, где все данные разделены с помощью тегов. Он очень похож на HTML, только теги задаёт сам пользователь, их количество не ограничено. Но как открыть XML-файл в читаемом виде?
Рассмотрим несколько возможных способов:
Редактировать файл можно очень легко в любом из доступных вам инструментов, описанных выше. То есть можно использовать и блокноты, и Excel. Но конечно же, лучше использовать специализированное программное обеспечение, например, XML Marker. Его можно бесплатно скачать, затем установить на свой компьютер или ноутбук.
Расширение.xml присуще файлам с текстовыми данными в формате XML.
Изначально язык создавался для использования во «всемирной паутине». Разработчики хотели сделать из него достойную замену HTML, но задумка у них не получилась. В результате XML оказался на своем теперешнем месте. Расширяемым языком разметки eXtensible Markup Language описывается документ и софт (реже), который выполняет чтение таких файлов.
Язык XML имеет простой синтаксис. Его удобно использовать в процессе создания документов для быстрой обработки в программах качественного чтения в интернете. Разработчики выбирают этот язык за его простоту, расширяемость, удобство. Заметим, что XML базируется на кодировках Юникод. Язык имеет способность к свободному расширению разметки (ограничения есть только в синтаксических правилах языка), поэтому он и называется расширяемым. Разработчик сможет применить его для решения почти любых задач.
Сейчас XML приобрел огромную популярность в Интернете. Нередко это расширение используется в документообороте. Заметим, что именно XML стал «прародителем» многих современных форматов, например, (знаком любителям электронных книг) или YML.
Как совершить процесс открытия?
Многие спрашивают, какие есть программы для чтения файлов XML формата, открыть его можно в браузере. Для этого можно использовать, например, Mozilla Firefox (в этом случае нужно выбрать версию с плагином XML Viewer) или Internet Explorer. Чтобы просмотреть файл, который имеет расширение.xml, на своем компьютере через браузер, нужно запустить его, нажать комбинацию клавиш «Ctrl+O» (если ваш ПК управляется операционной системой MacOS, то нужно использовать сочетание клавиш «Command+O»). После этого вы выбираете тот xml-файл, который вам необходим, и нажимаете «ENTER». Любой документ, который имеет расширение.xml, также открывается с помощью текстового редактора. Например, в просмотре и редактировании вам поможет notepad. Разработчики такого расширения рекомендуют открывать xml-файл с использованием такого софта, для которого он был создан.
Примечание: Мы стараемся как можно оперативнее обеспечивать вас актуальными справочными материалами на вашем языке. Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки
Для нас важно, чтобы эта статья была вам полезна. Просим вас уделить пару секунд и сообщить, помогла ли она вам, с помощью кнопок внизу страницы
Для удобства также приводим ссылку на оригинал (на английском языке).
Вероятно, вы слышали о языке XML и вам известно множество причин, по которым его необходимо использовать в вашей организации. Но что именно представляет собой XML? В этой статье объясняется, что такое XML и как он работает.
Элементы и атрибуты
Даже на основе этой «пустышки» можно сделать немало выводов об устройстве XML-языка. Прежде всего, XML представляет собой простой текстовый файл, легко читаемый как машиной, так и человеком. В первой (заголовочной) строке указывается, что создаваемый файл будет соответствовать стандарту XML версии 1.0 и что для текстовой информации будет использоваться одна из самых универсальных и потому популярных сегодня в Интернете кодировок — UTF-8. Версия и кодировка заданы с помощью атрибутов version и encoding, аналогичных тем, что применяются в языке разметки HTML. Подробнее формат атрибутов мы обсудим ниже. Сейчас замечу лишь, что в заголовочной строке XML-файла атрибут кодировки encoding не является обязательным. При его отсутствии используется кодировка, принятая по умолчанию, то есть все та же UTF-8. Если вы намерены обмениваться XML-файлами лишь между компьютерами с операционной системой Windows и не планируете включать в эти файлы китайские иероглифы или немецкие буквы с умлаутами, то ничто не мешает вам установить русскую кодировку, принятую в Windows:
Пара тегов <POSITION> и </POSITION>, с которых начнется иерархическое построение нашей шахматной позиции, определяет здесь корневой элемент. Следует всегда помнить, что корневой элемент в любом XML-документе должен встречаться ровно один раз. XML-документ, таким образом, напоминает дерево, у которого ровно один ствол, от которого могут произвольным образом ветвиться отростки — дочерние элементы.
Что же такое элемент XML? С точки зрения синтаксиса языка — это пара из открывающего и закрывающего тегов и всего того, что между ними заключено. Элемент может иметь значение, атрибуты и содержать в себе другие элементы. Так, например, в строке <LETTER font=«Currier» size=«12»>альфа</LETTER> элемент LETTER имеет значение «альфа» и два атрибута: font со значением «Currier» и size со значением 12. Атрибуты, как видно из данного примера, определяются всегда в открывающем теге и отделяются друг от друга пробелами. Формат их прост: название, знак равенства и в кавычках (одинарных или двойных) — значение.
Это важно: в языке XML, в отличие от более терпимого HTML, каждый начинающий тег обязательно должен сопровождаться тегом завершающим. Как и в HTML, пары тегов не должны перехлестываться
Это означает, что конструкция типа допустима (элемент B здесь является составной частью элемента A), а конструкция — запрещена стандартом. Язык XML допускает для пустого элемента вместо пары тегов использовать одиночный тег с наклонной чертой у конечной, а не начальной угловой скобки. Например, пустую шахматную позицию, доску без фигур, мы могли бы изобразить так:
Как и в HTML, пары тегов не должны перехлестываться. Это означает, что конструкция типа <A><B> </B></A> допустима (элемент B здесь является составной частью элемента A), а конструкция <A><B></A></B> — запрещена стандартом. Язык XML допускает для пустого элемента вместо пары тегов <A> </A> использовать одиночный тег <A/> с наклонной чертой у конечной, а не начальной угловой скобки. Например, пустую шахматную позицию, доску без фигур, мы могли бы изобразить так:
Это важно: XML чувствителен к регистру букв в именах элементов и атрибутов. Так, элементы POSITION и position будут восприниматься языком как различные! Этим язык XML существенно отличается от HTML
Так, элементы POSITION и position будут восприниматься языком как различные! Этим язык XML существенно отличается от HTML.
XML-cловарь шахматных позиций, вторая версия
Что касается «рыхлости» представления информации, то ее в данном случае можно снизить, используя атрибуты, а не элементы для описания названия, цвета и положения шахматных фигур. Создадим альтернативный XML-словарь следующим образом:
Табличное представление XML-документа (2-я версия).
Здесь, как и в первом варианте XML-словаря, каждая фигура описывается элементом FIGURE, однако теперь этот элемент не обладает ни значением, ни вложенными элементами (потому он и представлен одинарным тегом с завершающей наклонной чертой <FIGURE />). Вложенные элементы заменили 3 атрибута, определяющие те же самые характеристики: name (наименование), color (цвет) и place (местоположение на шахматной доске).
Устанавливаем правила
Строго говоря, созданные нами два варианта XML-форматов для описания шахматных позиций XML-словарями пока не являются. Это лишь примеры того, как эти словари должны быть организованы. Мы как бы построили XML-словари в своей голове. Мы придумали структуру, или набор правил, которые должны соблюдаться. Теперь нам осталось добиться, чтобы их поняли и другие люди, которые будут присылать нам данные в одном из этих форматов и которые будут писать программы для их грамматического разбора.