Стандарты ODA и SGML
Автор работы: Пользователь скрыл имя, 28 Декабря 2010 в 07:43, реферат
Краткое описание
Современный уровень развития компьютерной техники обеспечивает существование и повсеместное распространение информационных технологий, позволяющих преобразовывать документную информацию в электронный вид. От повышения оперативности и четкости в работе с документами во многом зависит эффективность работы организации в целом. В последнее время на смену бумажным документам стремительно приходит электронный документооборот и вводится понятие электронного документа как документа, «в котором информация представлена в электронно-цифровой
форме».
Содержание работы
Введение 3
Глава 1. Object Data Base Markup Language 4
1.1 Основные положения 4
1.2 Технология ODA 6
1.3 Практическое применение 7
Глава 2. Стандарт SGML 9
2.1 Что такое SGML 9
2.2 Терминология 11
2.3 Особенности SGML 12
Заключение 16
Список литературы 17
Содержимое работы - 1 файл
МИР РЕФЕРАТ.docx
— 55.27 Кб (Скачать файл)
Глава
2. Стандарт SGML
2.1
Что такое SGML
Стандарт ISO 8879 Information Processing - Text and Office System - Standard Generalized Markup Language (SGML) определяет обобщенный стандартный язык разметки текста, способ описания структуры документа, а также формат вставляемых в документ описательных меток. С точки зрения стандарта SGML, документ рассматривается как совокупность:
- содержания (информации, содержащейся в документе в текстовой, графической и мультимедийной форме);
- данных о структуре документа (взаимосвязи глав, разделов, параграфов, ссылок, прав доступа к элементам документа);
- данных о стиле оформления документа (используемых шрифтах, интервалах, размерах полей, способе нумерации и т.д.).
Структура документа задается при помощи таблицы «Определения типа документа» (DTD) (в терминах стандарта – Document Type Definition), описывающего его структуру. В DTD указывают соответствие символов и их кодов, максимальные длины используемых идентификаторов, способ представления ограничителей для тегов, другие возможные соглашения, синтаксис DTD, а также тип и версию документа. DTD задает взаимосвязь глав, заголовков глав, разделов и других фрагментов текста, образующих документ. Стандарт SGML устанавливает такие множества символов и правил для представления информации, которые позволяют различным системам правильно распознавать и идентифицировать эту информацию, следовательно, SGML можно назвать метаязыком для семейства конкретных языков разметки. В частности, подмножествами SGML можно считать языки разметки XML (Extensible Markup Language - расширяемый язык описания документа) и HTML. При этом XML более удобен, чем SGML: легче воспринимается, приспособлен для использования в современных браузерах, сохраняет возможности SGML.
Для конкретных приложений создаются свои варианты (словари) XML. Известны варианты для математики, химии, медицины. Применение стандарта SGML для создания структурированных документов дает значительные преимущества. Фактически документ преобразуется в базу данных, допускающую манипуляции с элементами документа в соответствии с заданным DTD. В свою очередь, DTD разрабатывается в соответствии с назначением документа.
Стандарт ISO/IEC 10179 Document Style Semantics and Specification Language (DSSSL) определяет язык для описания правил и формата отображения SGML-документов при выводе на экран, печать или иное устройство отображения.
Сегодня все чаще можно встретить аббревиатуру SGML. Многие виды документации поставляются в формате SGML. Популярный язык разметки Web-страниц HTML является приложением SGML.
Стандарт SGML (ISO 8879). SGML - Standard Generalized Markup Language, стандартный обобщенный язык разметки. Разработан компанией IBM в 80-е гг. для составления электронной документации на системы вооружения Министерства обороны США.
Стандарт предназначен для унификации представления документации в автоматизированных системах. Первоначально ориентирован на текстовые данные, но охватывает и гипермедиа.
Появляется все больше прикладных программ для работы с SGML: редакторы, средства форматирования, системы документооборота, использующие SGML в качестве формата хранения документов... SGML-продукты выпускают Adobe, Corel, SoftQuad, Microsoft. В SGML готовятся книги издательства O'Reilly, техническая документация IBM, Sun и OSF. Основывается на SGML информационная технология многих ведущих машиностроительных и авиакосмических фирм всего мира.
Появившаяся в начале восьмидесятых SGML-технология
переживает сейчас период расцвета. Что
это такое? Что она дает своим пользователям?
Как с ней работать? На эти и другие вопросы
я пытаюсь ответить этой статьей.
2.2
Терминология
SGML (Generalized Markup Language) разработан в недрах вездесущей корпорации IBM. Его наследник SGML (Standard Generalized Markup Language) принят в 1986 году в качестве международного стандарта[1] для определения независимых от устройств ввода/вывода, независимых от вычислительной среды методов представления текстов в электронной форме. Более точно, SGML -- это метаязык, то есть средство формального описания языка, в данном случае, языка разметки.
Исторически
слово разметка использовалось для
описаний аннотаций или других обозначений
внутри текста, предназначенных для
указаний составителю или "верстальщику"
того, как именно конкретное место
должно быть напечатано или сверстано.
Примеры включают подчеркивание
волнистой чертой, обозначающее курсив,
специальные значки для пропуска
фраз или их печати конкретным шрифтом,
и так далее. Когда форматирование
и печать текстов стали
Обобщая, разметку, или кодировку, определяют как любое средство сделать явным интерпретацию текста. На банальном уровне все напечатанные тексты кодированы в этом смысле: знаки препинания, использование заглавных букв, расположение букв по странице, даже интервалы между словами можно считать в какой-то степени разметкой, функция которой -- помочь человеку, читающему текст, определить, где кончается одно слово и начинается другое, или как идентифицировать особенности структуры, такие как заголовки, или простые синтаксические единица вроде подчиненных предложений. Кодирование текста для компьютерной обработки, в принципе, как расшифровка манускрипта с пергамента, -- процесс делания явным неявного или подразумеваемого, процесс указания пользователю того, как должно интерпретироваться содержимое текста.
Под
языком разметки понимают набор соглашений
о разметке, применяемых для кодирования
текстов. Язык разметки должен специфицировать,
какая разметка допустима, какая
разметка обязательна, как отличить
разметку от текста и что разметка
значит. SGML предоставляет решения
для первых трех задач, отдельная
документация обычно необходима для
последней.
2.3
Особенности SGML
Три характеристики SGML отличают его от прочих языков разметки.
В первую очередь это описательная разметка. Система с описательной разметкой использует коды разметки, которые просто предоставляют названия для категоризации частей документа. Коды разметки, такие как <para> или \end{list}, просто идентифицируют порцию документа и утверждают, что "она является параграфом", или что "это -- конец последним начатого списка" и т.п. С другой стороны, система с процедурной разметкой определяет, какая обработка должна выполняться в конкретной точке документа: "в этом месте вызвать процедуру PARA с параметрами 1, b и x", или "передвинуть левую границу на 2мм левее, правую границу -- на 2мм правее, пропустить одну строку и встать на новую левую границу" и т.п. В SGML инструкции, необходимые для обработки документа с какой-либо конкретной целью (например, для форматирования), четко отделяются от описательной разметки, которая встречается внутри документа. Обычно они собраны вне документа в отдельных процедурах или программах.
С
описательной, а не процедурной, разметкой
один и тот же документ может быть
обработан разнообразными программами,
каждая из которых может применять
различные инструкции обработки
к тем его частям, которые она
считает важными. Например, программа
анализа содержимого может
SGML
вводит понятие типа документа,
Поскольку
документы относятся к
Основная цель проектирования SGML была в создании гарантий того, что документ, закодированный согласно его положениям, будет переносимым с одной аппаратной и программной среды в другую без потери информации. Два его свойства, описанных выше, отвечают этому требованию на абстрактном уровне; третье свойство -- на уровне строчек байтов (символов), которые составляют документ. SGML предоставляет обобщенный механизм строковой подстановки, то есть, простой машинно-независимый способ указания, что конкретная строка символов в документе в момент обработки документа должна заменяться на некоторую другую строку. Одно очевидное применение этому механизму - обеспечение единой терминологии; другое, и более значительное, противодействие известной неспособности разных компьютерных систем понимать наборы символов друг друга, например, одной системе представлять все графические символы, необходимые приложению, путем описательного отображения непередаваемых символов. Строки, определяемые этим механизмом, называются сущностями (entities).
SGML даёт возможность производить документы в любом требуемом виде. Удобно оказалось и написание "вордовых" бумажек в привычной среде XEmacs без использования Windows. Все использованные программы- бесплатны и распространяются в исходных текстах, что позволило установить их на всех используемых мной системах. Причем оказалось, что начать работать с SGML вовсе не сложно, каждый, кто хоть раз редактировал WWW страничку, не испугается вида конструкций SGML.
Потом уже, по мере постепенного изучения SGML, я осознал, что эта техника дает громадное количество возможностей по сравнению с типичной "настольной типографией":
Четко разделенные процессы ввода информации и ее форматирования позволяют автору сосредоточиться на изложении мыслей, не отвлекаясь на двигание текста по экрану и подбор стилей.
Легко
выдерживать различные
Повторное использование для SGML означает наличие возможности использовать детали старых проектов в новых, с минимальными изменениями. Часть документа, оформленная в виде SGML-элемента, может переноситься в другие документы, легко повторяться в разных местах текста.
Долговечность информации. Из-за того, что SGML -- простой и стандартный формат хранения данных, отсутствует необходимость переформатировать их ввиду устаревания аппаратной или программной платформы. Информация просто доступна навсегда. Она несет с собой все необходимое для создания документа.
Лучшее управление данными. С SGML можно определять информационные элементы и манипуляции с ними с произвольной степенью детальности. Размеченные элементы могут иметь атрибуты, определяющие характеристики и свойства элементов. Эта информация не предназначена для печати, но может помочь в управлении элементами данных. Например, атрибут ID (идентификатор) может уникальным образом идентифицировать один абзац, или целый раздел, примечание, иллюстрацию, задание, -- любой элемент, как в этом примере: <para id=431>Информация</para>
Так как идентификаторы являются машинно-читаемыми, они могут связывать между собой информацию и использоваться для разнообразного управления ей. Например: контролировать безопасность доступа к информации, позволяя только определенным людям просматривать или изменять ее. Автоматизировать перемещение информации - например, обновление данных в одном месте может инициировать обновление той же информации в других приложениях.
Следующая особенность SGML разделимость. Возможность работы со структурированными компонентами документа позволяет строить целый документ из составных частей, разбросанных по организации. Это позволяет пользователям делиться информацией без ее дублирования.
Мобильность В информационных сетях, объединяющих разнообразные компьютеры, операционные системы и приложения, мобильность становится ключом ко всеобщей доступности информации. Поскольку SGML не зависит от аппаратуры и приложений, можно легко обмениваться документами между различными системами.
Гибкость в приложении SGML позволяет использовать информацию далеко за рамками "настольной типографии". Например: страницы WWW; информационные базы данных; диагностические / экспертные системы; электронная почта; гипертекстовая документация; публикации на CD-ROM; интерактивные электронные мануалы.