Технологии баз данных
Контрольная работа, 07 Ноября 2010, автор: Надя Маркова
Краткое описание
Особенности технологии баз данных
Содержание работы
нет
Содержимое работы - 1 файл
контрольная по базам данных.doc
— 101.00 Кб (Скачать файл)- Защита от отказов.
С помощью избыточности данных и их дублирования после сбоев аппаратуры, программ и пользователя данные не теряются и восстанавливаются.
Требования к организации базы данных
Комитет CODASYL (COnference DAta SYstems Languages), Организация пользователей IBM, Ассоциация вычислительных машин (ACM) сформулировали следующие требования к организации баз данных.
- Установление многосторонних связей
Метод организации данных должен обеспечивать получение требуемого варианта данных из существующей структуры данных и их связей.
- Производительность
БД должна обеспечивать требуемую пропускную способность запросов и требуемое время отклика.
- Минимальные затраты
Выбираются методы организации, которые минимизируют требования к внешней памяти.
- Минимальная избыточность
Целью организации БД должно быть уменьшение избыточных данных и контроль за теми противоречиями, которые вызываются их наличием.
- Возможности поиска
Пользователь БД может обращаться к ней со множеством запросов некоторого типа.
- Целостность
Хранение данных, их обновление, процедуры изменения должны быть такими, чтобы при сбоях и ошибках данные восстанавливались без потерь.
- Безопасность и секретность
Под безопасностью данных понимают защиту данных от случайного или преднамеренного доступа к ним лиц, не имеющих на это право, от неавторизованной модификации данных или их уничтожения.
Секретность определяют как право отдельных лиц или организаций определять, когда, как и какое количество информации может быть передано другим лицам или организациям.
- Связь с прошлым
Новое программное обеспечение должно быть совместимо с существующими программами. Проблема связи с прошлым, однако, не должна сдерживать развития БД.
- Связь с будущим
БД должна быть запланирована таким образом, чтобы ее изменения не требовали изменения прикладных программ.
- Простота использования
Интерфейс СУБД должен предполагать, что конечный пользователь не имеет необходимых знаний по теории баз данных.
Классификация БД
По технологии обработки БД делятся на централизованные и распределенные.
Централизованная БД хранится в одной ЭВМ.
Распределенная БД хранится на нескольких ЭВМ.
По способу доступа к данным БД разделяется на БД с локальным и удаленным доступом.
При локальном доступе запрос к данным поступает с того же компьютера, где данные хранятся. При удаленном доступе запрос к данным производится с другого компьютера. Удаленный доступ еще называют сетевым.
Компьютер, на котором данные хранятся, называется сервером. Компьютер, с которого данные запрашиваются, называется рабочей станцией.
Чаще
всего применяются
- файл сервер
- клиент сервер.
При технологии «файл сервер» данные в основном обрабатываются на рабочих станциях, для чего станции запрашивают у сервера необходимые файлы данных.
Сервер только хранит данные и может быть не мощным. Недостатком технологии файл-сервер является большой объем переносимой информации по сети (трафик). Например, для получения списка сотрудников отдела станция запрашивает и получает по сети список сотрудников всей организации. Схема технологии представлена на рис 11.1.
Сервер хранение Сервер обработка
Файлы БД Извлеченные данные
Рабочие станции
Рабочие станции
Рис.4.1.Технология «Файл-сервер». Рис.4.2.Технология «Клиент-сервер»
При технологии «клиент-сервер» рабочая станция посылает на сервер текст запроса к данным. Обработку запроса производит сервер, после обработки данные посылаются на рабочую станцию. В большинстве операций обработки (фильтр, обобщение) объем данных сокращается. Поэтому сокращается объем переносимой по сети информации (трафик) сокращается.
При технологии клиент-сервер нужен мощный сервер. Однако нагрузка на сеть гораздо меньше, чем при технологии файл-сервер.
Развитием технологии «клиент-сервер» является технология «тонкий клиент». В этой технологии на сервере проводятся не только стандартные операции обработки данных (сортировка, фильтр, обобщение, поддержка целостности), но и все другие операции обработки. Рабочая станция служит только для приема команд пользователя и для отображения результатов и совершенно не обрабатывает данных. Станции даже могут не иметь жестких дисков.
Объектами хранения в текстовых БД являются тексты. Под текстом понимаются неструктурированные данные, состоящие из слов. Основной целью текстовой БД является хранение, поиск и выдача документов, соответствующих запросу пользователя. Такие документы называются релевантными.
По
степени универсальности
- Специализированные СУБД,
- СУБД общего назначения.
Специализированные СУБД ориентированы на какую-либо предметную область и для другой области неприменимы. К таким СУБД, например, можно отнести программы бухгалтерии, банковские системы, расчет смет.
СУБД общего назначения охватывают широкий класс задач. Они обладают языковыми средствами настройки на конкретную область и являются, по сути, инструментальным средством для создания специализированных СУБД.
Из СУБД общего назначения выделяются хранилища данных. Они предназначены только для хранения данных, обеспечения сепаратности, целостности, секретности, синхронизации и защиты от отказов. Они не содержат средств для создания интерфейса пользователя.
- Перспективы развития технологии баз данных
Вот уже более 30-и лет базы данных являются одной из одной из наиболее широко востребованных информационных технологий. Некоторые авторы утверждают [1], что появление баз данных стало самым важным достижением в области программного обеспечения. Системы баз данных коренным образом изменили работу многих организаций, и практически нет такой области деятельности, которую они не затронули. Ежегодный рост объёмов продаж СУБД и вспомогательного программного обеспечения с 1995 г. составляет около 20%.
К числу наиболее важных и перспективных направлений развития БД следует отнести следующие:
- Хранилища данных и OLAP-обработка. Хранилище данных – это пред-метно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений. Хранилище данных позволяют сохранять исторические данные с целью анализа и прогнозирования развития ситуаций. При правильном проектировании хранилище данных даёт высокую отдачу за счёт более качественного управления работой организации (предприятия). Данные в хранилище данных обрабатываются с помощью OLAP (online analytical processing) – инструментов оперативной аналитической обработки данных. OLAP позволяет быстро производить расчёты над огромными объёмами данных, в том числе, с целью выявления динамики изменения различных параметров (параметры задаются аналитиком).
- Работа с неточными данными. Информация в базах данных часто содержит ошибки или является неполной. Результаты запроса по такой БД могут сильно отличаться от реального положения дел. Процессор запросов, работающий с вероятностями, коэффициентами доверия, коэффициентами полноты и т.д. позволил бы учитывать степень достоверности данных при принятии решений на основе этих данных.
- Новые пользовательские интерфейсы. Это одно из наиболее актуальных направлений современных информационных технологий. Конечные пользователи не знают язык запросов (SQL), и для получения информации из БД вынуждены пользоваться интерфейсами, которые для них создают программисты. В приложения обычно включают некоторый набор готовых запросов и возможность сформулировать произвольный запрос с помощью некоего конструктора. Но для того, чтобы воспользоваться конструктором, пользователь должен знать структуру базы данных и хорошо разбираться в предложенном ему формализме ПО.
Наиболее естественным видом является запрос к БД, сформулированный на естественном языке (ЕЯ). Но для таких запросов характерны неточности и неоднозначность. Решение этой задачи невозможно без использования знаний о предметной области и о структуре языка.
Одним из вариантов решения этой проблемы являются онтологии. Под онтологией понимается определённым образом формализованная система знаний о предметной области, описывающая, классифицирующая и увязывающая между собой понятия этой ПО. Интеграция онтологий и баз данных позволит пользователям задавать запросы в собственной терминологии с использованием ограниченного естественного языка. Это упростит создание и сопровождение приложений и повысит эффективность использования БД.
- Проблемы оптимизации запросов. Помимо остающейся актуальной задачи поиска новых способов оптимизации, можно выделить ещё две серьёзные проблемы оптимизации: обработка неструктурированных запросов (возможно, на ограниченном естественном языке), и оптимизация группы запросов. Работа с неструктурированными запросами особенно актуальна в свете использования баз данных в поисковых системах (в том числе, при поиске в Internet). А оптимизация группы одновременно выполняющихся запросов позволит улучшить характеристики СУБД с точки зрения быстродействия.
- Интеграция разнородных и слабо формализованных данных. Изначально базы данных предназначались для хранения и обработки фактографических хорошо структурированных данных. Но огромное количество данных представлено в различных графических и мультимедийных форматах. Включение в СУБД способов обработки подобных данных позволяет использовать технологии баз данных в таких сферах, как, например, ГИС (гео-информационные системы), издательские системы (с поддержкой вёрстки номеров издания), САПР (системы автоматизации проектирования) и т.д.
- Организация доступа к базам данных через Internet. Многие web-сайты содержат динамическую информацию, например, о товарах и ценах в Internet-магазинах. В локальных системах такая информация традиционно хранится в базах данных. Интеграция СУБД в web-среду позволяет сохра-нить все преимущества баз данных для использования в web-приложениях. Основными задачами здесь являются:
- организация эффективного интерфейса, рассчитанного на неподготов-ленного пользователя;
- оптимизация запросов, направленная на уменьшение сетевого трафика;
- повышение производительности СУБД в многопользовательском режиме работы.
- Самоадаптация. Современные СУБД имеют широкие возможности по на-стройке баз данных под конкретную предметную область и аппаратные средства. Но использование этих возможностей – достаточно сложная задача, которая требует наличия высококвалифицированного администратора БД. Для упрощения настройки и сопровождения БД СУБД должна брать на себя большинство функций настройки и выполнять их в автоматическом или автоматизированном режиме.
- Использование GRID. GRID – это концепция объединения вычислитель-ных ресурсов в единую сеть. В качестве аналогии здесь можно привести электрические сети: при возникновении потребности пользователь просто подключается к сети и получает электричество. Точно так же при возникновении потребности в вычислениях пользователь должен просто подключаться к GRID и получать вычислительные ресурсы. Преимущества этого подхода очевидны: возможность решать более ресурсоёмкие задачи и перераспределять нагрузку на узлы сети. Но и нерешённых проблем здесь тоже достаточно, поэтому это задача будущего.