Структура SQL

Автор работы: Пользователь скрыл имя, 28 Ноября 2011 в 15:49, курсовая работа

Краткое описание

Реляционная модель данных, содержащая набор четких предписаний к базовой организации любой реляционной системы управления базами данных (СУБД), позволяет пользователям работать в ненавигационной манере, т.е. для выборки информации из БД человек должен всего лишь указать список интересующих его таблиц и те условия, которым должны удовлетворять выбираемые данные. СУБД скрывает от пользователя выполняемые ей последовательные просмотры таблиц, выполняя их наиболее эффективным образом. Очень важная особенность реляционных систем состоит в том, что результатом выполнения любого запроса к таблицам БД является также таблица, которую можно сохранить в БД и/или по отношению к которой можно выполнять новые запросы.

Содержание работы

Введение 2
1 Понятие базы данных и СУБД 6
1.1 Предметная область 6
1.2 Концепция баз данных 7
1.3 Эффективность организации данных 9
1.4 Интеграция данных 12
1.5 Что такое база данных 13
2 Типы данных SQL 15
2.1 Таблицы SQL 16
2.2 Структура языка SQL 17
2.3 Операторы SQL 17
Заключение 35
Глоссарий 36
Список использованных источников 38

Содержимое работы - 1 файл

Структура SQL (Итог).doc

— 247.00 Кб (Скачать файл)

     Стадия 2. Выполнение операций UNION, EXCEPT, INTERSECT

     Если  в операторе SELECT присутствовали ключевые слова UNION, EXCEPT и INTERSECT, то таблицы, полученные в результате выполнения 1-й стадии, объединяются, вычитаются или пересекаются.

     Стадия 3. Упорядочение результата

     Если  в операторе SELECT присутствует раздел ORDER BY, то строки полученной на предыдущих шагах таблицы упорядочиваются  в соответствии со списком упорядочения, приведенном в разделе ORDER BY.

     Как на самом деле выполняется оператор SELECT

     Если  внимательно рассмотреть приведенный  выше концептуальный алгоритм вычисления результата оператора SELECT, то сразу  понятно, что выполнять его непосредственно в таком виде чрезвычайно накладно. Даже на самом первом шаге, когда вычисляется декартово произведение таблиц, приведенных в разделе FROM, может получиться таблица огромных размеров, причем практически большинство строк и колонок из нее будет отброшено на следующих шагах.

     На  самом деле в РСУБД имеется  оптимизатор, функцией которого является нахождение такого оптимального алгоритма  выполнения запроса, который гарантирует  получение правильного результата.

     Схематично  работу оптимизатора можно представить в виде последовательности нескольких шагов:

     Шаг 1 (Синтаксический анализ). Поступивший  запрос подвергается синтаксическому  анализу. На этом шаге определяется, правильно  ли вообще (с точки зрения синтаксиса SQL) сформулирован запрос. В ходе синтаксического анализа вырабатывается некоторое внутренне представление запроса, используемое на последующих шагах.

     Шаг 2 (Преобразование в каноническую форму). Запрос во внутреннем представлении  подвергается преобразованию в некоторую  каноническую форму. При преобразовании к канонической форме используются как синтаксические, так и семантические преобразования. Синтаксические преобразования (например, приведения логических выражений к конъюнктивной или дизъюнктивной нормальной форме, замена выражений "x AND NOT x" на "FALSE", и т.п.) позволяют получить новое внутренне представление запроса, синтаксически эквивалентное исходному, но стандартное в некотором смысле. Семантические преобразования используют дополнительные знания, которыми владеет система, например, ограничения целостности. В результате семантических преобразований получается запрос, синтаксически не эквивалентный исходному, но дающий тот же самый результат.

     Шаг 3 (Генерация планов выполнения запроса  и выбор оптимального плана). На этом шаге оптимизатор генерирует множество возможных планов выполнения запроса. Каждый план строится как комбинация низкоуровневых процедур доступа к данным из таблиц, методам соединения таблиц. Из всех сгенерированных планов выбирается план, обладающий минимальной стоимостью. При этом анализируются данные о наличии индексов у таблиц, статистических данных о распределении значений в таблицах, и т.п. Стоимость плана это, как правило, сумма стоимостей выполнения отдельных низкоуровневых процедур, которые используются для его выполнения. В стоимость выполнения отдельной процедуры могут входить оценки количества обращений к дискам, степень загруженности процессора и другие параметры.

     Шаг 4. (Выполнение плана запроса). На этом шаге план, выбранный на предыдущем шаге, передается на реальное выполнение.

     Во  многом качество конкретной СУБД определяется качеством ее оптимизатора. Хороший  оптимизатор может повысить скорость выполнения запроса на несколько  порядков. Качество оптимизатора определяется тем, какие методы преобразований он может использовать, какой статистической и иной информацией о таблицах он располагает, какие методы для оценки стоимости выполнения плана он знает.

     Реализация реляционной  алгебры средствами оператора SELECT (Реляционная  полнота SQL)

     Для того, чтобы показать, что язык SQL является реляционно полным, нужно показать, что любой реляционный оператор может быть выражен средствами SQL. На самом деле достаточно показать, что средствами SQL можно выразить любой из примитивных реляционных операторов.

     Оператор декартового произведения

     Реляционная алгебра:

     Оператор SQL:

     SELECT A.Поле1, A.Поле2, …, B.Поле1, B.Поле2, …

     FROM A, B;

     или

     SELECT A.Поле1, A.Поле2, …, B.Поле1, B.Поле2, …

     FROM A CROSS JOIN B;

     Оператор проекции

     Реляционная алгебра:

     Оператор SQL:

     SELECT DISTINCT X, Y, …, Z

     FROM A;

     Оператор выборки

     Реляционная алгебра: ,

     Оператор SQL:

     SELECT *

     FROM A

     WHERE c;

     Оператор объединения

     Реляционная алгебра:

     Оператор SQL:

     SELECT *

     FROM A

     UNION

     SELECT *

     FROM B;

     Оператор вычитания

     Реляционная алгебра:

     Оператор SQL:

     SELECT *

     FROM A

     EXCEPT

     SELECT *

     FROM B

     Реляционный оператор переименования RENAME выражается при помощи ключевого слова AS в списке отбираемых полей оператора SELECT. Таким образом, язык SQL является реляционно-полным.

     Остальные операторы реляционной алгебры (соединение, пересечение, деление) выражаются через примитивные, следовательно, могут быть выражены операторами SQL. Тем не менее, для практических целей приведем их.

     Оператор соединения

     Реляционная алгебра:

     Оператор SQL:

     SELECT A.Поле1, A.Поле2, …, B.Поле1, B.Поле2, …

     FROM A, B

     WHERE c;

     или

     SELECT A.Поле1, A.Поле2, …, B.Поле1, B.Поле2, …

     FROM A CROSS JOIN B

     WHERE c;

     Оператор пересечения

     Реляционная алгебра:

     Оператор SQL:

     SELECT *

     FROM A

     INTERSECT

     SELECT *

     FROM B;

     Оператор деления

     Реляционная алгебра:

     Оператор SQL:

     SELECT DISTINCT A.X

     FROM A

     WHERE NOT EXIST

     (SELECT *

     FROM B

     WHERE NOT EXIST

     (SELECT *

     FROM A A1

     WHERE

      A1.X = A.X AND

       A1.Y = B.Y));

     Пусть отношение A содержит данные о поставках  деталей, отношение B содержит список всех деталей, которые могут поставляться. Атрибут X является номером поставщика, атрибут Y является номером детали.

     Разделить отношение A на отношение B означает в  данном примере "отобрать номера поставщиков, которые поставляют все детали".

     Преобразуем текст выражения:

     "Отобрать  номера поставщиков, которые поставляют все детали" эквивалентно

     "Отобрать  те номера поставщиков из таблицы  A, для которых не существует  непоставляемых деталей в таблице  B" эквивалентно 

     "Отобрать  те номера поставщиков из таблицы  A, для которых не существует  тех номеров деталей из таблицы B, которые не поставляются этим поставщиком" эквивалентно

     "Отобрать  те номера поставщиков из таблицы  A, для которых не существует  тех номеров деталей из таблицы  B, для которых не существует  записей о поставках в таблице  A для этого поставщика и этой детали".

     Последнее выражение дословно переводится  на язык SQL. При переводе выражения  на язык SQL нужно учесть, что во внутреннем подзапросе таблица A должна быть переименована, для того чтобы отличать ее от экземпляра этой же таблицы, используемой во внешнем запросе11.

     Заключение

     Фактически  стандартным языком доступа к  базам данных в настоящее время  стал язык SQL (Structured Query Language).

     Язык SQL оперирует терминами, несколько  отличающимися от терминов реляционной  теории, например, вместо "отношений" используются "таблицы", вместо "кортежей" - "строки", вместо "атрибутов" - "колонки" или "столбцы".

     Стандарт  языка SQL, хотя и основан на реляционной  теории, но во многих местах отходит  он нее.

     Основу  языка SQL составляют операторы, условно  разбитые не несколько групп по выполняемым функциям:

     Операторы DDL (Data Definition Language) - операторы определения  объектов базы данных.

     Операторы DML (Data Manipulation Language) - операторы манипулирования  данными.

     Операторы защиты и управления данными, и др.

     Одним из основных операторов DML является оператор SELECT, позволяющий извлекать данные из таблиц и получать ответы на различные  запросы. Оператор SELECT содержит в себе все возможности реляционной  алгебры. Это означает, что любой  оператор реляционной алгебры может быть выражен при помощи подходящего оператора SELECT. Этим доказывается реляционная полнота языка SQL.

Различают концептуальную схему выполнения оператора SELECT и  фактическую схему его выполнения. Концептуальная схема описывает, в  какой логической последовательности должны выполняться операции, чтобы получить результат. При реальном выполнении оператора SELECT на первый план выступает достижение максимальной скорости выполнения запроса. Для этого используется оптимизатор, который, анализируя различные планы выполнения запроса, выбирает наилучший из них.

     Глоссарий

№ п/п Понятие Определение
1 Информационная  система       Система, реализующая  автоматизированный сбор, обработку  и манипулирование данными и  включающая технические средства обработки данных, программное обеспечение и соответствующий персонал
2 База  данных (БД) Поименованная совокупность данных, отражающая состояние  объектов и их отношений в рассматриваемой  предметной области
3 Объект Элемент предметной области, информацию о котором мы сохраняем
4 Поле Элементарная  единица логической организации  данных, которая соответствует неделимой  единице информации - реквизиту
5 Запись Совокупность логически связанных полей
6 Файл (таблица) Совокупность  экземпляров записей одной структуры
7 Реляционная модель данных Совокупность  взаимосвязанных двумерных таблиц - объектов модели
8 Атрибут Поименованная характеристика объекта. Атрибут показывает, какая информация должна быть собрана об объекте
9 Сущность Основное содержание объекта предметной области, о котором собирают информацию. В качестве сущности могут выступать место, вещь, личность, явление
10 Конструктор (Builder) Инструмент Access, который облегчает выполнение конкретного задания

Информация о работе Структура SQL