<< Вернуться у выбору материала

Тема № 3.2 Реляционная модель данных

Введите ваш запрос для начала поиска.

Ее построение основано на аппарате математической теории отношений. Результатом разработок в данной области является построение теоретико-множественной модели базы данных, получившей название реляционной модели, и выделение набора процедур манипулирования хранимыми в ней данными. Подобные наборы положены в основу целого спектра возможных языков.

Реляционная модель данных характеризуется следующими компонентами:

Каждому классу объектов Р материального мира ставится в соответствие некоторое множество атрибутов, например А 1, А2,...,Ап. Отдельный объект класса Р описывается строкой величин (а1, а2,..., an), где ai - значение атрибута Ai.

Строка (а1, а2,..., an) называется кортежем. Всему классу объектов соответствует множество кортежей, называемое отношением. Обозначим отношение, описывающее класс объектов Р, также через Р.

Выражение Р(А1, А2,...,Ап) называется схемой отношения Р.

Для каждого компонента кортежа должна быть указана ее связь с соответствующим атрибутом. В реляционной модели данных для обеспечения этой связи порядок компонентов кортежа совпадает с порядком следования атрибутов в схеме отношения.

Каждое отношение представляет состояние класса объектов в некоторый момент времени. Следовательно, одной схеме отношения в разные моменты времени могут соответствовать разные отношения.

Множество значений отношения можно представить в виде таблицы, в которой соблюдаются следующие соответствия:

Отношение реляционной БД может быть описано в терминах теории множеств. Рассмотрим множество доменов

D = { Dl, D2, D3,..., Dk } и создадим декартово произведение доменов

U = Dl-D2.D3.....Dk.

Каждый элемент U имеет вид (dl, d2, d3,...,dk),

 где dl - элемент домена Dl, d2 - элемент D2 и т.д. В множестве U представлены всевозможные сочетания значений доменов, полученные по названному принципу.

Среди элементов из U содержатся такие, которые не соответствуют реально имеющимся сообщениям и не могут храниться в БД. Отношение R, включающее истинные сообщения, является подмножеством U. Атрибуты отношения R используют домены из D в качестве своих областей определения.

Реляционная база данных представляет собой множество отношений.

Схема реляционной БД содержит следующие компоненты

S(rel) = <A,R,Dom,Rel,V(s)>,

где А - множество имен атрибутов,

R - множество имен отношений, Dom - вхождение атрибутов в домены, Rel - вхождение атрибутов в отношения,

V(s) - множество ограничений (в том числе функциональных зависимостей).

Описание процессов обработки отношений может быть выполнено двумя способами:

Приводимые далее операции над отношениями ориентированы на процедурное описание процессов обработки данных.

Множество отношений и операций над ними образует реляционную алгебру.

При рассмотрении операций над отношениями будем использовать как алгебраическую форму записи операций, так и запись на языке реляционных СУБД семейства dBASE. Далее будут рассмотрены аналогичные конструкции языка SQL.

Как правило, список операций содержит:

Проекцией называется операция, которая переносит в результирующее отношение те столбцы исходного отношения, которые указаны в условии операции. Алгебраическая запись проекции имеет вид:

Т = R[X],

где R - исходное отношение,

Т - результирующее отношение,

Х - список атрибутов в структуре отношения Т (условие проекции).

Пример

Рассмотрим два отношения: W1, содержащее сведение о продаже, и W2, в котором указаны цены на продукцию и комплектующие изделия для соответствующих видов продукции.

W1
Магазин Продукция План Факт
Динамо Гидрокостюм 1200 1400
Динамо Лыжи 2000 2000
Спорттовары Лыжи 800 1700
Спорттовары Коньки 500 500
W2
Продукция Цена Комплект
Гидрокостюм 3500 А1
Лыжи 1200 В23
Лыжи 1200 С23
Коньки 700 С2

Если требуется отношение XI, содержащее сведения только о фактическом выпуске продукции, то оно получается в результате выполнения проекции

XI = Wl[Maгазин, Продукция, Факт] и имеет вид:

Столбцы результирующего отношения могут указываться в любом порядке:

Х2 = Wl[Пpoдyкция, Магазин, Факт].

Х1
Магазин Продукция Факт
Динамо Гидрокостюм 1400
Динамо Лыжи 2000
Спорттовары Лыжи 1700
Спорттовары Коньки 500
Х2
Продукция Магазин Факт
Гидрокостюм Динамо 1400
Лыжи Динамо 2000
Лыжи Спорттовары 1700
Коньки Спорттовары 500

В СУБД DBASE проекция реализуется двумя командами

use W1 && открыть отношение W1

copy to XI field Магазин, Продукция, Факт && проекция

Следующий пример проекции - это получение справочника ХЗ цен на продукцию:

useW2

сopy to ХЗ field Продукция, Цена

Х3
Продукция Цена
Гидрокостюм 3500
Лыжи 1200
Лыжи 1200
Коньки 700

Значительным неудобством в ХЗ является наличие одинаковых строк. В реляционной алгебре требуется, чтобы результат проекции не содержал одинаковых строк, однако практически такие СУБД, как dBASE, не обеспечивают этого. Правильным результатом проекции Х4 = W2[Продукция, Цена] является отношение.

Х4
Продукция Цена
Гидрокостюм 3500
Лыжи 1200
Коньки 700

Отношение с заданной структурой зачастую можно получить из различных исходных отношений БД. В этом случае, естественно, не гарантируются одинаковые результаты.

Пусть нам необходим список отделов учреждения. В базе данных имеются отношения Служащий (Фамилия, Отдел,...) и Технолог (Фамилия,0тдел,...). Проекция Служащий[0тдел] формирует полный список отделов, а Технолог[0тдел] может содержать меньше значений, если в некоторых отделах не работают технологи.

Выборкой называется операция, которая переносит в результирующее отношение те строки из исходного отношения, которые удовлетворяют условию выборки. Условие выборки проверяется в каждой строке отношения по отдельности и не может охватывать информацию из нескольких строк. Существуют две простейшие разновидности условия выборки:

1. Условие вида Имя_атрибута <знак сравнения> Значение,

где допускаются знаки сравнения =,#,>,=>,<,<=. Например, Цена > 100.

2. Условие вида Имя_атрибута_1 <знак сравнения> Имя_ атрибута_2. Например, Факт > План.

Имена атрибутов должны содержаться в структуре исходного отношения. Алгебраическая запись выборки имеет вид

Х5
Магазин Продукция План Факт
Динамо Лыжи 2000 1400
Спорттовары Лыжи 800 2000

T=R[p],

где R - исходное отношение;

Т - результирующее отношение;

р - условие выборки.

В качестве примера получим значения     Х5 = W 1 [Продукция = "Лыжи"]

В СУБД dBASE выборка реализуется командой copy с опциейfor,

Х6
Магазин Продукция План Факт
Динамо Лыжи 2000 1400

например, use W1 copy to X6 for Факт => План

В команде copy условия выборки и проекции могут присутствовать одновременно, но атрибуты условия выборки должны включаться в условие проекции.

Операции объединения, пересечения и вычитания производятся над двумя исходными отношениями с одинаковой структурой. Точных аналогов этих операций в dBASE нет.

Обозначим исходные отношения через R1 и R2, а результирующее через Т.

Объединение Т = U(R1, R2) содержит строки, присутствующие либо в отношении R1, либо в R2.

Пересечение Т = I(R1, R2) содержит строки, присутствующие в отношениях R1 и R2 одновременно.

Вычитание Т = M(R1, R2) содержит те строки из R 1, которые отсутствуют в R2.

Если справочник цен на продукцию Х4 необходимо дополнить новыми сведениями из отношения W3, то надо выполнить объединение

Х7 = U (Х4, W3).

W3
Продукция Цена
Лодка 5600
Палатка 9000
Х7
Продукция Цена
Лодка 5600
Палатка 9000
Лыжи 1200
Коньки 700
Гидрокостюм 3500

В dBASE предусмотрена операция добавления append, которая для нашего примера реализуется командами

useX4

append from W3,

что приводит к добавлению в отношение Х4 всех строк из отношения W3. Отличия добавления от объединения создание результирующего отношения на месте исходного отношения и возможность появления одинаковых строк в результирующем отношении.

Операция соединения отношений выполняется над двумя исходными отношениями и создает одно результирующее. Каждая строка первого исходного отношения сопоставляется по очереди со всеми строками второго отношения, и если для этой пары строк соблюдается условие соединения, то они сцепляются и образуют очередную строку в результирующем отношении. Условие соединения имеет вид:

Имя_атрибута_1 <знак сравнения> Имя_атрибута_2,

где Имя_атрибута_1 находится в одном исходном отношении, а Имя_атрибута_2 - в другом. Будем использовать следующее обозначение операции соединения:

T=Rl[p]R2,

где R1 и R2 - исходные отношения,

Т - результирующее отношение, р - условие соединения.

Практически наиболее важный частный случай соединения называется натуральным соединением и имеет следующие особенности:

• знаком сравнения в условии соединения является "=",

• Имя_атрибута_1 и Имя_атрибута_2 должны совпадать, а точнее, содержать пересечение списков атрибутов исходных отношений,

• список атрибутов результирующего отношения образуется в результате объединения списков атрибутов исходных отношений.

Обозначение натурального соединения не содержит условия соединения и имеет вид Т = R1 * R2.

Если требуется сведения о продаже продукции из отношения W1 дополнить данными о ценах на продукцию из отношения Х, то задача решается с помощью соединения

Х8
Магазин Продукция План Факт Продукция Цена
Динамо Гидрокостюм 1200 1400 Гидрокостюм 3500
Динамо Лыжи 2000 200 Лыжи 1200
Спорттовары Лыжи 800 170 Лыжи 1200
Спорттовары Коньки 500 100 Коньки 700

Первая строка из W1 и первая строка из Х7 удовлетворяют условию Продукция = Продукция, поэтому сцепляются. Остальные строки из Х7 не будут сцепляться с первой строкой из W1 (условие не соблюдается). Вторая строка из W1 при сравнении со всеми строками из Х7 сцепится только с третьей строкой и т. д. Если применять операцию натурального соединения, то в отношении Х8 будет отсутствовать второй столбец с именем Продукция.

В СУБД DBASE для проведения соединения необходимо использовать две области для исходных отношений:

SELECT 1

USE W1 && открытие отношения W1

SELECT 2

USE Х7 && открытие отношения Х7

SELECT 1

JOIN WITH Х7 TO X9 FOR Продукция=Х7->Продукция FIELDS Магазин, Продукция, Х7->Цена, План, Факт

Опция with называет второе исходное отношение, опция for содержит условие соединения, опция fields перечисляет имена атрибутов результирующего отношения. В приведенном примере выполнено натуральное соединение и передвинут столбец Цена.

В ряде случаев соединение дает некорректные результаты, например:

X10=W1*W2

содержит неоднократно одинаковые сообщения о выпуске продукции только потому, что эти виды продукции используют несколько комплектующих изделий.Х10

Х10
Магазин Продукция План Факт Цена Компл
Динамо Гидрокостюм 1200 1400 3500 А1
Динамо Лыжи 2000 2000 1200 В23
Динамо Лыжи 2000 2000 1200 С23
Спорттовары Лыжи 800 1700 1200 В23
Спорттовары Лыжи 800 1700 1200 С23
Спорттовары Коньки 500 500 700 С2

Вообще говоря, ограничения, которые присутствуют в исходных отношениях, определенным образом трансформируются в ограничения для отношений, полученных в результате применения операций реляционной алгебры. Соответствующие закономерности будут рассмотрены в п. 2.2 в связи с анализом ограничений, присущих реляционной модели данных.

Натуральное соединение определено и в тех случаях, когда соединяемые отношения совпадают по структуре или не содержат общих атрибутов. Если структура отношений R и S одинакова, то R * S выполняет фактически пересечение I(R,S).

Когда отношения R и S не содержат общих атрибутов, считается, что условие соединения выполнено для любой пары сопоставляемых строк отношений, и R * S сцепляет каждую строку из R со всеми строками из S.

Операция натурального соединения имеет ряд свойств, например коммутативность и ассоциативность.

Свойство коммутативности означает, что операции

X1=R*S и X2=S*R

порождают, в сущности, одно и то же отношение.

Свойство ассоциативности означает, что операция

Y1=(R*S)*T и операция Y2=R*(S*T)

дают одинаковый результат. Различия, безусловно, состоят в неодинаковом порядке строк XI и Х2 (Y1 и Y2 соответственно). Кроме того, промежуточные отношения при вычислении Y1 и Y2 могут иметь резко различающиеся размеры (число строк), хотя Y1 и Y2 содержат равное число строк.

Y
ФИО ЯП
Иванов Си
Иванов Фортран
Иванов Паскаль
Петров Си
Петров Паскаль
Семин Си
Семин Фортран
Яшин Фортран
Яшин Паскаль

Описание операции деления отношений начнем с примера. Пусть существует отношение Y(ФИО, ЯП), где для каждого программиста с фамилией ФИО указываются языки программирования ЯП, которые он знает.

Необходимо выделить фамилии программистов, знающих языки Си и Фортран одновременно. Попытка воспользоваться операцией выборки

X11 = Y[ ЯП = "Си" AND ЯП = "Фортран"]

(через AND обозначена логическая операция "и") будет безуспешной, так как в одной строке отношения нет информации о двух языках программирования сразу, и отношение X11 будет пустое.

Определим операцию, называемую "образ". В отношении Т(А,В) образом значения атрибута А является множество значений атрибута В, и каждый элемент b этого множества образует вместе с а некоторую строку (или часть строки) отношения Т.

imB(a)={bl,b2,...,bk},

где im - знак операции "образ",

а - значение, образ которого вычисляется, В - имя атрибута для образа значения а, b1, b2,...,bk - значения атрибута В.

Стоящая перед нами задача решается путем вычисления образов значений "Си" и "Фортран" и последующего пересечения найденных образов.

im ФИО("Си") = {"Иванов","Петpoв» , «Семин»}

im ФИО(«Фортран») = {"Иванов","Семин","Яшин"}

im ФИО("Си")ÇФИО("Фортран")= {"Иванов","Семин")

Такая связка операций взятия образа и пересечения полученных множеств (количество значений, для которых вычисляется образ, может быть произвольным, а не 2, как в нашем примере) требуется достаточно часто, поэтому вводится специальная

Операция - деление.

Z
ЯП
Си
Фортран

Условимся, что существует отношение-делимое W(A,B) (в нашем примере это Y) и отношение-делитель V(A). Для необходимого нам запроса отношение-делитель имеет вид;

Результатом операции деления является отношение Q(B), содержащее пересечение образов всех строк отношения-делителя V(A), вычисленных на основе отношения-делимого W(A,B).

Q = D (W,V).

где D - знак операции деления.

Результат деления XI 2 = D (Y,Z) содержит следующие значения:

X12
ФИО
Иванов
Семин

В СУБД семейства DBASE отсутствует операция деления отношений, и для реализации деления отношений необходима специальная программа

Декларативный подход к обработке реляционных баз данных основан на интерпретации понятий и методов математической логики. В частности, реляционное исчисление базируется на исчислении предикатов.

Понятия математической логики

Перечислим необходимые для реляционного исчисления понятия математической логики.

1. Символы переменных и констант. В языковых конструкциях реляционного исчисления им соответствуют имена атрибутов и переменных, а также константы.

2. Логические связки "и", "или", "не" и знаки сравнения = # (не равно), >, <, >=, <=.

3. Термы, т. е. любые константы и переменные, а также функции, аргументами которых служат термы.

4. Элементарные формулы - предикаты, аргументами которых являются термы. Предикаты, связанные операциями "и", "или", "не", также являются элементарными формулами Элементарными формулами служат, например, выражения Фамилия = "Мишенин" и Сумма <= Итог.

5. Формулы, т. е. результат применения кванторов общности или существования к элементарным формулам. Формул) соответствует запросу к реляционной базе данных, выраженному средствами реляционного исчисления.

В применяемых ниже языковых конструкциях используется синтаксис языков ALPHA и QUEL. Объявление переменной и ее привязка к определенному отношению производятся с помощью оператора Диапазон (range) следующего вида

range of <переменная> is <отношение><квантор>

Квантор принимает одно из значений:

some, когда переменная обозначает одну из строк отношения (квантор существования);

all, когда переменная обозначает все строки отношения (квантор общности).

Основной формой оператора запроса Получить (get) является выражение

get <отношение> (<целевой список>) where <условие>.

Условие соответствует формуле исчисления кортежей. В условиях можно использовать все знаки сравнения и логические связки "и", "или", "не".

Языковая конструкция для кванторов может быть такой:

range of Z is Перевозка some.

Переменная Z при вычислении означает одну из строк (some -квантор существования) отношения Перевозка.

range of W is Перевозка all.

Переменная W означает все строки (all - квантор общности) отношения Перевозка.

Реализацией запроса к базе данных из "Получить даты поставок из города Киева" является запись средствами реляционного исчисления:

range of   Z is Перевозка some

get W (Дата) where Поставщик.Код_поставщика=г.Код_поставщика

and Поставщик.Город="Киев".

В последнее время наиболее распространенным декларативным языком запросов является SQL (структурированный язык запросов). Центральным средством доступа к БД в SQL являются команда Select и ее параметры - From, Where, Group by, Having, Order by.

В команде Select указываются имена выводимых атрибутов или знак *, если надо выводить все атрибуты. Параметр From является обязательным и содержит имена требуемых для выполнения запроса отношений. Если здесь указано несколько отношений, то они будут преобразованы командами натурального соединения в одно отношение. Параметр Where определяет условия, которым должны удовлетворять выводимые данные. В записи условий применяются знаки сравнения (=,> и т.д.), опции All, Any, Between, Exists, Like, In и логические операторы. Параметр Group by объединяет записи с одинаковым значением некоторого атрибута-ключа. Параметр Having при необходимости проверяет условия внутри группы записей, выделенных с помощью Group by. Параметр Order by определяет имена атрибутов, по которым должен быть отсортирован результат.

Ранее упомянутый запрос "Получить даты поставок из города Киева" выполняется командой

Select Дата

From Перевозка, Поставщик

Where Поставщик.Город="Киев" '

Другой подход к декларативному представлению запросов реализован в языке Пролог. Значения отношения в Прологе хранятся в виде множества фактов. Например, для отношения Изделие (Код, Поставщик, Цена) факты могут иметь вид

Изделие (513,"Динамо",800)

 Изделие (155,"Динамо",600)

Изделие (247,"АТЭ",600)

Простейший запрос для отношения Пролога сводится к указанию в структуре отношения имени переменной на месте атрибута-цели запроса, указанию требуемых значений на месте атрибутов, для которых задано условие выборки, и указанию знака _ на месте атрибутов, значение которых безразлично.

Например, запрос "Получить список изделий с ценой 600" реализуется выражением goal (цель)

Goal: Изделие (х,_,600)

Ответ Пролога имеет вид

х=155

х=247.

Рейтинг@Mail.ru