<< Вернуться у выбору материала

Тема № 3.4 Иерархическая модель данных

Введите ваш запрос для начала поиска.

http://www.arendanasosov.ru/ работы по водопонижению строительное водопонижение.

Иерархическая модель организует данные в виде древовидной структуры.

К основным понятиям иерархической структуры относятся: уровни элемент (узел), связь. Дерево представляет собой иерархию элементов называемых узлами. Узел - это совокупность атрибутов данных, описывающих некоторый объект. На самом верхнем уровне иерархии имеется один и только один узел - корень. Каждый узел, кроме корня, связан с одним узлом на более ( высоком уровне, называемым исходным для данного узла. Ни один элементов не имеет более одного исходного узла. Каждый элемент может быть связан с одним или несколькими элементами на более низком уровне. Они называются порожденными (рис 3.15).

Иерархическая структура БД

Рис. 3.15 Иерархическая структура БД

К каждой записи базы данных существует только один (иерархический) путь от корневой записи. Например, как видно из рис. 3.15, для записи С4 путь проходит через записи А и ВЗ.

Иерархическая модель данных имеет много общих черт с сетевой моделью данных, хронологически она появилась даже раньше, чем сетевая. Допустимыми информационными конструкциями в иерархической модели данных являются отношение, веерное отношение и иерархическая база данных. В отличие от ранее рассмотренных моделей данных, где предполагалось, что информационным отображением одной предметной области является одна база данных, в иерархической модели данных допускается отображение одной предметной области в несколько иерархических баз данных.

Понятия отношения и веерного отношения в иерархической модели данных не изменяются.

Иерархической базой данных называется множество отношений и веерных отношений, для которых соблюдаются два ограничения:

1. Существует единственное отношение, называемое корневым, которое не является зависимым ни в одном веерном отношении.

2. Все остальные отношения (за исключением корневого) являются зависимыми отношениями только в одном веерном отношении.

Иерархическая база данных для вуза

Рис. 3.16 Иерархическая база данных для вуза. а - исходная структура; б - с добавленными сведениями о группах дипломников

Схема иерархической БД по составу компонентов идентична сетевой базе данных. Названные выше ограничения поддерживаются иерархическими СУБД.

На рис. 3.16 изображена структура иерархической базы данных о студентах и преподавателях вуза, удовлетворяющая всем ограничениям, указанным в определении.

В графических иллюстрациях структуры приводятся ключи соответствующих отношений.

Если понадобится в рамках данной иерархической структуры указать для групп, выполняющих дипломное проектирование, связь с соответствующей выпускающей кафедрой, то установить веерное отношение Р(Кафедра, Группа) невозможно, так как Группа не может быть зависимым отношением дважды (она уже является зависимой для отношения Факультет). Зафиксировать связь студенческих групп с выпускающей кафедрой можно путем выделения соответствующих групп в отдельное отношение с ключом В - группа, что приводит к появлению избыточной информации.

Ограничение, которое поддерживается в иерархической модели данных, состоит в невозможности нарушения требований, фигурирующих в определении иерархической базы данных. Это ограничение обеспечивается специальной укладкой значений отношений в памяти ЭВМ. Ниже мы рассмотрим одну из простейших реализации укладки иерархической БД.

На рис. 3.17 приводится связь значений отношений из иерархической базы данных, структура которой показана на рис. 3.16, а. Каждое значение представляется соответствующей величиной первичного ключа.

Далее эта информация организуется в линейную последовательность значений, как это показано на рис. 3.17, б.

Необходимо отметить, что существуют различные возможности прохождения иерархически организованных значений в линейной последовательности. Принцип, применяемый для иерархических баз данных, называется концевым прохождением.

Правила концевого прохождения

1. Начиная с первого значения корневого отношения, перечисляются первые значения соответствующих отношений на каждом уровне вплоть до последнего.

2. Перечисляются все значения в том веерном отношении, на котором остановился шаг 1.

3. Перечисляются значения всех вееров этого веерного отношения.

Линейное представление значений в иерархической базе данных

Рис. 3.17 Линейное представление значений в иерархической базе данных: а - иерархическая взаимосвязь значений; б - линейное представление данных

4. От достигнутого уровня происходит подъем на предыдущий уровень, и если возможно применить шаг 1, то процесс повторяется.

Записью иерархической базы данных называется множество значений, содержащих одно значение корневого отношения и все веера, доступные от него в соответствии со структурой иерархической базы данных. В нашем примере одну запись образуют данные, относящиеся к одному факультету.

Для веерных отношений в составе иерархической базы данных справедлива уже известная закономерность: если существует веерное отношение, то ключ зависимого отношения функционально определяет ключ основного отношения, и наоборот, если ключ одного отношения функционально определяет ключ второго отношения, то первое отношение может быть зависимым, а второе - основным в некотором веерном отношении.

Кроме того, ограничение на существование единственного корневого отношения в иерархической базе данных трансформируется в требование: первичный ключ каждого некорневого отношения должен функционально определять первичный ключ корневого отношения.

Рассмотрим алгоритм формирования иерархической БД на основе известного множества атрибутов и функциональных зависимостей. Исходное множество функциональных зависимостей и атрибуты первичного ключа получаются так же, как при формировании множества отношений в ЗНФ. Алгоритм иллюстрируется тем же примером, что и в п. 2.2.2.

Алгоритм получения структуры иерархической БД

1. Для каждой функциональной зависимости вида А —> В создается отношение Si(A,B). Каждый блок взаимно-однозначных соответствий также порождает отношение с ключом, равным старшему по объему понятия атрибуту.

В нашем примере будут созданы следующие отношения (ключи помечены знаком #):

S1(НИИ #, Директор, Адрес),

S2(0тдел #, НИИ, Ксотр),

S3(Тема #, Датанач, Датакон, Приор),

S4(ФИО #, Отдел),

S5(Тема #, Работа #, ФИО #, Прод),

S6(Тема #, Заказ #, Обфин).

2. Разделить отношения на группы по признаку: два отношения находятся в общей группе, если их ключи функционально определяют хотя бы один общий атрибут.

 Для отношений Sl - S6 получаем две группы:

• Sl, S2, S4, S5 (все ключи функционально определяют атрибут НИИ);

• S3, S6, S5 (все ключи функционально определяют атрибут ТЕМА).

Далее шаги 3,4,5 выполняются раздельно для каждой группы. Количество групп определяет количество иерархических БД.

3. У всех пар отношений группы проверяется условие для ключей Kj —» Ki. Если оно соблюдается, то из соответствующих отношений создается веерное отношение Wij(Si,Sj).

4. Найти в группе цепи веерных отношений и сцепить их в дерево. Элемент цепи образуется по условию Wij - Wjk.

В нашем примере получим:

группа 1: цепь Wl 2(S I ,S2), W24(S2,S4), W45(S4,S5) образует дерево;

группа 2: цепей нет, но W35(S3,S5) и W36(S3,S6) образуют дерево.

5. Атрибуты, оставшиеся вне цепей на шаге 4, добавить в структуру тех отношений, где они будут не ключевыми, либо в структуру отношений, соответствующих висячим вершинам дерева.

6. Если группы, полученные на шаге 2, содержат общие отношения, то решить вопрос о целесообразности установления логических связей между иерархическими БД.

7. Сократить список атрибутов в сегментах за счет удаления атрибутов зависимого отношения, общих в паре "основной -зависимый".

Итоговая иерархическая структура содержит две иерархические базы данных. В некоторых иерархических СУБД не допускается логическая связь баз данных, определенная в п.6 алгоритма, так как формально это является нарушением ограничения 2 иерархической модели данных.

Манипулирование иерархической базой данных происходит с использованием включающего языка. Подпрограмма обращения к базе данных содержит ряд параметров, из которых мы будем использовать только код требуемой операции и одно или несколько условий выбора. По причинам, которые уже были названы при изучении сетевой модели данных, для иерархической модели данных необходимы только операции выборки.

Минимальное множество вариантов выборки соответствует трем операциям.

1. GU - получить уникальную запись по известным значениям первичного ключа на каждом уровне дерева иерархической базы данных.

2. GN - получить следующую запись на том уровне дерева, где находится текущая запись после выполнения оператора GU.

3. GNP - получить следующую запись на расположенном непосредственно ниже уровня дерева относительно позиции, где находится текущая запись после выполнения оператора GU или GN.

Например, для запроса - получить информацию о преподавателе с кодом 1103 кафедры 11 факультета 01 - потребуется оператор

GU Факультет (Факультет="01")

Кафедра (Кафедра="11")

Преподаватель (Преподаватель="1103")

print Преподаватель

В этом примере названия отношений совпадают с названиями соответствующих первичных ключей.

Запрос - получить список всех студентов группы 102 - реализуется следующей последовательностью операторов

GU Факультет (Факультет="01")

Группа (Группа="102")

Студент Ml: GN Студент print Студент

goto Ml

Поскольку в операторе GU не указано условие выборки в отношении Студент, текущей записью станет первая запись этого отношения, и далее циклическое повторение оператора GN обеспечит требуемое извлечение всех записей о студентах группы 102. Выход из цикла произойдет в результате получения кода возврата "конец отношения".

Сравнение моделей данных

При сравнении моделей данных очень трудно отделить факторы, характеризующие принципиальные особенности модели, от факторов, связанных с реализацией этих моделей данных средствами конкретных СУБД.

Рассматривая преимущества и недостатки известных моделей данных, следует отметить ряд несомненных достоинств реляционного подхода'.

• Простота. В реляционной модели всего одна информационная конструкция, которая формализует табличное представление данных, привычное для пользователей-экономистов.

• Теоретическое обоснование. Наличие теоретически обоснованных методов нормализации отношений и проверки ацикличности структуры позволяет получать базы данных с заданными характеристиками.

• Независимость данных. Когда необходимо изменить структуру реляционной БД, это, как правило, приводит к минимальным изменениям в прикладных программах.

Среди недостатков реляционной модели данных необходимо назвать следующие.

• Низкая скорость при выполнении операции соединения.

• Большой расход памяти для представления реляционной БД. Хотя проектирование в ЗНФ рассчитано на минимальную избыточность (каждый факт представляется в БД один раз), другие модели данных обеспечивают меньший расход памяти для представления тех же фактов. Например, длина адреса связи обычно намного меньше, чем длина значения атрибута.

Достоинствами иерархической модели данных являются следующие.

• Простота. Хотя модель использует три информационные конструкции, иерархический принцип соподчиненности понятий является естественным для многих экономических задач (например, организация статистической отчетности).

• Минимальный расход памяти. Для задач, допускающих реализацию с помощью любой из трех моделей данных, иерархическая модель позволяет получить представление с минимально требуемой памятью.

Недостатки иерархической модели.

• Не универсальность. Многие важные варианты взаимосвязи данных невозможно реализовать средствами иерархической модели, или реализация связана с повышением избыточности в базе данных.

• Допустимость только навигационного принципа доступа к данным.

• Доступ к данным производится только через корневое

отношение.

Необходимо отметить следующие преимущества сетевой модели данных.

• Универсальность. Выразительные возможности сетевой модели данных являются наиболее обширными в сравнении с остальными моделями.

• Возможность доступа к данным через значения нескольких отношений (например, через любые основные отношения). В качестве недостатков сетевой модели данных можно назвать.

• Сложность, т.е. обилие понятий, вариантов их взаимосвязей и особенностей реализации.

• Допустимость только навигационного принципа доступа к данным.

Результаты, полученные для ациклических баз данных, позволяют говорить о равноценных возможностях представления информации у ациклических реляционных БД, двухуровневых сетевых БД и иерархической БД без логических связей.

При анализе моделей данных не затрагивалась проблема упорядоченности значений в отношениях баз данных. Для реляционной модели данных эта упорядоченность с теоретической точки зрения необязательна, а в двух других моделях она широко используется для повышения эффективности реализации запросов.

На окончательный выбор модели данных влияют многие дополнительные факторы, например, наличие хорошо зарекомендовавших себя СУБД, квалификация прикладных программистов, размер базы данных и др.

В последнее время реляционные СУБД заняли преимущественное положение как средство разработки ЭИС. Недостатки реляционной модели компенсируются ростом быстродействия и ресурсов памяти современных ЭВМ. Вследствие процессов децентрализации управления в экономике многие базы данных ЭИС имеют простую структуру, которая легко трансформируется в понятные системы таблиц (отношений).

Рейтинг@Mail.ru