Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци



Скачать 274.05 Kb.
Дата11.07.2014
Размер274.05 Kb.
ТипЛекция

Оглавление


Лекция 2. 20/09/2011 1

Теоретико-множественные операции. 2

Расширенное декартово произведение. 2

Специальные операции. 3

Язык SQL. 4

Основные объекты реляционной БД. 4

Лекция 3. 04/10/2011 4

Структура SQL. 5

Типы данных. 6

Оператор выбора SELECT. 7

Лекция 4. 18/10/2011 (скатать у Тёмы) 7

Применение агрегатных функций и вложенных запросов SELECT. 7

Лекция 5. 01/11/2011 8

Лекция 6. 15/11/2011 10

Лекция 7. 29/11/2011 12

Лекция 8. 13/12/2011 ТУТ ПРОПУЩЕН ДИКИЙ КУСОК, ПЕРЕПИСАТЬ! (Собянин – му*ак) 15

Лекция 9. 07/02/2012 (Семестр 8) 16

Лекция 10. 14/02/2012 18

Основные определения БД 19

Архитектура БД. Физическая и логическая независимость. 19

Пользователи БД. Основные ф-ции группы администратора БД 19

Лекция 11. 21/02/2012 20

Процесс прохождения пользовательского запроса 20




Лекция 2. 20/09/2011


Тетта - сравнимые атрибуты (Если атрибуты принимаю значения из одного и того же домена). – множество допустимых операций сравнения, заданных для данного домена.

D – Числовые данные,

Схемы двух отношений называются эквивалентными, если они имеют одинаковую степень и возможно такое упорядочение атрибутов в схеме, что на одинаковых местах будут находиться сравнимые атрибуты (т.е. атрибуты, принимающие значения из одного домена).
Например:

SR1=(A1, An)

SR2=(B1, Bn)

SR1~SR2, если Ai принадлежит Di и Bi принадлежит Di


В реляционной базе отношения поддерживаются с помощью ключей.

PK – Primary key

FK – Foreign Key

В каждой связи одно отношение является основным, другое – подчиненным (содержит FK).


Операции над отношениями. Реляционная алгебра.

Алгеброй называется множество объектов с заданным на нем совокупностью операций замкнутых относительно этого множества, называемого основным множеством.

Основной объект реляционной алгебры – отношение.

8 операций предложенных Коддом – избыточное множество. Теоретико-множественные (основные) (4) специальные операции (4).



Теоретико-множественные операции.


Объединение. Объединением называется отношении содержащее множество кортежей принадлежащих либо первому либо второму исходным отношениям, либо обоим вместе.

R1={r1}, R2={r2}, r1 и r2 – кортежи

R1 gif" align=absmiddle hspace=8>R2= {r|rR1 v rR2}
Пересечение. Пересечением называется отношение, которое содержит множество кортежей принадлежащих одновременно и первому и второму отношниям

R1 R2={r|rR1 ^ rR2}


Разность. Разностью отношений называется отношение, содержащее множество кортежей, принадлежащих R1 и не принадлежащих R2.

R1 R2={r|rR1 ^ rR2}

Объединение и пересечение – коммутативные операции, а разность несимметричная операция. Операции применимы только к отношениями с эквивалентными схемами.

Расширенное декартово произведение.


Не накладывает доп. Условий на схемы отношений.

R1R2

Сцепление (конкатенация) кортежей.

c=1 ,c2,…cn>

q=1 ,q2,…qm>

(c,q)=< c1 ,c2,…cn , q1 ,q2,…qm >

Конкотенация – кортеж, полученный добавлением одного значения в конец первого.

n,m – число эл-тов

т.е. степень результирующего отношения изменяется.
Расширенным декартовым произведением. Отношения R1={r} степени n со схемой SR1=(A1, An) и отношения R2={q2} степени m со схемой SR2=(B1, Bm) называется отношение R3( A1, An, B1, Bm) степени n+m, содержащие кортежи, полученные сцеплением каждого кортежа r отношения R1 с каждым кортежем q отношения R2 т.е. R1R2={(r,q)| rR1 ^ qR2}.

Операция симметрична, она используется для получения универсума (отношение, характеризующее все возможные комбинации между элементами)


Вся эта группа избыточна, специальные операции можно записать разными способами.

Специальные операции.


Горизонтальны выбор (операция фильтрации, операция ограничения отношений)

Вводим обозначения.

Пусть – булевское выражение, составленное из термов срвнения с помощью связок И, ИЛИ, НЕ.

В качестве термов допускаются

а) Терм Аос а, где А – имя атрибута принимающего значение из домена D, константа из того же домена, ос – операция сравнения, допустимая в D.

б) Терм АосВ, из А и В имена тетта – сравнимых атрибутов, принимающих значения из одного и того же домена. Тогда результатом операции выборки на отношении R называется отношение R[] , включающее те кортежи из исходного отношения, для которых истинно условие выбора или фильтрации.

R[] = { r|rR1 ^ =True}

в) Операция проецирование.

Пусть R={r} – отношение SR=(A1, An), пусть B – подмножество {Ai}, т.е. B{Ai}.

Пусть B` - множество атрибутов Ai не вошедшие в B.

B B` = пустое

B B`={Ai}

Если B={Ai1, Ai2, Aik}, B`={ Aj1, Aj2, Aje}

И s=i1, ai2, aik> , aik Aik

q=j1, aj2, aje> , aje Aje


  • r[B]=S, причем r=(s,q)

Проекцией отношения R на набор атрибутов B называется отношение со схемой, соответствующей набору атрибутов B. SR[B]=B, содержащему кортежи, получаемые из исходного отношения R путем удаления из них значений не принадлежащих атрибутам из набора B.

R[B]={r[B]}

По определению все дублирующие кортежи удаляются из результирующего отношения.

г) Операция условного соединения НА СЕМИНАРЕ БУДЕТ!

д) Операция деления НА СЕМИНАРЕ БУДЕТ!

Язык SQL.


SQL (Structure Query Languale)

70е – прототип IBM Reseach -> СУБД IBM system R

Стал стандартом де-факто, позже в 1989 г. был принят первый стандарт SQL/89 SQL 1.

Конец 1992 г. – SQL/92 SQL 2.

В 1999 г. SQL/99 или SQL 3.

SQL нельзя полностью отнести к традиционным языкам программирования.



Основные объекты реляционной БД.


Tables – отношения (таблицы). Хранят данные, имеют структуру, ограничения на типы данных и связи между таблицами.

Views – представление (виртуальные таблицы). Выглядит как таблица, но ими не являются, а просто есть результат выполнения запроса. Информация, которая видима через представления не сохраняется в БД как самостоятельный объект.


Лекция 3. 04/10/2011


Indexes – дополнительные структуры (таблицы), создаваемые для повышения производительности работы с данными. Индекс содержит индексируемые поля + внешний ключ от индексируемой таблицы.

Constraints – ограничения целостности. Объекты для обеспечения логической целости данных, механизм, обеспечивающий автоматический контроль соответствия данных установленным условиям (или ограничениям). Существует 2 основных типа ограничения: ограничение целостности данных и ограничение целостности ссылок. Если про данные – то это столбцы (not null,primary key, uniqe, check)

Если про ссылки – то это ключи.

Keys – один из видов ограничения целостности ссылок.

Stored Procedure – группа команд SQL объединенных в один модуль, имеет имя и компилируется\выполняется как целое.

Trigers – специальные хранимые процедуры, вызываемые автоматически, при изменении данных в таблице. Процедуры, которые срабатывают при наступлении определенного события в БД.

Sequence – последовательность (генератор последовательности чисел).

User defined function – создаваемые пользователем функции. Это конструкции, часто содержащие исполняемые коды. Функция выполняет какие-либо действия над данными и возвращает значение.

User defined Data Types – пользовательские типы данных. Это типы данных, которые создает пользователь на основе системных типов данных.

НА СЕМИНАРЕ БУДЕТ ПРИМЕР!

Users – пользователи, обладающие доступом к БД.

Roles – позволяет объединять пользователей в группы.

Rules – позволяет контролировать логическую целостность БД.

Defaults – умолчания, стандартные установки БД. Самостоятельный объект БД, обеспечивающий вставку значений по-умолчанию.

Структура SQL.


SQL – полный язык, содержит операторы описания данных и операторы запросов. Операторы предназначенные для управления (администрирования).

Блоки SQL.



  1. DDL – операторы определения данных. Data Definition Language.

CREATE

ALTER Название объекта Имя объкта

DROP


  1. DML – операторы манипулирования данными. Data Manipulation Language.

INSERT

UPDATE … !

DELETE


  1. DQL - язык запросов. Data Query Language.

Содержит оператор SELECT, который заменяет все операции реляционной алгебры и позволяет сформировать результирующее отношение, соответствующе запросу.

  1. Средства управления транзакциями.

COMMIT – завершить транзакцию.

ROLLBACK – откатить транзакцию (отменить все изменения, произведенные в ходе выполнения транзакции).

SAVE POINT – сохранить промежуточную точку выполнения.


  1. Средства администрирования данных.

CREATE DBAREA – создать область хранения.

ALTER DATEBASE – изменить базу данных.

DROP PASSWORD – удалить пароль.

GRANT – предоставление прав.

REVOKE – лишение прав.


  1. Программый SQL.

PL/SQL – для Oracle


Типы данных.


Основные типы данных в SQL/89:

CHRACTER(n) или CHAR(n) – символьные строки.

NUMRIC[(n,m)] – точные числа.

DECIMAL[(n,m)] – десятичные числа.

INTEGER или INT – целые числа.

REAL – вещественные числа

DOUBLE PRECISION – в 2 раза круче REAL.
В стандарте SQL/92 добавлены:

VARCHAR(n) – строки символов переменной длины.

BIT(n) – строка битов постоянной длинны.

DATE – дата и время.

INTERVAL - временной интервал.

В SQL2 есть ряд стандартных встроенных функций:

CURRENT_DATE – текущая дата.

TRANSLETE(строка USING функия) – строка преобразования с использованием заданной функции.

TRIM(BOTH символ FROM строка) – удаление первого и последнего символа из строки.

Оператор выбора SELECT.


SELECT [ALL|DISTINCT]*|(имя столбца[AS новое имя][выражение][ограничение][,…n])

FROM имя таблицы[[AS] псевдоним][,…n]

[WHERE <условие поиска>]

[GROUP BY имя столбца [,…n]]

[HAVING <критерий выбора групп>]

[ORDER BY имя столбца [,…n]]


ALL – включаются строки удовлетворяющие условию

DISTING – неповторяющееся

* - включаются все столбцы

FROM – перечень всех отношений (или таблиц) на основании которых строится запрос

WHERE – условие отбора строк или условие соединения кортежей

GROUP BY – список полей группировки

HAVING – предикаты-условия, накладываемые на каждую группу

ORDER BY – список полей по которым упорядочивается результат


Лекция 4. 18/10/2011 (скатать у Тёмы)


В where могут быть использованы следующие предикаты:

1. Предикаты сравнения (=,<,>,>=,<=).

2. Предикат BETWEEN – принимает значение между A и B, когда он истинен.
3. Предикат вхождения в множество IN – истинен тогда, когда сравниваемое значение входит в множество заданных значений.

4. Предикат сравнения с образцом. Like и NOT Like

5. Предикат сравнения с неопределенным значением. IS NULL; IS NOT NULL.

Введение NULL значение потребовало модификации классической двузначной логики и превращение ее в трехзначную. Все логические операции, производимые с неопределенными значениями подчиняются этой логике, в соответствии с заданной таблицы истинности.

*табличка трехзначной логики*

6. Предикат существования EXIST; NOT EXIST.



Применение агрегатных функций и вложенных запросов SELECT.


Существуют функции, позволяющие вычислять обобщенные групповые значения, которые требуют предварительную операцию группировки. Агрегатные функции используются подобно именам полей. Они берут имя поля, как аргумент. Агрегатные функции нельзя использовать в предложениях where, потому что.

Вложенные запросы, внешние соединения – на практике


Проектирование баз данных на основе принципов реализации

База данных развиваются в соответствии с осн. Этапами жизненного цикла любого ПО

Реализация

Отладка и тестирование

Внедрение и эксплуатация

Лекция 5. 01/11/2011


Системный анализ должен заканчиваться подробным описанием объектов системной области, которые должны храниться в БД, формулировкой конкретных задач, решаемых в БД с кратким описанием алгоритма их решения, требования со стороны пользователя, описанием выходных документов, описанием входных документов.
Пример описание предметной области.

1. Разрабатывается ИС для авторизации и учета выдачи книг в библиотеке.

В ней имеются:

-системный каталог (содержит описания книг, у каждой уникальный номер, систематизация по областям знаний)

Книги:

- уник. номер



- название

- фамилии авторов

- год издания

- колич. страниц

- стоим.

- к-во экз. в библиотек.


Читатели:

- номер читат. Билета

- ФИО

- домашн. адрес



- телефон

- дата рождения


Каждая книга может присутствовать в нескольких экземплярах.

Экземпляры:

- инвнт. номер

- шифр книги

- место в библиотеке
Вкладыш:

- номер читателя

- дата выдачи

- дата возврата


При работе библиотеки выполняются следующие правила:

1. Книга может не иметь автора.

2. Книги за 90й год – в утиль.

3. Читатели не моложе 14.

4. Не более 5 книг в руки.

5. Не более 1го экземпляра книги в руки.

6. Не регистрировать без телефона.
Предполагается, что с ИС будут работать следующие группы пользователей:


  1. Библиотекари

  2. Читатели

  3. Администрация библиотеки

При работе с БД библиотекарь должен иметь возможность решать следующие задачи.

  1. Принимать и регистрировать новые книги.

  2. Проводить каталогизацию.

  3. Осуществлять списание.

  4. Вести учет выданных книг.


Читатель должен иметь возможность делать следующее:

  1. Просмотреть системный каталог, проводить поиск конкретных книг.

  2. Узнавать о том, свободна ли книга.

  3. Список книг, зафиксированных за ним книг.


Администрация должна иметь возможность:

  1. Что читается, что нет.

  2. Сведения о должниках.

  3. Сведения о стоимости книг.

Перед началом разработки необходимо провести системный анализ предметной области.


Инфологическое моделирование.

Инфологическая модель применяется на 2м этапе моделирования БД, т.е. после словесного описания предметной области. Инфологическая модель – описание предметной области, которое легко читается, как специалистами по БД, так и специалистами в предметной области. Инфологическое проектирование связано с представлением семантики предметной области в модели БД. Модель сущность-связь, Чен (1976) Entity RelationshiD ER-модель. В основе ER модели лежат следующие понятия:



  1. Сущность – моделирует класс однотипных объектов. Имеет уникальное имя. Существует множество экземпляров данной сущности. Может иметь набор атрибутов – характеристик, определяющих свойство данного представителя класса. По атрибутам можно различать конкретные экземпляры сущностей. Набор атрибутов, однозначно идентифицирующих конкретный экземпляр сущности называют ключевым. Графическая нотация – прямоугольник. Между сущностями могут быть установлены связи – бинарные ассоциации, сущности соотносятся и взаимодействуют между собой. Связь может существовать между экземплярами одной сущности – рекурсивная связь. Если связь устанавливается между 2мя сущностями, то она определяет взаимосвязь между экземплярами этих сущностей.

Лекция 6. 15/11/2011


Эта связь показывает, как связаны экземпляры сущности между собой, например «картинка». Связи делятся на 3 типа по множественности: 1к1, 1кМ, МкМ. Связь показывает взаимосвязь между экземплярами сущности. Между двумя сущностями может быть задано необходимое количество связей с разными смысловыми нагрузками. Связь может иметь название. Связь может быть обязательной, необязательной. В ER модели допускается принцип категоризации сущностей. (дополнительно - самостоятельно) В результате построения модели предметной области мы получаем связный граф. Если все построено правильно, то в нем нет циклических связей.

Пример. Разработка инфологической модели для разработки предметной области «библиотека»



Атрибуты сущности бывают:



  1. Идентифицирующие и описательные. Идентифицирующие – имеют уникальное значение для данного типа и являются потенциальными ключами

  2. Простые и составные. Простой атрибут состоит из одного компонента и его значение неделимо.

  3. Однозначные и многозначные. Могут иметь одно или несколько значений для каждого экземпляра сущностей.

  4. Основные и производные. Значение основного атрибута не зависит от других атрибутов

Переход от инфологической модели к реляционной модели данных.

Для этой модели сущность-связь существует алгоритм однозначного преобразования ее в реляционную модель данных, и это позволило разработать множество экспериментальных систем.

Правила:


  1. Каждой сущности ставится соответствие реляционной модели данных. Имена могут быть различными. На имена отношений накладываются дополнительные синтаксические ограничения от СУБД.

  2. Каждый атрибут сущности становится атрибутом соответствующего отношения. Переименование атрибутов соответствует ограничениям пункта 1. На этом этапе можно для каждого атрибута задать тип данных и признак обязательности.

  3. Идентифицирующий атрибут в сущности становится PK соответствующего отношения. Атрибуты, входящие в PK должны стать NOT NULL.

  4. В каждое отношение соответствующее подчиненной сущности добавляется набор атрибутов основной сущности, являющийся первичным ключом. В отношении соответствующем подчиненной сущности этот набор атрибутов становится внешним ключом (FK).

  5. Для моделирования необязательного типа связи у атрибутов, соответствующих внешнему ключу устанавливается признак неопределенности значений (NULL).

  6. Разрешение связей типа многие-ко-многим. Вводится специальное дополнительное связующее отношение, которое связано 1кМ, и имеющий ключ FK из первого и FK из второго, которые вместе являются ключом.

Построение даталогической модели (на основе реляционной модели данных).

Рисунок

Проектирование реляционных баз данных на основе принципах нормализации.



Даталогическое проектирование. В реляционных БД даталогическое или логическое проектирование приводит к разработке схемы БД, т.е. совокупности схем отношений, которые адекватно моделируют абстрактные объекты предметной области и семантические связи между этими объектами. Основа анализа корректности – функциональные зависимости между атрибутами БД. Необходимо избавляться от нежелательных функциональных зависимостей. Кроме построения корректной схемы БД в результате выполнения этапа должны быть получены следующие результирующие документы.

Лекция 7. 29/11/2011


  1. Описание схемы БД в терминах выбранной СУБД.

  2. Описание внешних моделей в терминах выбранной СУБД.

  3. Описание декларативных правил поддержки целостности БД.

  4. Разработка процедур.

Базовые этапы построения корректной схемы БД.

Корректной схемой БД называется такая, в которой отсутствуют нежелательные отношения, между атрибутами отношений.

Процесс разработки корректной схемы реляционной БД называется логическим или датологическим проектированием. Существует 2 пути: декомпозиция (разбиение) множество исходных отношений заменяется другими отношениями и число их возрастает. Путь синтеза.

Классическая технология проектирования БД связана с теорией нормализации, основанной на анализе функциональных зависимостей между атрибутами отношений. Функциональные зависимости определяют устойчивые отношения между объектами и их свойствами в рассматриваемой предметной области. Проектирование путем декомпозиции – это последовательная нормализация схем отношений с получением нормальных форм более высокого уровня. Каждой нормальной форме соответствует некоторый набор ограничений и отношение находится в некоторой НФ, если оно удовлетворяет свойственному этому набору ограничениям. В теории БД обычно выделяют следующую последовательность нормальных форм.

Первая Н.Ф. (1НФ,1NF)

Вторая Н.Ф.

Третья Н.Ф.

НФБК


Четвертая Н.Ф.

Пятая Н.Ф. (Форма проекции соединения) (5NF/PJNF)

Основные свойства нормальных форм


  1. Каждая следующая НФ улучшает свойства предыдущей

  2. При переходе следующей НФ свойства предыдущих НФ сохраняется

  3. При декомпозиции должна сохраняться эквивалентность схем БД при замене одной схемы на другую

Схема БД называются эквивалентными, если содержание исходной базы может быть получено путем естественного соединения отношений, входящих в схему и при этом не появляется новых кортежей в исходной БД. При выполнении эквивалентных преобразований сохраняется множество исходных фундаментальных зависимостей, между атрибутами отношений. Определение функциональной зависимости. Это набор атрибутов B отношения R от наборов атрибутов A того же отношения R.A->R.B или A->B называется такое соотношение проекций R[A] и R[B], при котором в каждый момент времени любому элементу R[A] соответствует только 1 элемент R[B], входящий вместе с ним в какой-либо кортеж отношения R. Функциональная зависимость R.A->R.B является полной, если набор атрибутов B функционально зависит от A и не зависит функционально от любого подмножества A, ∀A1 A->R.A1-|->R.B

Транзитивная функциональная зависимость.

Функциональная зависимость называется транзитивной, когда существует набор атрибутов C такой, что:


  1. C не является подмножеством A

  2. C не включает в себя B

  3. Существует функциональная зависимость R.A->R.C (C от A)

  4. Не существует функциональной зависимости R.C->R.A (A от C)

  5. Существует функциональная зависимость B от C R.C->R.B

Возможным ключом отношения называется набор атрибутов этого отношения. Который полностью и однозначно (функционально полно) определяет значение остальных атрибутов отношения. Не может не существовать возможного ключа. Если его нет – значит все атрибуты – ключ. В общем случае в отношении может быть несколько возможных ключей.

Неключевой атрибут - атрибут, который не входит в состав ни одного возможного ключа. Взаимно независимые атрибуты – такие, которые не зависят функционально один от другого. Если в отношении существует несколько функциональных зависимостей, то каждый набор атрибутов, от которого зависят другие называется детерминантом отношения. Ряд зависимостей могут быть выведены из аксиом Армстронга.



  1. Рефлексивность. Если B является подмножеством A, то B функционально зависит от A.

  2. Дополнение. Если A->B то A.C->B.C

  3. Транзитивность. Если A->B и B->C, то A->C

Данные аксиомы позволяют избежать избыточного представления функциональных зависимостей и позволяют выводить функциональные зависимости одна из другой. Эти правила являются полными и исчерпывающими, т.е. применяя их из заданного множества функциональных зависимостей можно вывести все возможные функциональные зависимости. Множество всех возможных функциональных зависимостей называется его замыканием.

Отношение находится в 1НФ тогда, когда на пересечении столбца и строки находится только 1 значение атрибута.

Отношение находится во 2НФ если она находится в 1НФ и не содержит неполных функциональных зависимостей непервичных атрибутов от атрибутов первичного ключа.

Пример:


(ФИО, номер студака, группа, дисциплина, оценка)

(ФИО, номер студака, группа)

(номер студака, дисциплина, оценка)

Третья НФ – отношение находится в 2НФ и не содержит транзитивных зависимостей.

(ФИО,номер зачетки, группа, факультет, специальность, выпускающая кафедра)

номер зачетки -> ФИО

номер зачетки -> группа

номер зачетки -> факультет

номер зачетки -> специальность

номер зачетки -> выпускающая кафедра

группа->факультет

группа->специальность

группа->выпускающая кафедра

выпускающая кафедра->факультет

(номер зачетки, ФИО, специальность, групп)

(группа, выпускающая кафедра)

(выпускающая кафедра, факультет)

Лекция 8. 13/12/2011 ТУТ ПРОПУЩЕН ДИКИЙ КУСОК, ПЕРЕПИСАТЬ! (Собянин – му*ак)

Раньше рассматривались детерминантные зависимости одному значению детерминанта соответствовало только одно значение зависимого атрибута, но существуют случаи, когда какому-то значению одного атрибута соответствует устойчиво постоянное множество значения другого атрибута. Например

Предмет, который студент должен сдавать однозначно определяется группой или дисциплиной.

(Номер_зачетки, Группа, Дисциплина)

Группа -> Дисциплина

Группа -> Номер_зачеткив

Из-за многозначных зависимостей могут возникнуть аномалии модификации отношения.

В теории РБД доказывается, что в общем случае отношение R(A,B,C) существует многозначная зависимость R.A->R.B в том и только в том случае, если существует многозначная зависимость R.A->R.C.

Отношение R со схемой R(A,B,C) можно спроецировать без потерь в отношения R1(A,B) и R2(A,C) в том и только в том случае, когда существует многозначная зависимость A->>B|C, что равнозначно наличию двух зависимостей A->B и A->C.

Под проецирование без потерь понимается такой способ декомпозиции отношения путем применения операции проекции, при котором исходное отношение полностью и без избыточности восстанавливается путем естественного соединения полученных отношений. Фактически теорема доказывается наличие а котором существуют несколько функциональных зависимостей.

Отношение R находится в 4НФ в том и только в том случае, если в случае существования многозначной зависимости все остальные атрибуты R функционально зависят от А. Для примера можно разделить на 2 отношения:

Оба отношения находятся в 4НФ и свободны от аномалий многозначной зависимости.

(Номер_зачетки, Группа)

(Группа, Дисциплина)

5НФ – зависимости проекции соединения. Является обобщением.

5НФ связана с анализом нового вида зависимости соединения – зависимости проекции соединения. PJ – зависимости (project-join).

Отношение R(x,y,…,z) удовлетворяет зависимости PJ-соединения (x,y,…,z) в том и только в том случае, когда R восстанавливается без потерь путем соединения своих проекций на x,y,…,z. X,y,…z – наборы атрибутов отношения. PJ – зависимости делают отношение избыточным и затрудняют операции модификации. Отношение R находится в 5НФ (PJ/NF) в том и только в том случае, когда любая зависимость соединения в R следует из существования некоторого возможного ключа в R. Рассмотрим отношение R1(Преподаватель, Кафедра, Дисциплина).

Предположим, что преподаватель может работать на нескольких кафедрах и на каждой кафедре может вести несколько дисциплин. Тогда ключ включает все 3 атрибута. В отношении отсутствуют многозначные зависимости, поэтому она находится в 4НФ. Введем следующие обозначения для набора атрибутов.

ПК (Преподаватель, Кафедра)

ПД (Преподаватель, Дисциплина)

КД (Кафедра, Дисциплина)

Допустим, что отношение R1 удовлетворяет зависимости PJ, для ПК,ПД и КД. Допустим, что отношение R1 удовлетворяет зависимости проекции соединения (ПК, ПД, КД), тогда отношение R1 не находится в NF/PJ, потому что единственным ключом его является полный набор атрибутов, а наличие зависимости PJ, связано с наборами атрибутов, которые не составляют возможные ключи отношения R1. Приводим R1 к 5NF. Получается: R2(Препод, Кафедра) R3(Препод, Дисциплина) R4(Кафедра, Дисциплина)


Лекция 9. 07/02/2012 (Семестр 8)


В истории развития вычислительной техники можно выделить 2 этапа:

  1. Применения вычислительной техники для выполнения численных расчётов. Способствовало интенсификации методов численного решения сложных метаматематических задач. Характерная особенность – наличие сложных алгоритмов вычисления, применяемых к данным.

  2. Использование средств вычислительной техники в автоматизированных информационных системах (АИС). ИС – программно-аппаратный комплекс со следующей функциональностью:

-надежное хранение информации в памяти компьютера

-выполнение специфических для данного приложения преобразования информации

-предоставление пользователю дружественного интерфейса

Вторая область возникла позже первой. Магнитная лента\барабаны, доступ последовательный\свободный.

С появления магнитных дисков началось появление систем управления данными.

Важный шаг – переход к использованию централизованного управления файлами (СУФ). Файл – именованная область внешней памяти, в которую можно записывать и считывать данные. От СУФ зависели:



  1. Правила именования файлов

  2. Способ доступа к данным, хранящимся в файле и структура этих данных

  3. Отображение имен файлов в соответствующие адреса внешней памяти

  4. Распределение памяти

  5. Обеспечение доступа данных

Для пользователя файл – некая линейная последовательность данных.

Проблемы использования файлов для хранения данных:



  1. Зависимость программ от данных. Только программа знала структура записи файла а СУФ ее не знала. В ИС к одному и тому же файлу могли обращаться несколько программ, а значит требовалась перекомпиляциях сразу всех приложений.

  2. Децентрализованное администрирование режимов доступа к файлам. СУФ должна обеспечивать авторизацию доступа к файлам. Администрирование режимов доступа к файлам выполняет разработчик.

  3. Низкая эффективность параллельной работы с одним файлом. СУФ обеспечивали режим многопользовательского доступа. В связи с необходимостью синхронизации действий по корректировке или изменению файлов одновременная работа нескольких пользователей практически не реализовывалась

Все эти недостатки заставили изменить подход к информации. Впоследствии – СУБД.

  1. БД на больших ЭВМ

История СУБД насчитывает ~40 лет

1968 – первая промышленная СУБД IMS фирмы IBM

1975 – появился первый стандарт ассоциации по языкам систем обработки данных

Conference of Data System Language (CODASyL) – определил основополагающие вещи (по сути – сетевая модель)

1981 – Э.Ф. Кодд получает премию Тьюринга за разработку реляционной модели данных.

Первый этап связан с организацией баз данных на больших машинах типа IBM 360-370, ЕС-ЭВМ и др.

БД хранились во внешней памяти центральной ЭВМ. Приложения запускались через консольные терминальные (устройства ввода-вывода). Программа доступа писались на различных языках и запускались как обычные программы.

Лекция 10. 14/02/2012


  1. Все СУБД базируются на мощных мультипрограммных операционных системах MVS, SVM, RIF, OSRN, RSX, UNIX. Поддерживали БД в режиме распределенного доступа. Низкоуровневые языки для манипулирования данными, основанные на … Значительная роль отводилась администрированию данных. Начата работ на РМД и была создана первая система System(R) появляются языки для работы с РМД

  2. Эпоха персональных компьютеров. Появились простые программы, юзеры начали ими пользоваться, начали какие-то вещи (СУБД) разрабатываться. Особенности данного этапа: все СУБД были рассчитаны на БД с монопольным доступом. Большинство СУБД имели развитый пользовательский интерфейс. В большинстве СУБД существовал интерактивный режим. Существовала возможность разработки приложений без программирования. Во всех настольных СУБД поддерживался внешний табличный вид структур данных. В настольных СУБД поддерживались низкоуровневые языки (т.е. язык был, но писали на низкоуровневых). В этих настольных СУБД отсутствовали средства поддержки целостности БД. Выродилось администрирование БД и зачахли инструментальные средства администрирования. Сравнительно скромные требования к аппаратной части. Dbase (Dbase III+, Dbase IV), FoxPro, Clipper, Paradox.

  3. Распределенные базы данных. После процесса персонализации началась интеграция, т.е. кол-во локальных сетей умножалось и поэтому очень остро встала задачи согласованности данных. Возникли задачи с обработкой транзакций (параллельное). Появились распределенные базы данных. Особенности: практически все современные СУБД поддерживают поддержку модели. Эта модель поддерживает:

- структурная целостность (допустимы только данные, представленные в виде отношений реляционной модели)

- используется язык манипулирования данными высокого уровня (SQL)

- ссылочная целостность (автоматический контроль со стороны СУБД)

Большинство современных СУБД рассчитаны на мультиплатформу. Появлись развитые средства администрирования БД на основе общей концепции средств защиты данных. Ведется научная работа, исследуется оптимизация базы данных. Разработан ряд стандартов SQL89, SQL92, SQL99, ODBC (Open DateBase Connectivity).



  1. Перспективы развития СУБД. Появилась новая технология доступа к данным – интернет. Отпадает необходимость использования клиентского ПО.

Основные определения БД


БД – именованная совокупность структурированных данных, отражающее состояние объектов и их отношений в рассматриваемой предметной области.

СУБД – совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД

Приложение – программы, с помощью которых юзвери работают с БД.

Архитектура БД. Физическая и логическая независимость.


Из всех вариантов «строения» СУБД наиболее жизнеспособной оказалось предложенная ANSI – 3х уровневая модель СУБД.

Внешний уровень – каждая модель имеет свое видение данных. Уровень определяет точку зрения БД на отдельные приложения.

Концептуальный уровень – центральное управляющее звено. Здесь БД представлена в наиболее общем виде и этот вид определяет данные, используемые всеми приложениями. Отражает обобщенную модель предметной области, для которой создавалась БД.

Физический уровень – собственно данные, которые расположены в файлах или страничных структурах на внешних носителях информации.

Такая архитектура позволяет обеспечить логическую и физическую независимость при работе с данными.

Логическая независимость – корректировка одного приложения, без корректировки других.

Физическая независимость – возможность переноса данных с одного носителя на другой.

Этого не было в файловых системах.


Пользователи БД. Основные ф-ции группы администратора БД


Как и любой другой программно-техн. Комплекс имеет несколько этапов существования. На каждом этапе связаны свои пользователи.

  1. От конечных пользователей не требуется спецефических знаний.

  2. Администраторы. Отвечают за оптимальную организацию этой базы с точки зрения одновременной работы большого кол-ва пользователей.

  3. Разработчики и администраторы приложений. В Составе группы администратора могут быть – системные аналитики, проектировщики структур данных и внешнего иформ. Обеспечения, проектировщики технологич. Процесса обработки данных, системные прикладные программисты и операторы по техническому обслуживанию

Основные ф-ции группы администраторов БД.

  1. Анализ предметной области

  2. Проектирование структуры БД

  3. Задание ограничения целостности при описании и процедуре создания

Декларативные ограничения, динамические ограничения целостности, ограничение целостности при параллельной работе пользователей.

  1. Первоначальная загрузка и ведение базы данных

  2. Защита данных

  3. Обеспечение восстановление БД

  4. Анализ обращения пользователей БД – сбор статистики

  5. Анализ эффективности

9

10

11


Лекция 11. 21/02/2012

Процесс прохождения пользовательского запроса


база метаданных

  1. Пользователь посылает СУБД запрос на получение данных из БД

  2. Анализ прав пользователя и

  3. Внешней модели данных, соответствующих данному пользователю, подтверждает или запрещает доступ к данным. В случае запрета -> 12 процесс обработки прекращается, а если все нормально, то -> 4

  4. СУБД определяет часть концептуальной модели, которая затрагивается запросом пользователя.

  5. СУБД получает информацию о запрошенной части концептуальной модели

  6. СУБД запрашивает информацию о местоположении данных на физическом уровне (файлы или физические адреса).

  7. В СУБД возвращается информация о местоположении данных в терминах ОС.

  8. СУБД просит ОС предоставить необходимые данные, используя средства ОС.

  9. ОС осуществляет перекачку данных из устройств хранения и пересылает их в системный буфер.

  10. ОС оповещает СУБД об окончании пересылки.

  11. СУБД выбирает из доставленных данных в системном буфере только необходимые пользователю данные и пересылает эти данные в рабочую область пользователя.

БМД – база метаданных. В ней хранится вся информация об используемых структурах даных, логическая реализация данных, правах доступа пользователей, о физическом расположении данных.
Понятие данные и модель данных – основополагающие категории в БД. Данные – набор конкретных значений, параметров, характеризующий объект, условие, ситуацию. Данные становятся информацией тогда, когда пользователь задает им определенную структуру, т.е. осознает их смысловое содержание. Поэтому центральным понятием в БД является понятие модели. Модель данных это абстракция, которая будучи приложима к конкретным данным позволяет трактовать их уже как информацию, т.е. сведения. Содержащие не только данные, но и взаимосвязь между ними.

Модели внешнего уровня выражают информацию о предметной области в виде, не зависимой от используемой СУБД. Это инфологические или семантические модели. Отражают …. Уровень абстрагирования, связанные с фиксацией и описанием объектов предметной области, их свойств и взаимосвязей в естественной и удобной для разработчиков и других пользователей форме. На концептуальном уровне строятся даталогические модели, поддерживаемые конкретной СУБД. Документальная и фактографическая модели отличаются уровнем структурировния информации. Документальные модели для слабо структурированной информации, ориентированной в основном на…

Модели, ориентированные на формат документа – модели, основанные….

SGML (Standart Generalised Markup Language) Был утвержден в качестве стандарта в 80х. Этот язык предназначен для создания языков разметки, он предназначен для набора допустимых тегов. Определяет их атрибуты и внутреннюю структуру документа, контроль за правильностью использования определяется набором правил DTD-описаниями, которые используются программой клиента при разборе документа. Подмножество XML и HTML подмножество SGML

HTML – язык гипертекстовой разметки, определяет оформление документа и имеет ограниченный набор инструкций (тегов)

XML – eXtensible Markup Language – язык гипертекстовой разметки, описывает класс объектов данных, которые называются xml – документов.

В модели каждому документу соответствовал дескриптор-описатель, он имеет жесткую структуру и описывает документ в соответствии с требованием к БД.

Физические модели данных оперируют категориями, которые касаются организацией внешней памяти и структур хранения используемых в данной операционной среде. В этих моделях используются различные методы размещения данных, основанные на файловых структурах, организация файлов прямого и последовательного доступа, индексных файлов и инвертированных файлов, файлов использующих различные методы хеширования и взаимосвязанных файлов, кроме того современные СУБД широко используют страничную организацию данных, основанные на страничных – наиболее перспективными.




Похожие:

Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconВопросы по дискретной математике
Множества. Основные операции над множествами и их свойства. Диаграммы Венна. Декартово произведение множеств
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconВопросы по курсу «Алгебра» для студентов 1 курса специальности «Математика»
Операции над множествами и их свойства. Декартово произведение множеств (определение, свойства)
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconВведение в теорию множеств
Алгебра множеств. Операции на множествах: объединение, пересечение, дополнение. Декартово произведение двух множеств. Бинарные отношения...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconПрограмма курса «Дискретная математика»
Понятие множества. Равенство и включение множеств. Пустое и универсальное множества. Булевы операции, их свойства. Упорядоченные...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconПрограмма по алгебре Группа 161, 2007/2008 учебный год, 1 семестр
Множества и операции над ними: пересечение, объединение, разность, симметрическая разность, декартово произведение. Пустое множество....
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци icon4. Планы и умм к практическим (семинарским) занятиям План практических занятий и контрольных мероприятий (1 семестр) № занятия Название темы Содержание занятия (литература)
Множество. Операции над множествами и их свойства. Декартово произведение множеств. Отношения и бинарные отношения и их основные...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци icon4. Планы и умм к практическим (семинарским) занятиям План практических занятий и контрольных мероприятий (1 семестр) № занятия Название темы Содержание занятия (литература)
Множество. Операции над множествами и их свойства. Декартово произведение множеств. Отношения и бинарные отношения и их основные...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци icon1-й и 2-й семестры Множества и отображения
Множество и его элементы. Примеры множеств. Отношение включения и его свойства. Операции над множествами: пересечение, объединение,...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconПеречень вопросов вступительного экзамена по специальной дисциплине
Модели систем: статические, динамические, концептуальные, топологические, формализованные, информационные, логико-лингвистические,...
Лекция 20/09/2011 1 Теоретико-множественные операции. 2 Расширенное декартово произведение. 2 Специальные операци iconФормирование, подготовка, выдающиеся операции спецподразделений
Венсенна, американец — корпус морской пехоты; немец — прусскую лейб-гвардию, а русский — кавалергардов и Павловский полк. Сто лет...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org