1. База данных - набор связанных данных (совместно используемый набор логически связанных дынных и описание этих данных, предназначенный для удовлетворения информационных потребностей организации). Система управления базами данных - программное обеспечение, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также осуществлять к ней контролируемый доступ (специализированная программа или комплекс программ, предназначенная для организации и ведения базы данных). Компоненты среды БД - Аппаратное обеспечение - В зависимости от требований поставленной задачи, конкретной СУБД и ОС аппаратные средства могут варьироваться от одного ПК или мейнфрейма до сети многих компьютеров. Программное обеспечение - включает в себя ПО самой СУБД, прикладных программ, ОС, сетевое. Данные. Процедуры – к ним относятся инструкции и правила, которые должны учитываться при проектировании и использовании базы данных. Пользователи.
DDL(Язык определения данных) - описательный язык, который позволяет АБД или пользователю описать и именовать сущности и атрибуты, а также связи и указать ограничения целостности и защиты. DML(Язык манипулирования данными) - язык, содержащий набор операторов для поддержки основных операций манипулирования содержащимися в базе данными. Под понятием интеграции данных подразумевается возможность представить базу данных как объединение нескольких отдельных файлов данных, полностью или частично исключающее избыточность хранения информации.
2. Преимущества - Контроль за избыточностью данных, Непротиворечивость данных(контроль над избыт позволяет уменьшить риск возник противоречивых состояний), Больше полезной информации при том же объеме хранимых данных , Совместное использование данных, Поддержка целостности данных , Повышенная безопасность, Возможность нахождения компромисса при противоречивых требованиях, Повышение эффективности с увеличением масштабов системы, Независимость отданных , Повышение доступности данных и их готовности к работе. Недостатки – Сложность, Стоимость, Затраты. Требования к БД - Время отклика, Простота обновления данных, Независимость данных, Совместн исполь данных многими польз, Безопасность данных, Целостность данных (устойчивость хранимых данных к разрушению и уничтожению)
3. Реляционная алгебра - это теоретический язык операций, позволяющих создавать на основе одного или нескольких отношений другое отношение без изменения самих исходных отношений. Выборка, проекции, декартово произведение, объединение и разность множеств. Соединения, пересечения и деления. Реляционная база данных - Набор нормализованных отношений, которые различаются по именам. SQL - язык работы с базами данных. Возможности: Создавать базы данных и таблицы с полным описанием их структуры, выполнять основные операции манипулирования данными(вставка, удаление), выполнять простые и сложные запросы.
4. Отношения обладают характеристиками - имеет имя, отличное имен всех других отношений в реляционной схеме, каждая ячейка отношения содержит только одно элементарное значение, каждый атрибут имеет уникальное имя, значения атрибута берутся из одного и того же домена, каждый кортеж является уникальным, Порядок следования атрибутов и кортежей не имеет значения.
5. Жизненный цикл – планирование, сбор и анализ требований, проектирование, создание прототипа, реализация и тестирование, преобразование данных, сопровождение. Основные задачи прект - обеспечение хранения в БД всей необходимой информации, обесп возможности получения данных по всем необходимым запросам, сокращение избыточности и дублирования данных, обесп целостности данных (правильности их содержания, исключение противоречий). Подходы к проектированию БД: 1) Восходящий - работа начинается с самого нижнего уровня атрибутов, которые на основе существующих между ними связей группируются в отношения, представляющие типы сущностей и связи между ними. Нисходящий - разработка моделей данных, которые содержат несколько высокоуровневых сущностей и связей, затем происходит уточнение низкоуровневых сущностей, связей и относящихся к ним атрибутов. Формулир и анализ требований - определение требований к системе (установить задачи исследуемой системы и которые должны учитывать не только работу текущих пользователей и области применения разрабатываемой системы, но и будущих пользователей), пользовательские представления - определяет, какие действия и над какими данными должен выполнять тот или иной пользователь, сбор и анализ требований пользователей - описание применяемых или вырабатываемых данных (т.к. какими данными монип фирма)
6-8. Концепт проектир - создания модели используемой на предприятии информации, не зависящей от любых физических аспектов ее представления (определение типов сущностей, определение типов связей). Логич проектир - концеп модель дан, уточняется и преобразуется в логическую модель данных, она учитывает особенности выбранной модели организации данных в целевой СУБД. Физич проектир - реализации бд на вторичных запоминающих устройствах; рассматриваются основные отношения, организация файлов и индексов (создание таблиц, определение конкретных структур хранения данных и методов доступа к ним. разработка средств защиты). Модель "сущность-связь" – информационное представление данных. Сущность - объект, который может быть идентифицирован неким способом, отличающим его от других объектов. Связь - ассоциация, установленная между несколькими сущностями. Перв/потенц ключ - однозначно идентифицирует каждую строку в этом отношении. Дефекты: 1) Разветвление - возникает в том случае, когда две или несколько связей типа 1:М исходят из одной сущности, решение – реструктуризация модели. Разрыв - если существует связь/и с кратностью, равной нулю (которая обозначает необязательное участие), и эти связи составляют часть пути между взаимосвязанными сущностями. Решение – введение другой связи. Словарь данных - центральное хранилище информации о данных, такой как значение, взаимосвязи с другими данными, их иcточник, применение и формат.
9. Индекс - структура данных, которая помогает СУБД быстрее обнаружить отдельные записи в файле и сократить время выполнения запросов пользователей. Первичный индекс - файл данных последовательно упорядочивается по ключевому полю, а на основе его создается поле индексации. Индекс кластеризации - файл данных последовательно упорядочивается по неключевому полю, и на основе этого неключевого поля формируется поле индексации, поэтому в файле может быть несколько записей, соответствующих значению этого поля индексации. Вторичный индекс - индекс, который определен на поле файла данных, отличном от поля, по которому выполняется упорядочение. Разреженный индекс содержит индексные записи только для некоторых значений ключа поиска, а плотный индекс имеет индексные записи для всех значений. Многоуровневые индексы - расщепление индекса на несколько субиндексов меньшего размера и создания индекса для этих субиндексов. (древовидные).
10. Метод доступа - действия, выполняемые при сохранении или извлечении записей из файла. Организация файла - физическое распределение данных файла по записям и страницам на устройстве хранения. Неупорядоченная организация файла предусматривает произвольное неупорядоченное размещение записей на диске. Упорядоченная организация предполагает размещение записей в соответствии со значением указанного поля. Хеширование записи хранятся в соответствии со значением некоторой хеш-функции. Временный неотсортированный файл (файлом переполнения). Хешир - для вычисления адреса страницы, на которой должна находиться запись, используется хеш-функция, параметрами которой являются значения одного или нескольких полей этой записи, если это поле ключевое то наз хеш-ключом (остатка от деления, символьные строки преобразуются в целые числа с использованием некоторой кодировки). Разрешение конфликтов: Открытая адресация - поиск первого доступного слота для вставки (могут вызвать конфликты с записями, которые будут иметь значение, равное адресу этого прежде свободного слота), Связанная область переполнения - выделяется доп поле, которое указывает страницу в области переполнения, использованную для разрешения конф, Многократное хеширование - применении второй хеш-функции, получении нового адреса хеширования.
11. Целостностью сущностей – в отношении ни один атрибут первичного ключая не может содержать отсутствующих значений, обозначаемых как NULL. Первичный ключ - минимальный идентификатор, который используется для уникальной идентификации кортежей. Ссылочной целостностью - если в отношении существует внешний ключ, то его значение должно либо соответствовать значению потенциального ключа некоторого кортежа либо вк должен полностью состоять из значений NULL. Корпоративные ограничения целостности - пользователи сами могут указывать дополнительные ограничения, которым должны удовлетворять данные.
12. Нормализация - метод создания набора отношений с заданными свойствами на основе требований к данным. 1НФ - отношение, в котором на пересечении каждой строки и каждого столбца содержится одно и только одно значение. 1) Повторяющиеся группы устраняются путем вывода повтор данных в пустые столбцы. 2) Атриб назначаются ключом ненормализ таблицы, а затем повторяющиеся группы изымаются и помещаются в отдельные отношения вместе с копиями ключа исх табл. 2НФ(применяется к отношениям с составными ключами) - устранение частичных зависимостей, путем удаления функционально-зависимых атрибутов и помещения их в новое отношение вместе с копией их детерминанта. ЗНФ - устранение транзитивных зависимостей(А->B и B->C), путем удаления транз зав атриб из этого отношения и помещаются в новое отношение вместе с копией их детерминанта. НФБК (Бойса-Кодда)– с учетом потенциальных ключей, функц зависим А->В допускается в отношении ЗНФ, если атрибут В является первичным ключом, а атрибут А не обяз явл потенц ключом а в НФБК обязан. 4НФ - устранении многозначных зависимостей возникш из-за 1НФ путем выделения в новое отношение одного или нескольких атрибутов вместе с копией одного или нескольких детерминантов. Сотрудники - Отдел, при вставке нужно и то и то, при удол послед сотруд - удол отдел, при обнов нужно обнов и то и то.
14. Представление - динамически сформированный результат одной или нескольких операций, выполненных над отношениями базы данных с целью получения нового отношения. Явл виртуальным отношением, которое не всегда реально существует в базе данных, но создается в ходе выполнения запроса пользователя.
CREATE VIEW ViewName [(newColumnName [, ... ])]
AS subselect [WITH [CASCADED | LOCAL] CHECK OPTION]
WCO гарантирует, что в тех случаях, когда строка данных не удовлетворяет условию WHERE, она не будет добавлена в его базовую таблицу
DROP VIEW ViewName [RESTRICT | CASCADE]
Casade - удаляет также все представления, которые определены на основе удаляемого представления. Преимущества - защита, удобство, быстродействие. |