Системы оперативной аналитической обработки данных (olap) Основные понятия



Скачать 255.01 Kb.
страница1/5
Дата15.04.2013
Размер255.01 Kb.
ТипАнализ
  1   2   3   4   5

СИСТЕМЫ ОПЕРАТИВНОЙ АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ (OLAP)

Основные понятия


Принять любое управленческое решение невозможно, не обладая необходимой для этого информацией, обычно количественной. Для этого необходимо создание хранилищ данных (Data warehouses), то есть процесс сбора, отсеивания и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа (а нередко и создания аналитических отчетов).

Приведем определение, сформулированное “отцом-основателем” хранилищ данных Биллом Инмоном: “Хранилище данных - это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений”.

Данные в хранилище попадают из оперативных систем (OLTP-систем), которые предназначены для автоматизации бизнес-процессов. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.

Причины построения и использования хранилищ данных:

  1. Анализировать данные оперативных систем напрямую невозможно или очень затруднительно: разрозненность данных, хранением их в форматах различных СУБД и в разных серверах корпоративной сети, сложность и запутанность структур хранения данных, избыточность детальной информации для анализа и принятия решений.

  2. Сложные аналитические запросы к оперативной информации тормозят текущую работу компании, надолго блокируя таблицы и захватывая ресурсы сервера.

К хранилищам данных предъявляют следующие требования (тест FASMI - Fast Analysis of Shared Multidimensional Information):

  • Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам информации. Приемлемое время отклика - 5 с или менее.

  • Analysis (Анализ) - должна быть возможность осуществлять основные типы числового и статистического анализа.

  • Shared (Разделяемой) - множество пользователей должно иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации.

  • Multidimensional (Многомерной) – показатели должны вычисляться для произвольного набора классификационных признаков.

  • Information (Информации) - приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения.

В OLAP пользователь получает естественную, интуитивно понятную модель данных, представленную в виде многомерных кубов (Cubes). Измерениями (Dimensions) многомерной системы координат служат основные атрибуты (признаки) анализируемого бизнес-процесса. Таким образом, измерение – набор значений (members) одного типа для идентификации некоторого свойства бизнес-процесса. Значения, “откладываемые” вдоль измерений, называются метками (members).

Измерение может иметь иерархическую структуру – задавать некоторую классификацию значений.
В этом случае набор описывается полями по числу уровней иерархии (классификации). Исключением – является время (Time dimension) для которого вводится набор из общеизвестных уровней (день, неделя, месяц, квартал, год). Например, для продаж измерениями могут быть товар, регион, тип покупателя.

Значения всех измерений (координат) задают ячейку куба (cell) с которой связан набор показателей (Measures).На пересечениях осей - измерений (Dimensions) - находятся данные, количественно характеризующие процесс – меры или показатели (Measures). Это могут быть объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п.

В качестве мер в трехмерном кубе, изображенном на рис. 1, использованы суммы продаж, а в качестве измерений - время, товар и магазин. Измерения представлены на определенных уровнях группировки: товары группируются по категориям, магазины - по странам, а данные о времени совершения операций - по месяцам.



Рис. 1. Пример куба

Операции манипулирования в кубах

Формирование "Среза". Пользователя редко интересуют все возможные комбинации значений Измерений. Подмножество гиперкуба, получившееся в результате фиксации значения одного или более Измерений, называется Срезом (Slice).

Двумерное представление куба можно получить, “разрезав” его поперек одной или нескольких осей (измерений): мы фиксируем значения всех измерений, кроме двух, - и получаем обычную двумерную таблицу. В горизонтальной оси таблицы (заголовки столбцов) представлено одно измерение, в вертикальной (заголовки строк) - другое, а в ячейках таблицы - значения мер. При этом набор мер фактически рассматривается как одно из измерений - мы либо выбираем для показа одну меру (и тогда можем разместить в заголовках строк и столбцов два измерения), либо показываем несколько мер (и тогда одну из осей таблицы займут названия мер, а другую - значения единственного “неразрезанного” измерения).

На рис. 2 - здесь изображен двумерный срез куба для одной меры - Unit Sales (продано штук) и двух “неразрезанных” измерений - Store (Магазин) и Время (Time).


Рис. 2. Двумерный срез куба для одной меры
Значения, “откладываемые” вдоль измерений, называются метками (members). Метки используются как для “разрезания” куба, так и для ограничения (фильтрации) выбираемых данных - когда в измерении, остающемся “неразрезанным”, нас интересуют не все значения, а их подмножество, например три города из нескольких десятков. Значения меток отображаются в двумерном представлении куба как заголовки строк и столбцов.

Операция Агрегации (Drill Up) - переход от детализированных данных к агрегированным. Агрегации выполняется при «проекции» куба на меньшее число измерений или при фиксации недетального уровня иерархии измерения.

Операция Детализации (Drill Down) - переход от более агрегированных к более детализированным данным.

Архитектура OLAP

Многомерность в OLAP-приложениях может быть разделена на три уровня:

  • Многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.

  • Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.

  • Многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.

Конкретные OLAP-продукты, как правило, представляют собой либо средство многомерного представления данных, OLAP-клиент (например, Pivot Tables в Excel 2000 фирмы Microsoft или ProClarity фирмы Knosys), либо многомерную серверную СУБД, OLAP-сервер (например, Oracle Express Server или Microsoft OLAP Services).

Слой многомерной обработки обычно бывает встроен в OLAP-клиент и/или в OLAP-сервер, но может быть выделен в чистом виде, как, например, компонент Pivot Table Service фирмы Microsoft.
  1   2   3   4   5

Похожие:

Системы оперативной аналитической обработки данных (olap) Основные понятия iconСистемы оперативной аналитической обработки (olap online analytical processing)
Системы оперативной аналитической обработки (olap — online analytical processing)
Системы оперативной аналитической обработки данных (olap) Основные понятия icon7. Краткая история развития вычислительной техники
...
Системы оперативной аналитической обработки данных (olap) Основные понятия iconСистемы оперативной обработки транзакций
Проблема целостности – в обеспечении правильности данных бд в любой момент времени. Она может быть нарушена в след случаях: при вводе...
Системы оперативной аналитической обработки данных (olap) Основные понятия iconЭкзаменационные вопросы по курсу аналитическая химия для 3 курса факультета смфо
Основные понятия аналитической химии: метод анализа, методика определения, качественный химический анализ, количественный анализ....
Системы оперативной аналитической обработки данных (olap) Основные понятия iconВ широком смысле
Табличные базы данных (БД): основные понятия (поле, запись, первичный ключ записи); типы данных. Системы управления базами данных...
Системы оперативной аналитической обработки данных (olap) Основные понятия iconСеминар №7 Технология olap и многомерные модели данных
Технология olap ориентирована, главным образом, на обработку нерегламентированных запросов к хранилищам данных
Системы оперативной аналитической обработки данных (olap) Основные понятия iconКалендарные сроки
Основные понятия и основные разделы современной аналитической химии. Значение аналитической химии в фармации. Качественный анализ....
Системы оперативной аналитической обработки данных (olap) Основные понятия iconЛекция №11 olap, oltp краткое описание: Транзакции. Oltp. Многомерная модель данных. Olap
Транзакция. Действие или ряд действий, выполняемых одним пользователем или прикладной программой, которые осуществляют чтение или...
Системы оперативной аналитической обработки данных (olap) Основные понятия iconСистема управления базами данных (субд). Назначение и основные функции. База данных
База данных (БД) это хранящаяся во внешней памяти ЭВМ совокупность взаимосвязанных данных, организованных по определенным правилам,...
Системы оперативной аналитической обработки данных (olap) Основные понятия iconМетоды распределенной обработки данных. Основные понятия
Среди всех изменений, происшедших в области связанной с научными исследованиями вычислительной техники, некоторые в особенности повлияли...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org