+7 (495) 223-27-93 перезвоните мне

OLAP. Мифы и реальность

Бизнес накопил огромные объемы информации, но без умения эффективно использовать ее при принятии решений, информация становится бесполезной. Исторически анализ начинался с построения отчетности в учетных системах, однако попытки развития отчетности транзакционной системы в полноценный инструмент аналитика показала ограниченность данного подхода. Выявились следующие проблемы: в учетной системе могут храниться данные только последнего периода; структура информации нацелена на оперативное внесение данных и не эффективна при группировке по аналитическим признакам; нужная информация может быть «рассеяна» по базам разных учетных систем и т.п.

Требовался совершенно новый подход, который был предложен в 1993 году основоположником реляционных баз данных Эдгаром Коддом. Сформулированные им 12 правил определили сущность технологии OLAP (On-Line Analytical Processing), впоследствии переработанные в принцип FASMI (F ast A nalysis of S hared M ultidimensional I nformation), в соответствии с которыми система должна обеспечить:

Fast (Быстрый) – быстрый отклик системы, чтобы аналитик «не терял мысль» (не более 5 сек)

Analysis (Анализ) – полнофункциональный анализ максимально удобным способом

Shared (Разделяемой) – многопользовательский доступ, защиту информации и т.п.

Multidimensional (Многомерной) – многомерное концептуальное представление данных в виде кубов с иерархическими измерениями

Information (Информация) – получение информации в нужном объеме, там где она необходима

Центральным пунктом в этом списке является многомерное представление данных. При таком подходе данные, интересующие пользователя, классифицируются по заданному набору признаков, образующему измерения многомерного пространства данных. Это позволяет пользователю видеть интересующую его информацию в наиболее интуитивно понятном виде – в виде таблицы, по осям которой развернуты нужные сочетания аналитик, а внутри находятся сгруппированные нужным образом данные.

В настоящее время технология OLAP получила широкое признание. Линейки OLAP продуктов представляют практически все основные производители программного обеспечения для баз данных. Несмотря на впечатляющие возможности технологии многомерных баз данных, ряд распространенных заблуждений часто мешает успешному внедрению OLAP продуктов.

Мифы об OLAP

Миф 1. OLAP – online анализ, значит в нем наиболее актуальные данные

Под термином « online » анализ понимается быстрая реакция системы на формируемую пользователем последовательность уточняющих запросов. Анализ как бы следует за мыслью аналитика. Например, региональный менеджер может рассуждать следующим образом:

  • Чем вызван спад продаж по региону в прошлом месяце ?
  • Это связано с определенным магазином ?
  • Как по этому магазину распределялись продажи по дням ?
  • Почему такие низкие продажи в первой половине месяца ?
  • Хорошо ли продавались товары группы « A » ?
  • Были ли эти товары на складе ?

И после этого менеджер может принять решение, например, о повышении страхового запаса товаров группы «А» на складе.

При этом далеко не обязательно, что в аналитической базе присутствуют данные до последней транзакции. Достаточно распространенной является практика, когда данные в аналитической базе обновляются раз в сутки, и содержат информацию «на начало дня». Во многих случаях, как например в выше приведенном, это не влияет на достоверность анализа.

Миф 2. OLAP это просто средство визуализации данных

Когда начинающие пользователи OLAP начинают работу с ним, они часто воспринимают OLAP – просто как средство отображения тех же данных, что есть в учетной системе, в многомерном виде. Этим заблуждением часто пользуются некоторые производители программных продуктов, предлагающие пользователям псевдо OLAP функциональность, например имитация куба с помощью запросов к традиционной базе. В действительности же данные решения крайне зависимы от объема данных в базе, что вступает в противоречие с одним из базовых правил Э. Кодда, требующего чтобы производительность формирования отчетов существенно не падала с увеличением размеров базы данных. В OLAP продуктах это достигается хранением предварительно вычисленных агрегированных значений. Например, в отличие от традиционных баз учетных систем, где хранится список продаж товаров, в OLAP базе дополнительно могут храниться итоги продаж в разрезе товаров, категорий товаров, клиентов и т.п.

Миф 3. OLAP заменяет систему отчетности

Другим распространенным заблуждением является мнение о том, что настроив OLAP систему предприятие непосредственно получит от неё всю полноту требуемой отчетности. На самом деле многое зависит от специфики отчетности предприятия. Часто отчетность характеризуется жесткой регламентацией форм, требованиями к периодичности формирования, спискам рассылки. Эти требования могут быть обеспечены, только использованием системы построения отчетов вместе с OLAP .

Другим важным моментом является то, что часто предприятия используют объемные отчеты с высокой степенью детализации. Такие отчеты пользователи часто могут более эффективно строить без использования многомерных структур, т.к. время отклика многомерных систем обычно линейно зависит от количества возвращаемых ячеек. OLAP эффективен на запросах возвращающих итоговые данные, получение которых традиционными методами требует большого объема вычислений.

Миф 4. «Достаточно только подключить OLAP к учетной системе, и мы сразу получим желаемый результат»

Другая формулировка: « OLAP консолидирует данные разных учетных систем». Многомерная база, действительно, обычно содержит консолидированные из разных учетных систем данные. Однако, несмотря на то, что OLAP продукты обычно имеют возможности подключения к различным учетным системам, в большинстве случаев задача консолидации решается на уровне хранилища данных. В процессе пополнения хранилища данными из учетных систем, кроме того, решаются такие задачи как очистка данных, отображение данных учетных систем в единое справочное пространство предприятия и т.п.

Попытка «сэкономить» на создании хранилища при внедрении OLAP часто приводит к специфическим проблемам. Способ построения OLAP непосредственно на таблицах учетной системы приводит к усложнению процесса проектирования многомерной базы, характеризуется увеличением нагрузки на базу учетной системы и почти не применим при наличии нескольких учетных систем.

Тенденции развития OLAP

От стратегии к тактике

Рост популярности OLAP приводит к дальнейшему расширению сферы его применения. Если ранее OLAP позиционировался в основном как инструмент решения стратегических вопросов и был предназначен скорее для менеджеров высшего звена, то сейчас OLAP технологии все чаще применяются рядовыми пользователями для решения повседневных задач предприятия. Другими словами, OLAP становится обычным рабочим инструментом менеджеров всех уровней предприятия.

Переход к единой информационной модели

Проблема разнородности и несогласованности данных в разных учетных базах является серьезной проблемой многих организаций. При этом пользователь часто не может не только проанализировать данные, разбросанные по разным источникам, но и даже получить их, поскольку структура оперативных баз часто далеко не прозрачна. Наиболее перспективным направлением в решении данной проблемы стала концепция создания единой информационной модели предприятия. Эта модель предоставляет доступ к информации предприятия, структурированной и представленной в понятных пользователю терминах бизнеса. При этом пользователю нет необходимости знать принципы организации первичных данных.

KPI

Возможности технологии OLAP по быстрому расчету сложных показателей позволили перейти к технологии визуального отображения для пользователя наиболее важных бизнес показателей, называемых ключевыми показателями эффективности KPI ( Key Performance Indicator ). Благодаря KPI пользователь может оперативно оценивать в каких аспектах работа компании соответствует стратегическим целям, а что вызывает тревогу и нуждается в дополнительном внимании. Также KPI отображает тенденции изменения показателей эффективности.

Увеличение оперативности данных

Спектр решаемых при помощи OLAP задач постоянно расширяется и многим пользователям кажется недостаточным наличие данных «на начало дня». Это определяет высокий интерес к разработкам, уменьшающим запаздывание информации. В настоящее время используется ряд методик повышающих актуальность данных, например загрузка только изменений ( incremental processing ), построение OLAP кубов непосредственно на таблицах оперативной базы ( ROLAP ), сегментирование данных.

Уменьшение времени отклика

Быстрое время реакции OLAP систем на запросы пользователей является одним из важнейших преимуществ данной технологии, однако современные пользователи, привыкшие за секунду находить в поисковиках ответы на любые вопросы часто не понимают, почему они должны ждать дольше ответы на свои вопросы от OLAP . Сейчас в качестве приемлемого времени реакции OLAP все чаще называют 1 секунду и многие производители OLAP продуктов принимают этот вызов.

Заключение

В настоящий момент технология OLAP занимает уверенное место в современном бизнесе. Её использование позволяет оперативно реагировать на изменяющиеся условия, принимать правильные решения, эффективно использовать время сотрудников. Глубокое владение информацией является важным конкурентным преимуществом в современном мире.