Хранилище данных

Автор работы: Пользователь скрыл имя, 23 Января 2012 в 19:32, курсовая работа

Краткое описание

Определение понятия хранилища. Типичная структура хранилища данных. Создание информационно-аналитических систем. Анализ области применения их в практике.

Содержание работы

Введение 3
1. Понятие хранилища данных 5
1.1 Типичная структура хранилищ данных, таблица фактов …...5
1.2 Таблицы измерений 9
2. Аналитические системы 12
2.1 Создание информационно-аналитических систем 12
2.2 Области применения 16
Заключение 20
Глоссарий 22
Список использованных источников 24
Приложение А 25
Приложение Б 26
Приложение В……………………………………………………………………27
Приложение Г……………………………………………………………………28
Приложение Д……………………………………………………………………29

Содержимое работы - 1 файл

ХД.doc

— 237.00 Кб (Скачать файл)

     OLAP-системы  являются частью более общего  понятия Business Intelligence, которое включает в себя помимо традиционного OLAP-сервиса средства организации совместного использования документов, возникающих в процессе работы пользователей хранилища. Технология Business Intelligence обеспечивает электронный обмен отчетными документами, разграничение прав пользователей, доступ к аналитической информации из Интернет и Интранет [4, с.24].

     Интеллектуальный  анализ данных или «добыча данных» (Data Mining)

     При помощи средств добычи данных можно  проводить глубокие исследования данных. Эти исследования включают в себя: поиск зависимостей между данными (напр., «Верно ли, что рост продаж продукта А обусловлен ростом продаж продукта В?»); выявление устойчивых бизнес-групп (напр. «Какие группы клиентов, близких по поведенческим и другим характеристикам, можно выделить? Какие характеристики клиентов при этом оказывают наибольшее влияние на классификацию?»); прогнозирование поведения бизнес-показателей (напр. «Какой объем перевозок ожидается в следующем месяце?»); оценка влияния решений на бизнес компании (напр. «Как изменится спрос на товар А среди группы потребителей Б, если снизить цену на товар С?»); поиск аномалий (напр. «С какими сегментами клиентской базы связаны наиболее высокие риски?»).

     Телекоммуникации

     Телекоммуникационные  компании используют СППР, а следовательно и хранилища данных, для подготовки и принятия комплекса решений, направленных на сохранение своих клиентов и минимизацию их оттока в другие компании. СППР позволяют компаниям более результативно проводить свои маркетинговые программы, вести более привлекательную тарификацию своих услуг.

     Анализ  записей с характеристиками вызовов  позволяет выявлять категории клиентов с похожими стереотипами поведения, с тем, чтобы дифференцировано подходить  к привлечению клиентов той или  иной категории.

     Есть  категории клиентов, которые постоянно меняют провайдеров, реагируя на те или иные рекламные компании. СППР позволяют выявить наиболее характерные признаки «стабильных» клиентов, т.е. клиентов, длительное время остающихся верными одной компании, давая возможность ориентировать свою маркетинговую политику на удержание именно этой категории клиентов.

     Банковское  дело

     СППР  используются для более качественного  мониторинга различных аспектов банковской деятельности, таких как  обслуживание кредитных карт, займов, инвестиций и так далее, что позволяет значительно повысить эффективность работы.

     Выявление случаев мошенничества, оценка риска  кредитования, прогнозирование изменений  клиентуры – области применения СППР и методов добычи данных. Классификация  клиентов, выделение групп клиентов со сходными потребностями позволяет проводить целенаправленную маркетинговую политику, предоставляя более привлекательные наборы услуг той или иной категории клиентов.

     Например  компания Intersoft Lab, специализирующаяся в области разработки аналитических и управленческих систем для банков, коммерческих и производственных предприятий, бюджетных организаций, провела демо-день на тему «Постановка и автоматизация бюджетирования в холдингах и финансово-промышленных группах».    

     Тема  демо-дня была выбрана неслучайно: сегодня все больше предприятий и компаний ощущают потребность в инструменте, с помощью которого можно четко определить возможности и перспективы развития компании, повысить финансовую обоснованность и ответственность за принимаемые управленческие решения. Достаточно сказать, что эффективные управленческие технологии позволяют сократить потребность в оборотных средствах на 10-30%. Поэтому понятен и закономерен интерес к программной разработке компании Intersoft Lab - управленческой системе "Контур Корпорация. Бюджет холдинга", созданной на основе платформы интеллектуального анализа данных "Контур". Система позволяет планировать бюджетные показатели финансово-хозяйственной деятельности предприятий холдинга, учитывать, контролировать и анализировать фактическое исполнение бюджетов. Первым шагом к знакомству с программным продуктом стало определение целей и задач внедрения бюджетного управления в холдингах и финансово-промышленных группах. Участники семинара познакомились с принципами постановки бюджетного управления в многофилиальной компании и подробно рассмотрели организационные, методические и технологические аспекты внедрения автоматизированной системы бюджетирования на предприятии. Специалисты компании Intersoft Lab подробно остановились на функциональных и технических возможностях программного комплекса "Контур Корпорация. Бюджет холдинга". Практическое применение системы было продемонстрировано на примере технологии ведения бюджета движения денежных средств. Многочисленные вопросы слушателей касались, в частности, автоматизации бюджетирования на предприятии. Большой интерес вызвало обсуждение методов "раскраски" бюджетов. Для разметки бюджетных данных аналитическими признаками существует три основных способа: настройка бюджетной аналитики и разметка бюджетных данных в учетной системе, автоматическая разметка данных в ходе загрузки на основании автоматизированных (запрограммированных) алгоритмов разметки, разметка вручную в интерфейсе системы. Все эти способы разметки данных поддерживаются в автоматизированной системе "Контур Корпорация. Бюджет холдинга".

 

Заключение

 

     Для развития и процветания бизнеса  недостаточно просто владеть информацией, все зависит от качества владения - умения четко и быстро определять категорию показателей, на основании  которых требуется принимать  решение, проводить анализ определенных значений данных показателей с различной степенью детализации с учетом всех параметров, оказывающих на них влияние. Хранилище данных является хорошим инструментом в решении данной задачи. Тот, у кого есть средства, позволяющие четко представить картину бизнес-данных, их взаимосвязь, историю возникновения, временную глубину, оказывается в выигрыше. Он может отследить тенденции развития, спрогнозировать возможные изменения, и, соответственно, получить конкурентные преимущества. Качественная визуализация данных, ориентированных на различные группы работников и отделы - одна из основных задач, решаемых с помощью хранилища данных.

     Хранилище предоставляет возможность получения  каждым подразделением данных в разрезе  интересующих его показателей, в  удобном и привычном для сотрудников этого подразделения виде. Можно сравнить хранилище с огромным складом с большим ассортиментом продукции, а информацию по подразделениям, получаемых из него, с небольшими специализированными отделами, где собрана соответствующая категория товаров. Такого рода специализированные представления информации, часто называют витринами данных. Создание хранилища данных и соответствующей инфраструктуры начинается с тщательного планирования и определения сроков работ. Первое – как уже говорилось выше – надо четко определить цели визуализации данных. Должна быть проанализирована отчетность компании. Целесообразно разбить отчетность на обязательную (предоставляемую в контролирующие органы) и внутрикорпоративную. Далее идет разделение по срокам (ежедневная, ежемесячная, ежеквартальная и т.д.). Внутрикорпоративная информация также разделяется по отделам (подразделениям) для создания витрин данных. Уже на этом этапе нужно выявить и избавиться по возможности от дублирования отчетности.

     Итак, в рассмотренной теме курсовой работы можно выделить особенности:

  1. Хранилища данных (Data warehouses) представляют собой предметно ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, предназначенный для поддержки принятия решений.
  2. Главное назначение хранилища - обеспечивать быстрое выполнение произвольных аналитических запросов.
  3. Основными составляющими структуры хранилищ данных являются таблица фактов (fact table) и таблицы измерений (dimension tables).
  4. Аналитические системы СППР позволяют решать три основных задачи: ведение отчётности, анализ информации в реальном времени (OLAP) и интеллектуальный анализ данных.

     При помощи средств добычи данных можно  проводить глубокие исследования данных. Эти исследования включают в себя: поиск зависимостей между данными; выявление устойчивых бизнес-групп; прогнозирование поведения бизнес-показателей; оценка влияния решений на бизнес компании; поиск аномалий.

     5. Областью применения хранилища данных являются следующие отрасли экономики: телекоммуникации, страхование, банковское дело и розничная торговля.

     Еще одна важная задача – это обеспечение  безопасности. Каким образом распределить доступ к хранилищу, как организовать защиту от сбоев (это и каналы связи, и сервера БД, резервное копирование) – вот вопросы, которые обязательно надо планировать и разрешать. Широко распространен способ предоставления полномочий и использование данных в хранилище на ролевой основе, когда пользователю или группе пользователей назначается определенная роль, согласно которой определяется возможность доступа к определенным группам данных, причем уровнем детализации предоставляемых данных можно весьма гибко варьировать.

     Рынок хранилищ данных сейчас находится в  стадии роста. Через некоторое время нам следует ожидать серьезного увеличения спроса на хранилища данных в крупных и средних российских компаниях. Соответственно, потребуется переход на современные средства построения, наполнения и использования хранилищ данных.

 

     Глоссарий

 
№ п/п Новое понятие Содержание
1. Агент Программа, работающая в Microsoft Windows 2000 или в Windows 2000 независимо, как бы "сама по себе", и выполняющая какое-либо обслуживание. Агент обычно имеет некоторую конкретную задачу, например, планирование операций или исполнение заданий репликации. В операционных системах семейства UNIX такие программы называются "демонами" (daemons).
2. База данных Хранилище данных. Масштабы баз данных могут варьировать от небольшого списка имен до записей данных обо всех людях в мире.
3. ИВЦАРК Информационно Вычислительный Центр Агентства Республики Казахстан
4. ПО Программное обеспечение
5. Ральф Кимбалл (Ralph Kimball), один  из авторов концепции хранилищ  данных
6. СППР Система поддержки  принятия решения
7. СУБД Системное управление базами данных
8. ЭВМ Электронно  вычислительная машина
9. DW (Data warehouse) хранилище данных
10. Data Mart витрины данных
11. Event or state facts факты, связанные  с событиями или состоянием объекта
12. FASMI (Fast Analysis of Shared Multidimensional Information - быстрый анализ разделяемой многомерной информации)
13. IDC International Data Corporation
14. Line-item facts факты, связанные  с элементами документа 
15. OLAP (On-Line Analytical Processing) ключевой компонент организации хранилищ данных
16. Snapshot facts факты, связанные с «моментальными снимками»
17. Transaction facts факты, связанные  с транзакциями

 

Список  использованных источников

 
  1. Войтов  А.Г. Экономика. [Текст]- М., 1999. – 365 с. - ISBN 5-8316-0056-4.
  2. Волков О.И. Экономика предприятия. [Текст]- М., 2001 – 365 с. - ISBN 5-26552-745-1.
  3. Кривко О.Б. Информационные технологии. [Текст]-М., 2001 . - № 1 – 265 с. - ISBN 5-86404-210-2.
  4. Маклаков С. Хранилища данных и их проектирование с помощью CA ERwin// КомпьютерПресс. [Текст]-2001. - № 1. – 342 с. - ISBN 5-86404-210-2.
  5. Туо Дж. Инструменты для анализа информации на настольных ПК// ComputerWeek-Москва. [Текст]- 1996 . -№ 38. – 215 с. - ISBN 5-84535-423-4.
  6. Чепурин М.Н. Курс экономической теории.- Киров. [Текст], 1999. – 365 с. - ISBN 5-88186-417-4.
  7. Щавелев Л.В. Автоматизация проектирования систем оперативной обработки данных: [Текст] на примере информационно-аналитических систем в энергетике: Автореф. дисс. ктн.- Иваново, 1999. – 382 с. - ISBN 5-85242-524-3.
  8. Codd E.F., Codd S.B., Salley C.T. Providing OLAP[Текст] (on-line analytical processing) to user-analysts: An IT mandate//Technical report, 1993 – 415 с. - ISBN 5-82102-421-1.
  9. Ralph Kimball. The Data Warehouse Toolkit: [Текст] Practical Techniques for Building Dimensional Data Warehouses//John Wiley & Sons, 1996 – 225 с. - ISBN 5-85232-423-2.

10. Ralph Kimball. The Data Webhouse Toolkit: [Текст] Building the Web-Enabled Data Warehouse// John Wiley & Sons, 2000 – 344 с. - ISBN 5-86404-210-2.

 

      Приложение А

      

     Структура базы данных Northwind

 

      Приложение Б

 

     Пример  схемы «звезда» 

     

 

Приложение  В 

     Пример  таблицы измерений 

 

       

 

      Приложение Г 

     Пример  таблицы измерений 

 

       

 

      Приложение Д 

     Пример  схемы «снежинка»

     

Информация о работе Хранилище данных