Информационно-аналитическая система Internet Analyst

Автор работы: Пользователь скрыл имя, 26 Сентября 2011 в 01:52, контрольная работа

Краткое описание

Управление любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.

Содержание работы

1. ВВЕДЕНИЕ 3
2. ФУНКЦИОНАЛЬНАЯ СТРУКТУРА СИСТЕМЫ 4
2.1. ПОЛУЧЕНИЕ И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ 5
2.1.1. Получение информации из источников и ее очистка 5
2.1.2. Рубрикация информации 7
2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация 9
2.1.4. Расширение рубрикатора пользователями. Персональные профили 10
2.1.5. Рубрикатор как средство мониторинга. Рассылка документов 11
2.2. ВЫБОРКА ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ 12
2.2.1. Поиск документов в Internet Analyst 13
2.2.2. Поиск известного (сужение контекста) 14
2.2.3. Поиск неизвестного (расширение контекста) 16
2.2.4. Поиск связей (пересечение контекстов) 18
2.2.5. Использование временных рядов 19
2.3. АНАЛИЗ РЕЗУЛЬТАТОВ И ПОДГОТОВКА ОТЧЕТНОСТИ 21
2.3.1. Выявление фактов 21
2.3.2. Подсветка ключевых и контекстных терминов 22
2.3.3. Аннотирование документов 22
2.3.4. Выявление дубликатов 23
2.3.5. Поиск похожих документов 25
2.3.6. Работа с Корзиной и подготовка итогового Отчета 26

Содержимое работы - 1 файл

Контрольная работа.doc

— 1.11 Мб (Скачать файл)

Федеральное агентство по образованию

Филиал  Санкт-Петербургского государственного

инженерно-экономического университета в г. Череповце 
 
 

Кафедра естественнонаучных дисциплин 
 
 
 
 
 
 

Контрольная работа 
 
 
 

По дисциплине  «Информационные системы в экономике»

Тема  № 14: «Информационно-аналитическая система Internet Analyst» 
 
 
 
 
 
 
 
 
 
 
 

                  Студента 3 курса

                  Группы  2ФКП-06

                  Саввина А.М. 
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   

Череповец

2008

СОДЕРЖАНИЕ:

1. ВВЕДЕНИЕ           3

2. ФУНКЦИОНАЛЬНАЯ  СТРУКТУРА СИСТЕМЫ      4

   2.1. ПОЛУЧЕНИЕ  И ПЕРВИЧНАЯ ОБРАБОТКА ИНФОРМАЦИИ   5

      2.1.1. Получение информации из источников  и ее очистка    5

      2.1.2. Рубрикация информации        7

      2.1.3. Создание рубрикаторов экспертами. Авто-рубрикация    9

      2.1.4. Расширение рубрикатора пользователями. Персональные профили  10

      2.1.5. Рубрикатор как средство мониторинга.  Рассылка документов   11

   2.2. ВЫБОРКА  ИНФОРМАЦИИ. РАБОТА С КОНТЕКСТОМ    12

      2.2.1. Поиск документов в Internet Analyst      13

      2.2.2. Поиск известного (сужение контекста)      14

      2.2.3. Поиск неизвестного (расширение контекста)     16

      2.2.4. Поиск связей (пересечение контекстов)      18

      2.2.5. Использование временных рядов       19

   2.3. АНАЛИЗ  РЕЗУЛЬТАТОВ И ПОДГОТОВКА ОТЧЕТНОСТИ    21

      2.3.1. Выявление фактов         21

      2.3.2. Подсветка ключевых и контекстных  терминов     22

      2.3.3. Аннотирование документов        22

      2.3.4. Выявление дубликатов        23

      2.3.5. Поиск похожих документов        25

      2.3.6. Работа с Корзиной и подготовка  итогового Отчета    26 
 
 
 
 
 
 
 
 
 
 
 
 

     1. Введение

     Управление  любым бизнесом основано на постоянном сборе и анализе информации, необходимой для принятия своевременных решений. Качество управления напрямую зависит как от полноты исходной информация, так и от глубины ее анализа.

     При этом должны учитываться как внутренние факторы бизнеса, так и параметры внешней бизнес среды, т.е. необходимую для принятия решений информацию можно разделить на две категории:

  • информация о внутренних объектах организации (персонал, продукты, внутренние финансовые и товарные потоки и т.д.);
  • информация о внешних объектах (технологии, рынки, конкуренты, клиенты, государство и т.д.).

     Причем, характер информации о внешних и  внутренний объектах бизнеса качественно различается. Это обусловлено как степенью нашего влияния на источники информации, так и степенью ее структурированности.

     Информация  о внутренних объектах организации  является структурированной (все объекты имеют соответствующие им наборы формальных атрибутов) и контролируемой (мы сами можем определять ее структуру, формат и источники). Это позволяет организовать ее систематический учет и анализ с помощью различных модулей систем класса ERP и CRM.

     Информация  о внешних объектах, напротив неструктурированна (представлена в виде текстов на естественном языке, рассчитанных на восприятие человеком, а не машиной) и неконтролируема (ее формат, место и время появления определяется не нами). Оба этих обстоятельства чрезвычайно затрудняют создание автоматических систем для систематического учета и анализа внешней информации, аналогичных по своим возможностям ERP системам.

     Между тем, количество информации в открытых источниках так велико, что ее просто невозможно обработать и систематизировать без специализированных инструментов, помогающих выделить в информационном потоке информацию, критически важную для ведения каждого конкретного бизнеса. В итоге, решения принимаются на основе неполной информации, что оборачивается для бизнеса потерями из-за упущенных возможностей и не замеченных вовремя угроз.

     Непрерывный процесс систематического мониторинга, обработки и анализа информации из внешних источников, позволяет осуществить специализированная информационная система - Internet Analyst. Это программа позволяет без особых усилий:

  • Всегда быть в курсе событий вокруг имеющегося бизнеса
  • «На лету» формировать досье по любому вопросу и на любого контрагента
  • Находить связи между событиями, физическими и юридическими лицами
  • Оценивать состояние дел и прогнозировать развитие событий в любой отрасли рынка

   Система Internet Analyst является информационным «фильтром», который позволит охватив весь объем доступной внешней информации, выбрать самое необходимо и важное для обеспечения процесса принятия решений (Рис. 1). 

Рис. 1. Применение системы Internet Analyst 

     2. Функциональная структура  системы

     Внешняя информация в ходе ее получения и  переработки в системе Internet Analyst

проходит  три стадии:

  • Получение и первичная обработка. Из всей доступной в сети Internet информации выбирается та, которая имеет отношение к имеющемуся бизнесу. Полученные документы проходят первичную очистку, рубрикацию и рассылаются заинтересованным в них респондентам в режиме «персональной газеты».
  • Выборка информации. Для работы с накопленной информацией пользователь осуществляет выборки. В ходе «диалога» с системой, из всего информационного массива в Хранилище данных пользователь отбирает факты, необходимые ему для текущей работы.
  • Анализ информации и Подготовка отчетов. При получении необходимой выборки документов пользователь работает с фактами и документами, а так же осуществляет подготовку аналитических отчетов.

     Ниже  мы рассмотрим содержание всех трех этапов более подробно. 

     2.1. Получение и первичная  обработка информации

     Цель  данного этапа - получение необходимой  информации, ее очистка, сортировка, рассылка и архивация.

     Последовательно решаются следующие задачи:

  • получение информации из внешних источников
  • очистка документов от служебной информации и приведение их к единому формату
  • индексирование документов в Хранилище (корпоративном Архиве)
  • рубрикация и рассылка документов заинтересованным пользователям.
 

     2.1.1. Получение информации из источников и ее очистка

     Система Internet Analyst позволяет полностью автоматизировать рутинную работу по скачиванию и очистке первичных документов из внешних источников информации. За получение информации отвечает модуль Робот, который на основании заданного списка источников и графика загрузки автоматически загружает информацию в Модуль очистки (Рис. 2). Списки источников и график загрузки определяются администратором системы. Предварительная настройка осуществляется на этапе внедрения. 

Рис. 2. Получение и очистка информации 

     Модуль  очистки производит извлечение содержательной информации из поступающих в различных форматах документов. А именно:

  • удаление служебной информации и элементов дизайна источника
  • выявления атрибутов документов (название, дата публикации, источник и т.д.)
  • форматирование документа для удобства дальнейшей работы пользователей
  • индексирование содержания и атрибутов документов при помещение их в Хранилище данных

     Для работы Модуля очистки в ходе внедрения  системы разрабатываются сценарии очистки (различные для различных источников), которые, при необходимости, могут изменяться в процессе эксплуатации.

     На  рисунке (рис. 3.) приведен вид документа  до, и после его обработки модулем  очистки. 

Рис. 3. Документ, обработанный модулем очистки 

     2.1.2. Рубрикация информации

     Для удобства работы с большим количеством  документов, получаемых из внешних источников, полезно сразу же по поступлении в систему разбивать их по темам корпоративного рубрикатора. Структура последнего определяется на этапе внедрения и отражает основные темы или субъекты рынка, мониторинг которых необходим для понимания внешней ситуации.

     В зависимости от своего содержания, какие-то документы могут попасть  одновременно в несколько рубрик, а какие-то не попасть ни в одну из них. Таким образом происходит «фильтрация» информации и снижение уровня информационного шума от внешних источников (Рис. 4.). 

     Рис. 4. Рубрикация информации 

     Например: сообщение о назначении нового полномочного представителя президента в регионе, может относиться как к категории «Регионы/Полпреды», так и к категории «Макроэкономика и структурные реформы» (Рис. 5). 

     Рис. 5. Размещение документа в нескольких рубриках 

     Над одним и тем же Хранилищем данных можно развернуть несколько рубрикаторов, так чтобы, например, каждое подразделение фирмы видело свой специфический срез внешней информации. 
 
 
 

     2.1.3. Создание рубрикаторов  экспертами. Авто-рубрикация

     Рубрикатор  представляет собой иерархический  набор информационных фильтров, которые формируются на этапе внедрения (а затем могут модифицироваться в процессе эксплуатации).

     Фильтрация  происходит с учетом атрибутов документов и их содержания. Содержание документов, в свою очередь, задается как обязательными фразами (и их сочетаниями), так и тематикой документа, определяемой произвольно большим списком контекстных терминов и словосочетаний, взвешенных в соответствии с их значимостью. Можно, например, отбирать все документы, в которых упоминается интересующая фирма или субъект (в любом варианте его написания). А можно отслеживать любые документы по определенной, причем весьма узкой, тематике.

     Гибкое  сочетание обязательных и контекстных  терминов и словосочетаний позволяет производить точную настройку информационных фильтров.

     Настройка рубрикатора производится экспертами совместно с предметными специалистами - пользователями Системы - на этапе ее внедрения. Создание рубрик кардинально упрощается тем, что происходит в диалоговом режиме, когда Система сама подсказывает эксперту понятия, уточняющие описание рубрики.

     Для облегчения процесса создания больших  рубрикаторов, в Системе предусмотрен Модуль кластеризации, способный автоматически строить тематические рубрикаторы. На вход этого модуля подается обучающий массив документов из заданной предметной области. Модуль автоматически организует эти документы в иерархическую систему кластеров, содержащих документы со схожей тематикой. Сформированная таким образом иерархическая структура тематик экспортируется в формате тематического рубрикатора и может быть загружена в Систему «как есть» или в качестве первого приближения для ее тонкой настройки экспертами (Рис. 6).

Информация о работе Информационно-аналитическая система Internet Analyst