Графические методы статистического анализа

Автор работы: Пользователь скрыл имя, 19 Апреля 2011 в 19:24, реферат

Краткое описание

Информация, представленная описательной статистикой, может быть обработана, проанализирована, и представлена с помощью разнообразных графических методов: от простых двумерных гистограмм, диаграмм и карт отклонений до комплексного представления, включающего специальное масштабирование многочисленных измерений и переменных данных в виде вероятностных диаграмм и графиков.

Содержимое работы - 1 файл

grapstat.doc

— 1.34 Мб (Скачать файл)

    Рассмотрим  построение картограммы, используя данные табл.2.9.

    Таблица2.9

    Плотность населения восьми районов области (цифры условные)

№ района 1 2 3 4 5 6 7 8
Плотность          населения, человек 3,0 4,0 11,0 14,0 17,0 13,0 11,0 3,0
 

    Прежде  чем приступить к построению картограммы, необходимо разбить районы на группы по плотности населения, а затем установить для каждой определенную окраску или штриховку.

    Согласно  данным табл. 2.9 все районы по плотности населения можно разбить на три группы: 1) районы, имеющие плотность населения до 4 тыс. человек; 2) от 4 до 12 тыс. человек; 3) от 12 до 17 тыс. человек. Тогда к первой группе относятся районы № 1, 8; ко второй - № 2, 3, 7; к третьей - № 4, 5, 6. Если принять для каждой группы районов окраску различной насыщенности, то на фоновой картограмме хорошо видно, как располагаются на территории области отдельные районы по плотности населения (рис. 2.25). Другим примером фоновой картограммы является рис. 2.26.

    

    Рис.2.25. Картограмма плотности населения восьми районов области

    Вторую  большую группу статистических карт составляют картодиаграммы, представляющие собой сочетание диаграмм с географической картой. В качестве изобразительных знаков в картодиаграммах используются диаграммные фигуры (столбики, квадраты, круги, фигуры, полосы), которые размещаются на контуре географической карты. Картодиаграммы дают возможность географически отразить более сложные статистико-географические построения, чем картограммы.

    Среди картодиаграмм следует выделить картодиаграммы простого сравнения, графики пространственных перемещений, изолиний.

    

    Рис.2.26.. Плотность населения в областях Центрального района России (человек на 1 м2)

    На  картодиаграмме простого сравнения  в отличие от обычной диаграммы  диаграммные фигуры, изображающие величины исследуемого показателя, расположены не в ряд, как на обычной диаграмме, а разносятся по всей карте в соответствии с тем районом, областью или страной, которые они представляют. Элементы простейшей картодиаграммы можно обнаружить на 'Политической карте, где города отличаются различными геометрическими фигурами в зависимости от числа жителей.

    В качестве примера картодиаграммы возьмем  изображение валового сбора зерна Центрального района России (рис. 2.27).

    Изолинии (от греч. isos - равный, одинаковый, подобный) - это линии равного значения какой-либо величины в ее распространении на поверхности, в частности на географической карте или графике. Изолиния отражает непрерывное изменение исследуемой величины в зависимости от двух других переменных и применяется при картографировании природных и социально-экономических явлений. Изолинии используются для получения количественных характеристик исследуемых величин и для анализа корреляционных связей между ними.

    

    Рис. 2.27. Валовой сбор зерна Центрального района России (данные условные). 

2.7. ГРАФИЧЕСКИЕ МЕТОДЫ, РЕАЛИЗОВАННЫЕ В КОМПЬЮТЕРНЫХ ПРОГРАММАХ

    Ознакомимся с некоторыми современными графическими методами анализа статистических данных, реализованных в программном  обеспечении (на примере компьютерной программы «STATISTICA»).

    1) 2М диаграммы рассеяния - Простая. Простая диаграмма рассеяния визуализирует зависимость между двумя переменными X и Y (например, весом и высотой). Точки данных изображаются точками в двумерном пространстве, где оси соответствуют переменным. Две координаты (X и Y), которые определяют положение каждой точки, соответствуют значениям двух переменных для этой точки. Если две переменные сильно связаны, то множество точек данных принимает определенную форму (например, прямой линии или кривой). Если же переменные не связаны, то точки образуют «облако» (на следующем рисунке показан категоризованный график для двух типов данных).

    2) Спектральная диаграмма. Первоначальное применение этого типа графиков было связано со спектральным анализом, чтобы исследовать поведение нестационарных временных рядов. На таких диаграммах в плоскости горизонтальных осей можно строить зависимость частот спектра от последовательных временных промежутков, а на оси Z отмечать спектральные плотности на каждом интервале.

    В том случае, когда необходимо исследовать  связь между двумя переменными  на различных уровнях третьей  переменной, целесообразно использовать спектральный график вместо обычной 3М диаграммы рассеяния. Преимущества спектрального представления в конкретной ситуации хорошо видны на следующем рисунке, где показаны два изображения одного и того же набора данных.

    На  спектральной диаграмме хорошо видно, что зависимость между переменными Pressure и Yield меняется с колоколообразной на U-образную.

    3) Дискретная карта линий уровня для исходных данных. Этот последовательный график можно считать 2М проекцией 3М ленточной диаграммы. Каждая точка данных здесь представлена прямоугольной областью; значениям (или диапазонам значений точек данных) соответствуют различные цвета и/или шаблоны областей (диапазоны указаны в условных обозначениях). Значения внутри каждой серии откладываются по оси X, а сами серии - по оси Y.

    4) Тернарные графики. Тернарный график используется для исследования связей между несколькими переменными, когда три из них представляют собой, например, компоненты смеси (это означает, что сумма их остается постоянной для всех наблюдений). Обычно такие графики применяются при экспериментальном исследовании зависимости отклика от относительного содержания трех компонент (например, трех химических соединений), при этом соотношение компонент изменяется с целью определения его оптимального значения (например, при составлении смесей).

    5) Категоризованная 3М диаграмма рассеяния. С помощью графиков этого типа можно  визуально представить зависимость между тремя переменными (соответствующими координатам X, Y и одной или нескольким [вертикальным] координатам Z каждой точки в 3М пространстве), категоризованными посредством группирующей переменной (или заданным пользователем методом категоризации). Для каждого уровня группирующей переменной (или заданного пользователем подмножества данных) строится один график, и все эти графики изображаются в одном графическом окне, позволяя сравнивать подмножества данных (категории).

 

    6) Общие и независимые шкалы. Каждый элементарный график, входящий в состав категоризованного графика, может быть масштабирован в соответствии со своим собственным диапазоном значений (независимые шкалы).

    Или все графики могут иметь общую шкалу, достаточно широкую, чтобы охватить весь диапазон значений.

    Общий масштаб позволяет сравнивать диапазоны и распределения значений разных категорий. Однако если эти диапазоны сильно различаются (что приводит к очень большой общей шкале), то исследование некоторых графиков может быть затруднено. Использование независимого масштаба может упростить выявление трендов и определенных закономерностей внутри категорий, но в то же время затруднить сравнение диапазонов значений разных подгрупп.

    7) Проекции трехмерных наборов данных. Полезным методом изучения и аналитического исследования структуры поверхности (созданной, как правило, по трехмерным наборам данных) является построение ее проекции на плоскость в виде карты линий уровня.

    Эти графики менее эффективны для  быстрого визуального анализа формы трехмерных структур по сравнению с графиками поверхности, однако их преимущество заключается в возможности точного исследования формы поверхности - на картах линий уровня отображается ряд не искаженных горизонтальных «сечений».  

             
8) Пиктографики. На пиктографиках каждое наблюдение представлено в виде многомерного символа, что позволяет использовать эти типы графического представления данных в качестве не очень простого, но мощного исследовательского инструмента. Главная идея такого метода анализа основана на человеческой способности «автоматически» фиксировать сложные связи между многими переменными, если они проявляются в последовательности элементов (в данном случае «пиктограмм»). Иногда понимание (или «чувство») того, что некоторые элементы «чем-то похожи» друг на друга, приходит раньше, чем наблюдатель (аналитик) может объяснить, какие именно переменные обусловливают это сходство. Конкретную природу проявившихся взаимосвязей между переменными позволяет выявить уже последующий анализ данных, основанный на изучении этого интуитивно обнаруженного сходства.

    Основная  идея пиктографиков заключается  в представлении элементарных наблюдений как отдельных графических объектов, где значения переменных соответствуют определенным чертам или размерам объекта (обычно одно наблюдение = одному объекту). Это соответствие устанавливается таким образом, чтобы общий вид объекта менялся в зависимости от конфигурации значений.

    Таким образом, объекты имеют определенный «внешний вид», который уникален для каждой конфигурации значений и может быть идентифицирован наблюдателем. Изучение таких пиктограмм помогает выявить как простые связи, так и сложные взаимодействия между переменными.

    ВЫВОД

    Современный анализ социально-экономических явлений  немыслим без применения графического метода представления данных. Графический метод – это метод условных изображений статистических данных при помощи геометрических фигур, линий, точек и разнообразных символических образов.

    Статистический  график – это условное изображение  числовых величин или их соотношений посредством геометрических фигур, линий или на географических картосхемах; это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков

    Статистические графики отличаются от математических, физических и прочих графиков тем, что они характеризуют определенную совокупность и социально-экономические явления. 

    Главным плюсом статистических графиков является их наглядность. В тоже время основным минусом графиков является их сравнительно низкая полезность как элемент анализа непосредственно. При правильном построении графиков статистические показатели привлекают к себе внимание, становятся более понятными, выразительными, лаконичными, запоминающимися. Необходимо научиться строить и читать статистические графики и диаграммы, анализировать и применять их, чтобы с максимальной пользой оперировать ими в статистическом исследовании.

    Расмотренные  в данном реферате графические методы не являются исчерпывающими, но они наиболее часто употребляемы в статистике. В условиях быстрого темпа развития ЭВМ и соответствующего программного обеспечения, появляются все более новые, сложные, динамичные графические методы. Ярким примером является система STATISTICA – одна из немногих программ, которые предлагают разнообразные гибкие методы настройки интерфейса, соответствующие конкретным запросам аналитиков. 

СПИСОК  ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ:

1. Сиденко А.В. Общая теория статистики. Графический метод изображения      статистических данных. - М.: МЦНМО, 1999.

2. Кендалл М., Стьюарт А. Многомерный статистический анализ (том 3): Пер. с англ. - М.: БИНОМ, 2003.

Информация о работе Графические методы статистического анализа