Інструменти пакету аналізу в Microsoft Excel

Автор работы: Пользователь скрыл имя, 16 Декабря 2010 в 22:49, доклад

Краткое описание

Пакет аналізу. До складу Microsoft Excel входить набір засобів аналізу даних (так званий пакет аналізу), призначений для вирішення складних статистичних і інженерних задач. Для проведення аналізу даних за допомогою цих інструментів слід зазначити вхідні дані і вибрати параметри; аналіз буде проведений за допомогою відповідної статистичної або інженерної макрофункцій, а результат буде поміщений у вихідний діапазон. Інші засоби дозволяють представити результати аналізу в графічному вигляді.

Содержимое работы - 1 файл

Доклад Статистика на Excel.doc

— 89.00 Кб (Скачать файл)

  Вступ 

     Пакет аналізу. До складу Microsoft Excel входить набір засобів аналізу даних (так званий пакет аналізу), призначений для вирішення складних статистичних і інженерних задач. Для проведення аналізу даних за допомогою цих інструментів слід зазначити вхідні дані і вибрати параметри; аналіз буде проведений за допомогою відповідної статистичної або інженерної макрофункцій, а результат буде поміщений у вихідний діапазон. Інші засоби дозволяють представити результати аналізу в графічному вигляді.

     Доступні засоби. Щоб переглянути список наявних програм аналізу, виберіть команду Аналіз даних в меню Сервіс. Якщо команда Аналіз даних у меню Сервіс відсутній - необхідне встановлення пакету аналізу.

     Необхідні знання. Для успішного застосування процедур аналізу необхідні початкові знання в області статистичних та інженерних розрахунків, для яких ці інструменти були розроблені.  

Інструменти пакету аналізу в Microsoft Excel 

Дисперсійний  аналіз

     Пакет аналізу включає в себе три  засоби дисперсійного аналізу. Вибір конкретного інструменту визначається числом факторів і числом вибірок досліджуваної сукупності даних.

     Однофакторний дисперсійний аналіз. Однофакторний дисперсійний аналіз використовується для перевірки гіпотези про подібність середніх значень двох або більше вибірок, що належать одній і тій же генеральної сукупності. Цей метод поширюється також на тести для двох середніх (до яких відноситься, наприклад, t-критерій).

     Двохфакторний дисперсійний аналіз з повторенням - являє собою більш складний варіант однофакторного аналізу, що включає більше аніж одну вибірку для кожної групи даних.

     Двохфакторний дисперсійний аналіз без повторення - Являє собою двохфакторний аналіз дисперсії, що не включає більше однієї вибірки на групу. Використовується для перевірки гіпотези про те, що середні значення двох або декількох вибірок однакові (вибірки належать одній і тій же генеральній сукупності). Цей метод поширюється також на тести для двох середніх, такі як t-критерій.

Кореляційний  аналіз

     Використовується  для кількісної оцінки взаємозв'язку двох наборів даних, представлених у безрозмірному вигляді. Коефіцієнт кореляції вибірки являє собою коваріацію двох наборів даних, поділену на добуток стандартних відхилень.

     Кореляційний  аналіз дає можливість встановити, чи асоційовані набори даних по величині, тобто, великі значення з одного набору даних пов'язані з великими значеннями іншого набору (позитивна кореляція),або, навпаки, малі значення одного набору пов'язані з великими значеннями іншого (негативна кореляція), або дані двох діапазонів ніяк непов'язані (кореляція близька до нуля).

Коваріаційний аналіз

     Використовується для обчислення середнього добутку відхилень точок даних від відносних середніх. Коваріація є мірою зв'язку між двома діапазонами даних.

     Коваріаційний аналіз дає можливість встановити, чи асоційовані набори даних по величині, тобто, великі значення з одного набору даних пов'язані з великими значеннями іншого набору (позитивна коваріація),або, навпаки, малі значення одного набору пов'язані з великими значеннями іншого (негативна коваріація), або дані двох діапазонів ніяк непов'язані (коваріація близька до нуля).

Описова статистика

     Цей засіб аналізу служить для створення одновимірного статистичного звіту, що містить інформацію про центральну тенденцію і мінливість вхідних даних. Щоб отримати більш докладні відомості про параметри діалогового вікна, потрібно розглянути наступні функції.

Експоненційне згладжування

     Призначається для передбачення значення на основі прогнозу для попереднього періоду, скоригованого з урахуванням похибки в цьому прогнозі. Використовує константу згладжування a, за величиною якої визначає, наскільки сильно впливають на прогнози похибки в попередньому прогнозі.

Аналіз  Фур'є 

     Призначається для вирішення завдань у лінійних системах та аналізу періодичних даних, використовуючи метод швидкого перетворення Фур'є (ШПФ).

Ця процедура  підтримує також зворотні перетворення, при цьому, інвертування перетворених даних повертає вихідні дані.

Двухвибірковий F-тест для дисперсій

     Двухвибірковий F-тест застосовується для порівняння дисперсій двох генеральних сукупностей. Наприклад, F-тест можна використовувати для виявлення відмінності в дисперсії тимчасових характеристик, обчислених за двома вибірками.

Гістограма 

     Використовується  для обчислення вибіркових та інтегральних частот попадання даних у вказані інтервали значень, при цьому, генеруються числа влучень для заданого діапазону клітинок. Наприклад, необхідно виявити тип розподілу успішності в групі з 20 студентів. Таблиця гістограми складається з границі шкали оцінок та кількості студентів, рівень успішності яких знаходиться між самою нижньою границею та поточною границею. Найчастіше повторюваний рівень є модою інтервалу даних.

Ковзке середнє

     Використовується  для розрахунку значень у прогнозованому періоді на основі середнього значення змінної для вказаного числа попередніх періодів.

Кожне прогнозоване значення засноване на формулі:

 , де

N - число попередніх періодів, що входять до ковзкого середнього;

Aj - фактичне значення в момент часу j;

Fj - прогнозоване значення в момент часу j .

     Ковзке середнє, на відміну від простого середнього для всієї вибірки, містить відомості про тенденції зміни даних. Процедура може використовуватися для прогнозу збуту, інвентаризації та інших процесів.

Проведення t-тесту

Пакет аналізу включає в себе три  засоби аналізу середнього для сукупностей різних типів:

Двухвибірковий t-тест з однаковими дисперсіями. Двухвибірковий t-тест

Стьюдента служить для перевірки гіпотези про рівність середніх для двох вибірок. Ця форма t-тесту передбачає збіг дисперсій генеральних сукупностей і зазвичай називається гомоскедастичним t-тестом.

     Двухвибірковий t-тест з різними дисперсіями. Двухвибірковий t-тест

Стьюдента використовується для перевірки  гіпотези про рівність середніх для двох вибірок даних з різних генеральних сукупностей. Ця форма t-тесту припускає розбіжність дисперсій генеральних сукупностей і зазвичай називається гетероскедастичним t-тестом. Якщо тестується одна й та ж сама генеральна сукупність, використовуйте парний тест.

     Парний  двухвибірковий t-тест для середніх. Парний двухвибірковий t-тест Стьюдента використовується для перевірки гіпотези про різницю середніх для двох вибірок даних. У ньому не передбачається рівність дисперсій генеральних сукупностей, з яких обрані дані. Парний тест використовується, коли є природна парність спостережень у вибірках, наприклад, коли генеральна сукупність тестується двічі.

Генерація випадкових чисел 

     Використовується  для заповнення діапазону випадковими  числами, витягнутими з одного або декількох розподілів. За допомогою даної процедури можна моделювати об'єкти, що мають випадкову природу, по відомому розподілу ймовірностей. Наприклад, можна використовувати нормальний розподіл для моделювання сукупності даних по росту індивідуумів, або використовувати розподіл Бернуллі для двох ймовірних результатів, щоб описати сукупність результатів кидання монетки.

Ранг  і персентіль

     Використовується  для виведення таблиці, яка містить  порядковий і процентний ранги для кожного значення в наборі даних. Дана процедура може бути застосована для аналізу відносного взаємоположення даних у наборі.

Регресія 

     Лінійний  регресійний аналіз полягає в  підборі графіка для набору спостережень за допомогою методу найменших квадратів. Регресія використовується для аналізу впливу на окрему залежну змінну значень однієї або більше незалежних змінних. Наприклад, на спортивні якості атлета впливають кілька факторів, включаючи вік, ріст і вагу. Регресія пропорційно розподіляє міру якості по цим трьом факторам на основі даних функціонування атлета. Результати регресії згодом можуть бути використані для передбачення якостей нового, неперевіреного атлета.

Вибірка

     Створює вибірку з генеральної сукупності, розглядаючи вхідний діапазон як генеральну сукупність. Якщо сукупність занадто велика для обробки або побудови діаграми, можна використовувати представницьку вибірку. Крім того, якщо передбачається періодичність вхідних даних, то можна створити вибірку, що містить значення тільки з окремої частини циклу.

     Наприклад, якщо вхідний діапазон містить дані для квартальних продажів,створення вибірки з періодом 4 розмістить у вихідному діапазоні значення продажів з одного і того ж кварталу.

Двовибірковий z-тест для середніх

       Двовибірковий z-тест для середніх з відомими дисперсіями використовується для перевірки гіпотези про різницю між середніми двох генеральних сукупностей.

     Наприклад, цей тест може використовуватися  для визначення відмінності між характеристиками двох моделей автомобілів.

Статистичні функції 

     Можливість  використання формул і функцій є  одним з найважливіших властивостей програми обробки електронних таблиць. Це, зокрема, дозволяє проводити статистичний аналіз числових значень в таблиці.

     Текст формули, що вводиться у комірку таблиці, повинен починатися зі знаку рівності (=), щоб програма Excel могла відрізнити формулу від тексту. Після знака рівності в клітинку записується математичний вираз, що містить аргументи, арифметичні операції і функції.

     В якості аргументів у формулі зазвичай використовуються числа та адреса комірок. Для позначення арифметичних операцій можуть використовуватися такі символи: + (додавання); - (віднімання); * (множення); /(ділення).

     Формула може містити посилання на комірки, які розташовані на іншому робочому аркуші або навіть в таблиці іншого файлу. Одного разу введена формула може бути в будь-який час модифікована.

     Вбудований  Менеджер формул допомагає користувачеві  знайти помилку або неправильне посилання у великій таблиці.  

     Крім  цього, програма Excel дозволяє працювати зі складними формулами, що містять кілька операцій. Для наочності можна включити текстовий режим, тоді програма Excel буде виводити в клітинці не результат обчислення формули, а власне формулу.

     Програма Excel інтерпретує введені дані або як текст (вирівнюється по лівому краю), або як числове значення (вирівнюється по правому краю). Для введення формули необхідно ввести алгебраїчний вираз, якому повинен передувати знак рівності (=).

     Припустимо, що в комірці А1 таблиці знаходиться число 100, а в комірці В1 - число 20. Щоб розділити перше число на друге і результат помістити в клітинку С1, в клітинку С1 слід ввести відповідну формулу

(= А1/В1) і натиснути [Enter].

     Введення  формул можна істотно спростити, використовуючи маленький трюк.

     Після введення знаку рівності слід просто клацнути мишею по першій комірці, потім ввести операцію ділення і клацнути по другій клітинці.

       Види статистичних функцій в Microsoft Excel 2000:

FРАСП - повертає F-розподіл ймовірності.

Цю функцію  можна використовувати, щоб визначити, чи мають дві множинні дані різні ступені щільності. Наприклад, можна досліджувати результати тестування чоловіків і жінок, які закінчили вищу школу і визначити чи відрізняється розкид результатів для чоловіків і жінок.

Информация о работе Інструменти пакету аналізу в Microsoft Excel