Типы данных

Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 22:32, реферат

Краткое описание

Типы переменных можно рассмотреть с технической точки зрения и в аспекте применения математических методов.
Типы кодирования переменных.
В статистическом пакете SPSS предусмотрено 8 типов кодирования переменных. Подробнее о них можно узнать в [Руководство пользователя. Книга 1. - М.: Статистические системы и сервис, 1995]. Мы остановимся лишь на строчных (STRING) и числовых (NUMERIC) переменных.

Содержимое работы - 1 файл

Типы данных.doc

— 31.00 Кб (Скачать файл)

1.2. Типы переменных

Типы переменных можно рассмотреть с технической  точки зрения и в аспекте применения математических методов.

Типы  кодирования переменных.

В статистическом пакете SPSS предусмотрено 8 типов кодирования переменных. Подробнее о них можно узнать в [Руководство пользователя. Книга 1. - М.: Статистические системы и сервис, 1995]. Мы остановимся лишь на строчных (STRING) и числовых (NUMERIC) переменных.

Строчные переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий респондентов, если имеется такая возможность и в них есть необходимость, например переменная dj56.1.1 8-й волны RLMS содержит ответы на вопрос "В чем состояла эта Ваша работа?"

Но обычно, при  внесении в компьютер информации для статистической обработки, ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз. Различные методы анализа данных ориентированы на данные определенного типа. Для получения интерпретируемых результатов перед применением программы исследователь должен определить тип обрабатываемых соответствующим методом переменных.

Тип шкалы измерения  переменных.

Формируя данные, исследователь ставит в соответствие значениям переменной, имеющей содержательный смысл ("пол - мужской", "профессия - учитель"), числовые значения. Такое  соответствие называется шкалой измерения  переменной. В зависимости от свойств  переменной выделяют шкалы: номинальную, ординальную (ранговую), интервальную и шкалу отношений.

Неколичественные  шкалы

НОМИНАЛЬНАЯ шкала является самым "низким" уровнем измерения. В этом случае используется только равенство или неравенство значений. Примером таких переменных являются "пол", "профессия".

ОРДИНАЛЬНАЯ или РАНГАВАЯ. Часто значения признака выражают степень проявления какого-либо свойства и могут быть упорядочены. Например, работа "интересна", "безразлична" или "не интересна". Такая шкала называется ранговой или ординальной.

Количественные  шкалы:

ИНТЕРВАЛЬНАЯ шкала предполагает, что можно определить не только порядок значений, но и расстояние между значениями. Эта шкала, однако, такова, что не имеет смысла рассматривать, во сколько раз одно значение больше другого. Пример: шкала измерения температуры по Цельсию.

ШКАЛА ОТНОШЕНИЙ в дополнение к свойствам интервальной шкалы позволяет измерять пропорции значений. Например, мы можем смело заявить, что зарплата в 1000$ вдвое выше зарплаты в 500$.

Техника анализа  переменных, измеренных в количественных шкалах (интервальной и шкале отношений) обычно одинакова. В соответствии с  типом шкалы измерения переменные относят к номинальным, ординальным (ранговым) и количественным типам переменных.

К особому типу относят переменные, имеющие два  ответа - "да" и "нет" (например, "Имеете ли Вы телевизор?"). Эти  переменные называют дихотомическими. Их удобно кодировать цифрами 1 ("да") и 0 ("нет"). Эти переменные представляют простейший вид номинальных переменных, они выражают количество (0 или 1) и поэтому часто используются в количественном анализе.

Такая классификация  переменных несколько упрощает действительность. Например, переменная "время суток" при исследовании бюджета времени  имеет "кольцевую" структуру, поскольку 0 часов эквивалентно 24 часам.

Еще пример: ответ  на вопрос о доходах от личного  подсобного хозяйства может представлять определенную сумму, быть ответом "не имею подсобного хозяйства" или ответом "не знаю" - здесь значения только частично являются количественными и упорядоченными. При кодировании значений таких значений используются специального вида коды, которые в принципе не могут встретиться в данных, например в RLMS "затрудняюсь ответить", "отказ от ответа" и "нет ответа" в вопросе о весе респондента кодируются кодами 997, 998 и 999 соответственно. Не забудьте использовать специальные команды SPSS (см. ниже команду Missing values), чтобы объявить эти числовые значения кодами неопределенности, чтобы по ошибке не получить средний вес респотдента в больше 300 килограммов!

Информация о работе Типы данных