Практические задания к экзамену по анализу данных




Содержание вопросов

 

Эмпирические данные в социологии.

 

Типы эмпирических данных в социологии (по типу структурированности). Различие между качественными и количественными социологическими данными. Логика работы по количественной стратегии. Понятия: данные, признак, значение признака. Соотношение между теоретическими понятиями, признаками и значениями признаков. Таблица "Объект - Признак".

 

Цели и задачи анализа данных. Основные направления анализа данных и примеры.

 

Основная цель анализа данных - выявление статистической закономерности. Понятие статистической закономерности. Задачи анализа данных: описание, объяснение, прогноз. Конкретные примеры. Направления анализа данных: описательная статистика, изучение связей между признаками, классификация объектов. Конкретные примеры.

 

Виды описательной статистики. Одномерное частотное распределение.

 

Три вида описательной статистики: одномерное частотное распределение, меры средней тенденции, меры разброса. Примеры. Понятие одномерного частотного распределения. Виды представления переменной: таблицы и графики. Таблицы: абсолютные частоты, относительные частоты, накопленные частоты, валидный процент. Графики: столбиковая диаграмма, круговая диаграмма, гистограмма, полигон, кумулята. Правила построения графиков и их соответствие типам шкал.

 


Описательная статистика: Меры средней тенденции.

Необходимость мер средней тенденции. Мода, квантили (в том числе медиана) и математическое ожидание: понятие и соответствие типам шкал. Примеры. Формальная и содержательная адекватность использования мер средней тенденции.

 

Описательная статистика: Меры разброса.

Необходимость мер разброса. Понятие разброса для разных типов шкал. Коэффициент качественной вариации и энтропийный коэффициент разброса, квартильный размах, дисперсия и стандартное отклонение. Примеры.

 

Анализ взаимосвязи признаков.

Понятие двумерного анализа. Типы отношений между переменными. Понятие корреляции. Виды связи (корреляции): прямая и обратная, сильная и слабая. Коэффициент корреляции как мера связи. Соотношение понятий "корреляция" и "причинно-следственная связь". Зависимые и независимые переменные. Таблицы сопряженности: понятие и общий вид. Классификация типов связей между переменными.

 

7. Связь между номинальными признаками: критерий "хи-квадрат".

 

Отсутствие связи между признаками как их статистическая независимость. Понятие статистической гипотезы. Проверка статистической гипотезы о независимости признаков. Функция "хи-квадрат": понятие; расчет значения (эмпирическая и теоретическая частоты), оценка значения (уровень значимости, число степеней свободы), интерпретация результата. Ограничения для расчета критерия "хи-квадрат". Коэффициенты связи, основанные на критерии "хи-квадрат": Пирсона, Чупрова, Крамера. Их свойства.

 

Связь между номинальными признаками: модальные коэффициенты прогноза.

 

Понятие модели прогноза. Несимметричность связи, основанной на модели прогноза. Зависимая и независимая переменная. Условное и безусловное распределение признаков. Коэффициенты модального прогноза (лямбда-коэффициенты). Их свойства и ограничения. Использование коэффициентов модального прогноза для сравнения общности мнений различных социально-демографических групп.

 

Связь между порядковыми признаками: ранговые коэффициенты связи.

 

Понятие ранговой корреляции. Виды коэффициентов: коэффициент Спирмена, Кендалла, множественной корреляции (конкордации). Их свойства, область применения. Типы задач, решаемые с помощью ранговых коэффициентов.

 

Связь между значениями признаков: локальные коэффициенты связи и детерминационный анализ.

 

Понятие локальной связи (связь типа «альтернатива - альтернатива»), ее отличие от связи типа «признак - признак». Четырехклеточные таблицы сопряженности: понятие, общий вид. Преобразование таблиц сопряженности произвольной размерности в четырехклеточную таблицу. Коэффициенты связи для четырехклеточных таблиц (коэффициент ассоциации Юла и коэффициент контингенции), их свойства. Полная и абсолютная связь. Односторонняя и двусторонняя связь. Положительная и отрицательная связь. Детерминационный анализ: детерминация, интенсивность, емкость связи.

Практические задания к экзамену по анализу данных

 

1. Рассчитать относительные, накопленные и относительные накопленные частоты и построить график распределения (диаграмму или гистограмму, полигон, кумуляту).

2. Провести анализ таблицы данных. Рассчитать формально адекватные меры средней тенденции.

3. Провести анализ таблицы данных. Рассчитать формально адекватные меры разброса.

4. Провести сравнение двух подгрупп выборки по данным мерам средней тенденции и мерам разброса.

5. Провести анализ таблицы данных. Проверить наличие связи между признаками с использованием критерия .

6. Провести анализ таблицы данных. Проверить наличие связи между признаками с использованием модального прогноза (λ).

7. Провести анализ таблицы данных. Проверить наличие связи между признаками с использованием коэффициентов для четырехклеточных таблиц сопряженности.

8. Провести анализ таблицы данных. Проверить наличие связи между признаками с использованием коэффициентов ранговой корреляции.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: