Прикладной анализ данных.pptx
- Количество слайдов: 14
ПРИКЛАДНОЙ АНАЛИЗ ДАННЫХ ВВОДНАЯ ЛЕКЦИЯ
ПРОГРАММА РАБОТЫ ПО КУРСУ • Выбор тематики прикладного исследования • Анализ научной литературы по теме • Определение цели, задач и гипотезы исследования • Подготовка теоретической части работы • Подготовка данных и анализ корреляционных зависимостей в SPSS • Подготовка прикладной части работы • Написание научной статьи объемом 6 -10 стр. • Публикация научной статьи (по желанию)
ДОСТУПНЫЕ ЭМПИРИЧЕСКИЕ ИССЛЕДОВАНИЯ • Социокультурный портрет Пермского края (объем выборки ~1000 чел. , 2011 г. ) • Потребление алкоголя жителями Пермского края (объем выборки ~1000 чел. , 2012 г. ) • Социальная политика промышленных предприятий (объем выборки ~100 чел. , 2012 г. )
СТРУКТУРА НАУЧНОЙ СТАТЬИ • Описание актуальности темы исследования • Изложение подходов к исследованию темы • Обоснование выбора теоретического подхода, используемого в работе • Формулировка цели, задач и гипотез • Эмпирическая интерпретация понятий • Описание параметров исследования • Описание результатов корреляционного анализа • Выводы
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ДАННЫХ •
ПРОВЕРКА НОРМАЛЬНОСТИ • Если при выполнении функции «График P-P» точки находятся вдоль наклонной линии, то распределение близко к нормальному • Если значения эксцесса и асимметрии (функция «Описательные статистики» ) не близки к нулю, распределение не является равномерным
ПРОВЕРКА ГОМОГЕННОСТИ (ОДНОРОДНОСТИ) • Если значимость статистики Ливиня (функция «Разведочный анализ» ) >0, 05 распределение переменной гомогенно
СПОСОБЫ КОРРЕКТИРОВКИ ДАННЫХ •
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА • Вычисляется с помощью функции «Таблицы сопряженности» ) • Определение количества ячеек с ожидаемой частотой меньше 5 • Проверка значения критерия по количеству степеней свободы • Проверка асимптотической значимости
СУТЬ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ • Распределение данных • Отчищенная линейная зависимость • Нелинейные зависимости
АНАЛИЗ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ (R ПИРСОНА) • Рассчитывается с помощью функции «Таблицы сопряженности» или «Парные корреляции» ) • Применим только к интервальным переменным • Если уровень значимости <0, 05 то можно интерпретировать значение коэффициента корреляции • Значения в пределах ± 0, 2 – отсутствие корреляции • Значения в пределах ± 0, 2 - ± 0, 4 – слабо выраженная корреляция • Значения в пределах ± 0, 4 - ± 0, 9 – выраженная корреляция • Значения в пределах ± 1 – прямая / обратная линейная зависимость
АНАЛИЗ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ (Ρ СПИРМАНА) • Рассчитывается с помощью функции «Таблицы сопряженности» или «Парные корреляции» ) • Применим переменным без нормального распределения или являющихся порядковыми • Если уровень значимости <0, 05 то можно интерпретировать значение коэффициента корреляции • Значения в пределах ± 0, 2 – отсутствие корреляции • Значения в пределах ± 0, 2 - ± 0, 4 – слабо выраженная корреляция • Значения в пределах ± 0, 4 - ± 0, 9 – выраженная корреляция • Значения в пределах ± 1 – прямая / обратная линейная зависимость
АНАЛИЗ ОСТАТКОВ • Рассчитывается с помощью функции «Таблицы сопряженности» ) • Если модуль скорректированного стандартизированного остатка больше 1, 95, то ожидаемая частота существенно отличается от наблюдаемой
КАК ОПИСЫВАТЬ СТАТИСТИЧЕСКИЕ КРИТЕРИИ В ТЕКСТЕ СТАТЬИ • Статистика Ливеня - F(степеней свободы 1, степеней свободы 2) = X р<Y • Коэффициенты корреляции – r=X , p (односторонний критерий значимости)<Y или ρ=X , p<Y
Прикладной анализ данных.pptx