Лекция_09_Множественная регрессия.ppt
- Количество слайдов: 26
Регрессия – специальные варианты: нелинейная, множественная, пробит
Типы статистических задач Задачи Инструменты Описание совокупностей объектов Анализ одной выборки; расчет параметров распределений (положения, формы); проверка нормальности распределений; Сравнение параметров Парные и множественные сравнения средних; сравнение распределений; сравнение частот; t-критерий; тест Манна. Уитни или Краскела-Уоллеса; дисперсионный анализ; Анализ зависимостей Установление взаимосвязи между двумя переменными или между многими переменными; установление силы влияния одной или многих переменных на одну результирующую; корреляционный анализ, парная и множественная регрессия, логит-регрессия; Снижение размерности, ординация, классификация Кластерный, факторный, дискриминантный анализ; анализ соответствий; многомерное шкалирование и др.
Задачи оценки взаимосвязи между переменными или прогноза Количественные нормально распределенные переменные Количественные ненормально распределенные переменные или ранги Биноминальные данные (два возможных результата) Коэффициент парной корреляции Пирсона Коэффициенты ранговых корреляций (Спирмена, Кендалла) Коэффициенты связи Предсказать Простая линейная изменение одной регрессия или переменной, если нелинейная регрессия была измерена другая переменная Непараметрическая (ранговая) регрессия Простая логистическая регрессия Задача Оценить взаимосвязь между двумя переменными Предсказать значение, Множественная базируясь на линейная (нелинейная) линейная ранговая нескольких регрессия (медианная) регрессия переменных Множественная логистическая регрессия
Нелинейная регрессия: возможности EXCEL • Пример_тм_токсич ность_регрессия. xls; • ТОКСИЧНОСТь_LN* длина 2 ; • R 2 и уравнения; • Прямая и полиномы разных порядков;
Нелинейная регрессия: эмпирические ограничения • С ростом сложности описания ПОЧТИ ВСЕГДА растет R 2; • Необходимо найти компромисс между сложностью / качеством и СМЫСЛОМ описания; • Эмпирическое правило: на каждый новый член в уравнении аппроксимирующей функции необходимо минимум 5 – 10 независимых наблюдений; • • Пример_тм_токсичность_регрессия. xls; ТОКСИЧНОСТь_LN* длина 2; ПОСТРОЕНИЯ ПО ЗОНАМ!!! R 2 и уравнения; Прямая и полиномы разных порядков;
Нелинейная регрессия: безграничные возможности визуализации в STATISTICA • Пример_тм_токсичн ость_регрессия. xls; • ТОКСИЧНОСТь_LN* длина 2 ; • R 2 и уравнения; • Прямая и полиномы разных порядков;
Как оценить степень нелинейности? = Как оценить вклад регрессионных коэффициентов при «x» разных степеней? • Пример_тм_токсичн ость_регрессия. xls; • ТОКСИЧНОСТь_LN* длина 2 ; • R 2 и уравнения; • Прямая и полиномы разных порядков;
• Создаем иллюстрацию в EXCEL по итогам определения оптимального полинома в STATISTICA (ТОКСИЧНОСТь_LN* длина 2); Как оценить степень нелинейности? = Как оценить вклад регрессионных коэффициентов при «x» разных степеней? Чего часто не хватает в полиномиальных моделях? СМЫСЛА! т. е. возможности биологической интерпретации зависимостей и коэффициентов!
Задание функции
Использование S-образных функций – возможность строгого аналитического нахождения граничных (критичных или желательных) оценок состояния биоты Верхнее плато Зона максимальной скорости изменений Нижнее плато Дозовые логистические кривые с разной резкостью перехода от верхнего плато к нижнему.
Нахождение координат критических точек
Построение логистической функции • Пример_тм_токсичн ость_регрессия. xls; • ТОКСИЧНОСТь_LN* длина 2;
Как написать функцию? Длина 2=26/(1+exp(parm 1+parm 2*ТОКСИЧНОСТь_LN))+2
Общая логика вычислительных процедур при нелинейном оценивании в STATISTICA • Не строгие решения функций; • Итерации – последовательные вычисления, приближающие качество описания (значения коэффициентов) к исходным данным; • Этим качеством иногда можно управлять;
Что должно получиться?
Попробуем? Нахождение координат критических точек
Задачи оценки взаимосвязи между переменными или прогноза Количественные нормально распределенные переменные Количественные ненормально распределенные переменные или ранги Биноминальные данные (два возможных результата) Коэффициент парной корреляции Пирсона Коэффициенты ранговых корреляций (Спирмена, Кендалла) Коэффициенты связи Предсказать Простая линейная изменение одной регрессия или переменной, если нелинейная регрессия была измерена другая переменная Непараметрическая (ранговая) регрессия Простая логистическая регрессия Задача Оценить взаимосвязь между двумя переменными Предсказать значение, Множественная базируясь на линейная (нелинейная) линейная ранговая нескольких регрессия (медианная) регрессия переменных Множественная логистическая регрессия
Логит- и пробит-регрессия • Для объяснения поведения бинарных переменных (успех– неудача, есть–нет); • Оперируют не финальными относительными частотами (процентами или долями), а как в случае с хи-квадратом, числом наблюдений того или иного случая; • Формула:
Логит- и пробит-регрессия: специальная структура файла
Логит-регрессия: что должно получиться? (лист «для_логита» файла «Пример_тм_токсичность_регрессия. xls» )
Задачи оценки взаимосвязи между переменными или прогноза Количественные нормально распределенные переменные Количественные ненормально распределенные переменные или ранги Биноминальные данные (два возможных результата) Коэффициент парной корреляции Пирсона Коэффициенты ранговых корреляций (Спирмена, Кендалла) Коэффициенты связи Предсказать Простая линейная изменение одной регрессия или переменной, если нелинейная регрессия была измерена другая переменная Непараметрическая (ранговая) регрессия Простая логистическая регрессия Задача Оценить взаимосвязь между двумя переменными Предсказать значение, Множественная базируясь на линейная (нелинейная) линейная ранговая нескольких регрессия (медианная) регрессия переменных Множественная логистическая регрессия
Множественная регрессия: общая структура и предположения Y = a + b 1 * X + b 2 * X 2 + … + b 3*X n • Линейности частных зависимостей; • Нормальности всех переменных; • Нескоррелированности независимых переменных; • Не менее (7)10– 20 независимых наблюдений на каждый предиктор в модели;
Интерпретация результатов: R, R 2, коэффициенты b и beta
Методы пошагового отбора переменных
Гребневая регрессия
иллюст рации 3 Dзависи мостей
Лекция_09_Множественная регрессия.ppt