Выбор факторов модели - Снигур А.С. АП-501.pptx
- Количество слайдов: 25
Выбор факторов модели Выполнил: студент гр. АП-501 Снигур А. С. Проверил: проф. Чигиринская Н. В.
Основные определения Эксперимент - это система операций, воздействий и (или) наблюдений, направленных на получение информации об объекте при исследовательских испытаниях Опыт – это воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов План эксперимента – это совокупность данных, определяющих число, условия и порядок реализации опытов
Планирование эксперимента — это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. При этом существенно следующее: - стремление к минимизации общего числа опытов; - одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам — алгоритмам; - использование математического аппарата, формализующего многие действия экспериментатора; - выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов.
Эксперимент физический психологический модельный над физической моделью над математической моделью
Эксперимент используется для следующих задач: поиск оптимальных условий (экстремальные задачи, связанные с поиском экстремума), построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей (например, кинетических), выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений.
Объект исследования ( «черный ящик» )
Пример Объект – автобус Параметр – t 0 время оборота автобуса на маршруте Факторы - lм – длина маршрута; VТ – техническая скорость; n – число промежуточных остановок на маршруте; tос – время простоя на промежуточной остановке; tк – время простоя на конечных остановках. Модель -
Математическая модель – это уравнение, связывающее параметр оптимизации с факторами. В общем виде его можно записать так: y = f(x 1, x 2, …, xk) Такая функция называется функцией отклика. Уровень – значение фактора, которое он может принимать в опыте. Фактор может принимать как бесконечно многое число значений (непрерывный ряд), так и иметь определенное число дискретных уровней.
Одно из возможных состояний «черного ящика» образуется фиксированным набором уровней факторов (т. е. установление каждого фактора на некоторый уровень), который также составляет условия проведения одного из возможных опытов. Все возможные наборы состояний «черного ящика» составляют число возможных различных опытов – и характеризуют сложность системы.
Чтобы узнать число различных состояний, достаточно число уровней факторов (если оно для всех факторов одинаково) возвести в степень числа факторов k: pk, где p – число уровней. Требования к объекту исследования: - воспроизводимость (характеризуется разбросом параметров в различных опытах при одинаковом наборе факторов); - управляемость (возможность выбора уровней факторов в активном и активнопассивном эксперименте).
Факторы Фактор – это измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования. Фактор считается заданным, если вместе с его названием указана область его определения.
Область определения может быть непрерывной и дискретной. Но в решении задач для факторов с непрерывной областью определения, таких, как температура, время, количество вещества и т. п. , всегда выбираются дискретные множества уровней. В практических задачах области определения факторов, как правило, ограничены. Ограничения могут носить принципиальный либо технический характер.
Факторы Качественные (тип подвижного состава, вид топлива, технологии) Количественные (скорость, путь, число пассажиров)
Требования к факторам при планировании эксперимента Управляемость – возможность выбора уровней фактора и поддержания их в одном состоянии на протяжении всего эксперимента Операциональность – выбор размерности фактора и точность его фиксирования Точность замера (степень точности определяется диапазоном изменения факторов) Однозначность – непосредственное воздействие на объект, фактор не является функцией других факторов
Требования к совокупности факторов Совместимость – комбинации факторов осуществимы и безопасны. Несовместимость может наблюдаться на границах или внутри областей определения факторов. Решение – сокращение области или разбиение на подобласти Независимость (некоррелируемость) – возможность установления фактора на любом уровне зависимости от уровня других факторов (отсутствие линейной зависимости между факторами)
Подходы к отбору факторов Отбор факторов Априорный (включение факторов в модель до ее построения путем исследования характера и силы их взаимодействия и последующего отбора наиболее значимых) Апостериорный (исключение факторов их модели на основе анализа характеристик ее качества)
Множественная регрессия Для отбора факторов при построении модели используется множественная регрессия. С ее помощью можно определить влияние каждого из факторов в отдельности, а также их совокупное воздействие на моделируемый показатель. Основные типы функций, используемые при количественной оценке связей: линейная функция: у = а 0 + a 1 х1 + а 2 х2, +. . . + amxm. Параметры a 1, а 2, am, называются коэффициентами «чистой» регрессии и характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне; нелинейные функции: у=ах1 b 1 х2 b 2. . xmbm- - степенная функция; b 1, b 2. . . bm - коэффициенты эластичности; показывают, насколько % изменится в среднем результат при изменении соответствующего фактора на 1 % и при неизменности действия других факторов.
Требования к включаемым факторам 1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность. 2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией может привести к нежелательным последствиям - система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. 3. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.
Отбор факторов обычно осуществляется в две стадии: – на первой подбираются факторы исходя из сущности проблемы; – на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
1. Проверка парной корреляции Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарные, т. е. находятся между собой в линейной зависимости, если rxi, xj 0, 7 Если факторы явно коллинеарны, то они дублируют друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.
2. Оценка мультиколлинеарности факторов. При наличии мультиколлинеарности факторов, т. е. когда более чем два фактора связаны между собой линейной зависимостью, имеет место совокупное воздействие факторов друг на друга. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.
3. Использование частных коэффициентов корреляции при отсеве фактора. Частные коэффициенты (индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. 0, 1 - 0, 3 - слабая связь 0, 3 -0, 5 – умеренная связь 0, 5 -0, 7 - заметная связь 0, 7 -0, 9 - тесная связь 0, 9 -0, 99 - весьма тесная
Пример: Представлена информация об объемах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов и средняя заработная плата за ряд текущих лет. х1 - затраты на рекламу, тыс. руб. х2 - индекс потребительских расходов, % х3 - средняя заработная плата, тыс. руб. у- объем продаж, тыс. руб. Дана матрица межфакторной корреляции: R= , Det |R|= 0, 29659 Det |R| ≠ 0, мультиколлинеарность отсутствует.
1 2 3 4 Матрица коэффициентов парной корреляции y X 1 X 2 X 3 1 y 1 0, 645918 0, 795658 0, 6214 2 X 1 0, 645918 1 0, 218104 0, 06788 3 X 2 0, 795658 0, 218104 1 0, 821931 4 X 3 0, 6214 0, 06788 0, 821931 1 коэффициент частной корреляции, характеризующий степень тесноты связи между результатом (y) и первым фактором (х1) при неизменном значении оставшихся двух факторов, определим по формуле: ryx 1 x 2 x 3 = где Ryx 1 = (-1)1+2 Ryy= (-1) 1+1 Rx 1 x 1= (-1)2+2 = - 0, 1492626 = 0, 29659, = 0, 117981
ryx 1 x 2 x 3 === 0, 79988 Аналогично находим еще два коэффициента частной корреляции ryx 2 x 1 x 3 = 0, 68639 ryx 3 x 1 x 2 =0, 11154 На основе значений коэффициентов частной корреляции можно сделать вывод, что наибольшее влияние на результат при неизменном уровне остальных факторов оказывает первый фактор, т. е. затраты на рекламу.
Выбор факторов модели - Снигур А.С. АП-501.pptx