Multiple variables regression Множественная регрессия The general purpose
Multiple variables regression Множественная регрессия
The general purpose of multiple regression (the term was first used by Pearson, 1908) is to learn more about the relationship between several independent or predictor variables and a dependent or criterion variable. For example, a real estate agent might record for each listing the size of the house (in square feet), the number of bedrooms, the average income in the respective neighborhood according to census data, and a subjective rating of appeal of the house. Once this information has been compiled for various houses it would be interesting to see whether and how these measures relate to the price for which a house is sold. For example, you might learn that the number of bedrooms is a better predictor of the price for which a house sells in a particular neighborhood than how "pretty" the house is (subjective rating). You may also detect "outliers," that is, houses that should really sell for more, given their location and characteristics.
The main formula of multiple regression is Y = a + b1*X1 + b2*X2 + ... + bn*Xn And now let’s solve the example of problem. There are data of cars’ costs (resultative var y, th, tg), age of issue (car’s age is x1 factor) and mileage(x2 factor, th.km). Имеются данные о стоимости автомобилей (результативная переменная y, тыс.тг.), о годе выпуска (возраст автомобиля – фактор х1, лет) и о пробеге (фактор х2, тыс. км):
Find the average square deflections: Найдем средние квадратические отклонения переменных:
Find the coefficients of two variables correlation: Найдем коэффициенты парной корреляции:
Стандартизированные β-коэффициенты определим по формулам
Таким образом, уравнение регрессии в стандартизированной форме имеет вид: . Вывод: Сравнение модулей значений стандартизированных коэффициентов регрессии () говорит о том, что на цену автомобиля возраст (фактор х1) оказывает значительно большее влияние, нежели пробег (фактор х2). Рассчитаем естественные коэффициенты регрессии: Получаем уравнение линейной множественной (двухфакторной) регрессии в естественной форме: . Вывод: с увеличением возраста машины на 1 год ее цена уменьшается в среднем на 11,56 тыс. рублей, а с увеличением пробега на 1 тыс. км цена уменьшается в среднем на 0,08 тыс. рублей (80 рублей).
Find the coefficients of multiple correlation
Conclusion Вывод: коэффициенты частной корреляции характеризуют тесноту связи между двумя переменными, исключив влияние третьей переменной. Значит, связь между ценой на автомобиль и годом выпуска при исключении влияния величины пробега обратная и заметная; между ценой автомобиля и пробегом без учета возраста машины – обратная, но слабая; связь между факторами x1 и x2 – умеренная. Сравним соответствующие коэффициенты парной и частной корреляции: ,
18258-multiple_variables_regression.ppt
- Количество слайдов: 11