Скачать презентацию Математические методы моделирования в геологии СВ Природа не Скачать презентацию Математические методы моделирования в геологии СВ Природа не

МММ л 7 от 140314.pptx

  • Количество слайдов: 35

Математические методы моделирования в геологии СВ Природа не знает никаких прав, ей известны только Математические методы моделирования в геологии СВ Природа не знает никаких прав, ей известны только законы. Д. Адамс 2012 Лекция 5

Корреляция геологических данных. Многомерные статистические модели Ранее речь велась о характере распределений одной случайной Корреляция геологических данных. Многомерные статистические модели Ранее речь велась о характере распределений одной случайной величиной СВ. В геологической практике обычно приходится иметь дело одновременно с несколькими СВ. Свойства объектов могут быть независимыми, а могут взаимозависимыми. Задача – установить: q имеется ли связь? q рассчитать уравнение зависимости.

Корреляция геологических данных. Многомерные статистические модели Связь м. б. : Функциональной - связь, когда Корреляция геологических данных. Многомерные статистические модели Связь м. б. : Функциональной - связь, когда одному значению аргумента соответствует одно определенное значение аргумента функции Стохастическая – связь, когда одна СВ реагирует на одна изменение значений другой величины изменением другой своего закона распределения Корреляционная зависимость (обычно используется в геологии) - частный случай стохастических связей, взаимосвязь значений одной СВ со средним значением одной другой СВ. другой В каждом отдельном случае любая взаимосвязанная величина может принимать различные значения.

Корреляция геологических данных. Многомерные статистические модели Функциональная Стохастическая Корреляционная (значения одной СВ со с Корреляция геологических данных. Многомерные статистические модели Функциональная Стохастическая Корреляционная (значения одной СВ со с р е д н и м одной значением другой СВ). другой Регрессионная – связь одной детерминированной одной величины с другой переменной (случайной). другой Статистическая - зависимость между одной величиной характеристиками другой (например, другой моменты с т а р ш и х п о р я д к о в (а не среднее значение)).

Корреляция геологических данных. Многомерные статистические модели Корреляционная связь описывает следующие ВИДЫ зависимостей: - причинную Корреляция геологических данных. Многомерные статистические модели Корреляционная связь описывает следующие ВИДЫ зависимостей: - причинную зависимость между значениями параметров; - "зависимость" между следствиями общей причины. В двумерной статистической модели объект исследования рассматривается как двумерная статистическая совокупность. Ее основной характеристикой является двумерная функция распределения СВ X и Y.

Корреляция геологических данных. Многомерные статистические модели Между двумя СВ проявляются вероятностные связи, когда заданному Корреляция геологических данных. Многомерные статистические модели Между двумя СВ проявляются вероятностные связи, когда заданному значению СВ Х=х соответствует не какое–либо значение Y , а набор ее значений y 1, y 2, …yn, каждому из которых свойственна вероятность р1, р2, …рn. y 1 х 1 y 2 … yn р1 р2 … рn Функция распределения СВ Y, соответствующая значению X=x, характеризуется математическим ожиданием и дисперсией.

Корреляция геологических данных. Многомерные статистические модели Двумерную СВ X, Y можно наглядно изобразить в Корреляция геологических данных. Многомерные статистические модели Двумерную СВ X, Y можно наглядно изобразить в виде облака точек - корреляционного поля точек - каждая пара значений точек изображается в виде точки с координатами xi и yi. Форма и ориентировка Форма ориентировка корреляционного поля точек позволяет судить о НАЛИЧИИ корреляционной (статистической связи) связи, о ее ХАРАКТЕРЕ (прямая или обратная) и ВИДЕ (линейная или нелинейная). Связь между СВ существует - корреляционное поле точек имеет форму эллипса, длинная ось которого вытянута относительно осей координат.

Корреляция геологических данных. Многомерные статистические модели ХАРАКТЕр а – связь положительная (прямая), б – Корреляция геологических данных. Многомерные статистические модели ХАРАКТЕр а – связь положительная (прямая), б – связь отрицательная (обратная). ОТСУТСТВИЕ СВЯЗИ - корреляционное поле точек имеет изометрическую форму Неоднородность выборочной совокупности

Корреляция геологических данных. Многомерные статистические модели Графическое изображение условных центров распределения Линия, соединяющая между Корреляция геологических данных. Многомерные статистические модели Графическое изображение условных центров распределения Линия, соединяющая между собой множество условных центров распределения - линия регрессии. Она является графическим изображением формы связи между х графическим изображением формы связи и у. Называется регрессией Y на X.

Корреляция геологических данных. Многомерные статистические модели Графическое изображение центров распределения Центры распределения, т. е. Корреляция геологических данных. Многомерные статистические модели Графическое изображение центров распределения Центры распределения, т. е. медианы, легко получить, используя прозрачную линейку, которую нужно перемещать параллельно осям координат до такого положения, когда число точек над – и – под линейкой окажется одинаковым.

Корреляция геологических данных. Многомерные статистические модели Системе из двух СВ соответствуют две линии регрессии. Корреляция геологических данных. Многомерные статистические модели Системе из двух СВ соответствуют две линии регрессии. !!! каждому значению СВ соответствует некоторая функция распределения величины Х со своим мат. ожиданием и дисперсией (регрессия Х на У). Если регрессия линейна, то линии регрессии – ПРЯМЫЕ ЛИНИИ. Уравнения уравнение регрессии У на Х регрессии имеют вид: уравнение регрессии Х на У у= a 1 x + b 1 х= a 2 y + b 2

Графическое изображение линий регрессии у= a 1 x + b 1 х= a 2 Графическое изображение линий регрессии у= a 1 x + b 1 х= a 2 y + b 2 Корреляция геологических данных. Многомерные статистические модели Коэффициенты b 1 и b 2 характеризуют положения начальных точек линий регрессии. b 1 = b 2 =0 - линии проходят через начало координат. Коэффициенты a 1 и a 2, - коэффициенты линейной регрессии. Определяют степень зависимости случайных величин. a 1, a 2 - тангенсы углов наклона прямых регрессии: у= a 1 x + b 1 к оси абсцисс (угол 1); оси абсцисс х= a 2 y + b 2 к оси ординат (угол 2). оси ординат

Корреляция геологических данных. Многомерные статистические модели Прямые регрессии пересекаются в точке, координаты которой равны Корреляция геологических данных. Многомерные статистические модели Прямые регрессии пересекаются в точке, координаты которой равны математическим ожиданиям величин Х и ожиданиям У, а угол 3 между ними изменяется от 0 до 90. Чем меньше этот угол, тем сильнее связь между величинами. Если угол 3=0, то прямые сливаются в одну линию и связь между величинами становится функциональной.

Корреляция геологических данных. Простая линейная модель. Предмет корреляционного анализа: q Изучение наличия или отсутствия Корреляция геологических данных. Простая линейная модель. Предмет корреляционного анализа: q Изучение наличия или отсутствия зависимости изучаемого геологического признака от различных факторов; q количественная оценка тесноты связей; q моделирование их математическими функциями. Различают корреляцию двухмерную (или парную), трехмерную и т. д. В случае парной корреляции изменения изучаемого признака связаны только с одним фактором. При многомерной корреляции м. б. проведен многофакторный корреляционный анализ.

Корреляция геологических данных. Выбор функций, с помощью которых аппроксимируются изучаемые статистические связи. В простейшей Корреляция геологических данных. Выбор функций, с помощью которых аппроксимируются изучаемые статистические связи. В простейшей форме ЧАСТО используют уравнение прямой линии или плоскости. Для аппроксимации более сложных зависимостей применяют степенные полиномы, показательные, полиномы показательные логарифмические, экспоненциальные и логарифмические экспоненциальные тригонометрические функции. тригонометрические

Корреляция геологических данных. Простая линейная модель. В общем виде корреляционная связь изучаемого признака с Корреляция геологических данных. Простая линейная модель. В общем виде корреляционная связь изучаемого признака с одним или несколькими факторами многомерной совокупности: Y=M[Y] + e, где Y - изучаемый признак; M[Y] - его математическое ожидание; e - случайная величина, отображающая влияние неучтенных факторов. В простейшей форме для двухмерной совокупности эта связь может быть представлена уравнением прямой линии M[Y] = a. X + b, где M[Y] - математическое ожидание изучаемого признака; X - фактор, с которым устанавливается связь; a, b - постоянные коэффициенты.

Корреляция геологических данных. Простая линейная модель. o Уравнение Y=M[Y] + e принимает вид простой Корреляция геологических данных. Простая линейная модель. o Уравнение Y=M[Y] + e принимает вид простой линейной модели. o Связь изучаемого признака Y с фактором X в плоскости XOY отображена в виде полосы M[Y] ± виде e. o В соответствии с нормальным законом распределения, отмечается симметричное Графическое изображение парной корреляционной связи. убывание вероятностей (частот) убывание при удалении от зависимости M[Y] = a. X + b.

Корреляция геологических данных. Конкретное значение выборочной совокупности А(Xi, Yi) в общем случае не совпадает Корреляция геологических данных. Конкретное значение выборочной совокупности А(Xi, Yi) в общем случае не совпадает с наиболее вероятным значением изучаемого признака А 1(Xi, a. Xi + b). Разность Yi - a. Xi – b=ei является случайным отклонением, обусловленным влиянием на признак неучтенных факторов. a - тангенс угла наклона прямой математического ожидания к оси X, b соответствует длине отрезка оси Y, отсекаемого при X = 0. – Геометрическая интерпретация постоянных коэффициентов уравнения корреляционной связи

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Наилучшее приближение связи M[Y]=a. X+b Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Наилучшее приближение связи M[Y]=a. X+b к фактическим значениям А(Xi, Yi) выборочной совокупности м. б. достигнуто только при минимальных значениях отклонений ei. Сумма отклонений м. б. минимальной. Значения ei могут иметь разные знаки, их разные предварительно возводят в квадрат и рассчитывают a и квадрат b при условии минимума суммы квадратов отклонений. Метод наименьших квадратов.

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Обозначив M[Y] Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Обозначив M[Y] = y и приняв F(a; b) = Условие минимума: F(a; b) = = min, Частные производные от сложной функции F(a; b) по a и b и приравняем их нулю. Получим систему:

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Проведем алгебраические Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Проведем алгебраические преобразования полученной системы – вынесем постоянный множитель 2 и "-"за знак суммы: Умножая правую и левую части уравнений системы -1/2 , приведем систему к виду

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Полученную систему Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Полученную систему линейных уравнений предлагается решить методом Крамера Коэффициенты a и b находятся по формулам В этих формулах определитель системы, а и определители, полученные из определителя системы заменой первого и второго столбцов коэффициентов при определяемом неизвестном столбцом свободных членов.

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Определитель системы Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Определитель системы вычисляют следующим образом:

Уравнение является только приближенным описанием связи, выборочные значения Yi могут отличатся от их математических Уравнение является только приближенным описанием связи, выборочные значения Yi могут отличатся от их математических ожиданий y. Дисперсию и стандартное отклонение разброса фактических значений Yi относительно прямой y = a. X + b можно вычислить по формулам

Невысокое значение дисперсии и стандартного отклонения свидетельствует Невысокое о близости прямой к ФУНКЦИОНАЛЬНОЙ зависимости. Невысокое значение дисперсии и стандартного отклонения свидетельствует Невысокое о близости прямой к ФУНКЦИОНАЛЬНОЙ зависимости.

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Приближенная оценка Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Приближенная оценка корреляции может быть получена также графическим путем. Для этого облако точек делится на 4 квадранта линиями, проведенными в точках, соответствующих медианам X и Y. где N - общее число точек, n 13 - количество точек в квадрантах I и III, n 24 - количество точек в квадрантах II и IV. Графический путь приближенной оценки корреляции

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Коэффициент корреляции Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Коэффициент корреляции определяет тесноту линейной связи между двумя величинами. Его значения изменяются между – 1 и +1. Если наблюдается тенденция возрастания одной величины при росте другой, то говорят о положительной коррелированности величин. Если наблюдается тенденция увеличения одной величины при уменьшении другой, то коррелированность величин отрицательна. При r=0 связь между величинами отсутствует. При |r|=1 связь функциональная.

Проверка гипотезы о наличии корреляционной связи заключается в оценке значимости отличия от нуля вычисленных Проверка гипотезы о наличии корреляционной связи заключается в оценке значимости отличия от нуля вычисленных по выборке значений r. Когда математическое ожидание выборочного коэффициента корреляции равно нулю, статистика t имеет распределение Стьюдента с N-2 степенями свободы. Если рассчитанное по этой формуле значение величины t превышает табличное значение критерия Стьюдента, то отличие r от 0 признается значимым (гипотеза об отсутствии корреляционной связи отвергается).

Оценки интервалов. Так, вычисленное по формуле значение yo для Xo при уровне значимости α Оценки интервалов. Так, вычисленное по формуле значение yo для Xo при уровне значимости α заключено в интервале

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Доверительные интервалы Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Доверительные интервалы для оценки коэффициента a для оценки коэффициента b

Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Помимо вычисления значения одной переменной Корреляция геологических данных. Простая линейная модель. Метод наименьших квадратов. Помимо вычисления значения одной переменной по дополнительным данным другой переменной с помощью рассчитанного уравнения регрессии Доверительный интервал для оценки дисперсии рассчитывается по формуле

Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Существуют и более простые способы Простая линейная модель. Метод наименьших квадратов. Основные расчетные формулы Существуют и более простые способы оценки доверительных интервалов. Так, для оценки a может быть вычислена дисперсия отклонений от коэффициента регрессии где и - общие средние квадратические отклонения признака X и Y соответственно. Определяются по формулам: Оценка a считается надежной, если a>3 Sa. Для оценки R находим дисперсию отклонений от значений коэффициента корреляции по формуле Оценка r считается надежной при r > 3 Sr.

Английский статистик Вильям Госсет (родился в 1876 г. и умер в 1937 г. ) Английский статистик Вильям Госсет (родился в 1876 г. и умер в 1937 г. ) Работая в начале 20 -го столетия на пивоваренных заводах Гиннеса, он проводил математическое исследование для назревания пива, но у него возникла проблема, связанная с тем, что он работал только с малыми выборками. Предложил tкритерий Стьюдента, подписав свою статью о нем псевдонимом "Student". Он также изучал проблему вероятной ошибки коэффициента корреляции.