Lektsia__04_A_B.ppt
- Количество слайдов: 94
КУРС ЛЕКЦИЙ ЛЕКЦИЯ № 4 МАТЕМАТИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ В ГЕОЛОГИИ Курамшин Ринат Мунирович кандидат технических наук, доцент кафедры, Генеральный директор ООО «Технопром»
ОДНОМЕРНАЯ СТАТИСТИЧЕСКАЯ МОДЕЛЬ И ЕЕ ПРИМЕНЕНИЕ В ГЕОЛОГИИ
СВОЙСТВА ГЕОЛОГИЧЕСКИХ ОБЪЕКТОВ КАК НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Одномерная статистическая модель применяется для изучения одного свойства. Пусть имеется система, состоящая из множества однородных геологических объектов (параметров). Выборочным методом возьмем из множества n объектов и у каждого из них измерим характеристику свойства х. Результаты измерений обозначим х1, х2, . . . , хn и составим из них матрицу, в которой число строк равно n, а число столбцов k = 1.
СВОЙСТВА ГЕОЛОГИЧЕСКИХ ОБЪЕКТОВ КАК НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ В основе одномерной статистической модели лежат три гипотезы: Ø измеренные значения х1, х2, …, хn носят случайный характер; Ø они не зависят друг от друга; Ø значения образуют однородную совокупность. Измеренные значения принято называть реализациями случайной величины х. Гипотеза о случайном характере свойств обусловлена тем, что природные геологические системы и объекты являются весьма сложными, на каждое измеренное значение влияет множество разнонаправленных факторов. Кроме того, погрешностью. каждое измерение сопровождается случайной Данная гипотеза позволяет применять для математической обработки значений х1, х2, …, хn аппарат (теоремы, формулы, уравнения, законы) теории вероятностей.
СВОЙСТВА ГЕОЛОГИЧЕСКИХ ОБЪЕКТОВ КАК НЕЗАВИСИМЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Вторая гипотеза о независимости измеренных значений менее очевидна. Предполагается, что на результат каждого отдельного измерения не влияют результаты предыдущих или соседних измерений. Из этой гипотезы вытекает важное следствие, что для математической обработки не существенно пространственное размещение пунктов наблюдений, т. е. результаты измерений можно располагать в любом порядке, на выводы это не влияет. Эта гипотеза не всегда соответствует действительности: соседние измерения нередко зависят друг от друга, что можно проверить с помощью специального математического аппарата. Статистическая обработка результатов измерений имеет смысл лишь только для однородных совокупностей, что лежит в основе третьей гипотезы. Если совокупность неоднородная, то ее необходимо разделить на однородные совокупности и каждую из них исследовать отдельно.
СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ В основе большинства вычислений лежит расчет статистических характеристик случайной величины. К наиболее распространенным статистическим характеристикам одномерной случайной величины относятся: Ø размах Ø медиана, Ø мода, среднее значение, Ø дисперсия, Ø среднеквадратичное отклонение, Ø коэффициент вариации, Ø асимметрия, Ø эксцесс и т. д.
СУЩНОСТЬ И ЗНАЧЕНИЕ СРЕДНИХ ПОКАЗАТЕЛЕЙ Средняя величина представляет собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени. Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Сущность средней величины заключается в том, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Определить среднюю во многих случаях можно через исходное соотношение средней (ИСС) ИСС = Суммарное значение или объем осредняемого признака Число единиц или объем совокупности
СУЩНОСТЬ И ЗНАЧЕНИЕ СРЕДНИХ ПОКАЗАТЕЛЕЙ В каждом конкретном случае для реализации исходного соотношения потребуется одна из следующих форм средней величины: Ø Ø средняя арифметическая; средняя гармоническая; средняя геометрическая; средняя квадратическая, кубическая и т. д. Перечисленные средние (кроме средней геометрической) объединяются в общей формуле средней степенной (при различной величине k): где - средняя величина исследуемого явления; - i-й вариант осредняемого признака - вес i-го варианта. Помимо степенных средних также используются средние структурные, среди которых наиболее распространены мода и медиана.
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Средняя арифметическая простая (невзвешенная). Эта форма средней используется в тех случаях, когда расчет осуществляется по несгруппированным данным. ПРИМЕР: Добыча скважин за месяц Номер скважины 1 2 3 4 5 6 7 Добыча за месяц, т 10 3 5 12 11 7 9
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Средняя арифметическая простая (взвешенная). При расчете средних величин отдельные значения осредняемого признака могут повторятся, встречаться на несколько раз. Например при расчете Кп по участкам, залежи. В подобных случаях расчет средней производится по сгруппированным данным или вариационным рядам, которые могут быть дискретными или интервальными ПРИМЕР: Расчет среднего значения пористости Номер участка Площадь участка, тыс. м 2 Значение пористости 1 500 0, 14 2 300 0, 13 3 1100 0, 16
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Расчет среднего значения пористости выполнен по формуле средней арифметической взвешенной: В отдельных случаях веса могут быть представлены не абсолютными величинами, а относительными (в процентах или долях единицы). Так, в приведенном примере площадь каждого участка соответственно составляет 26, 3% (0, 263), 15, 8% (0, 158) и 57, 9% 90, 579) от их общего числа. Следовательно: или Использовать среднюю арифметическую невзвешенную можно только тогда, когда точно установлено отсутствие весов или их равенство.
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Свойства средней арифметической: 1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты: 2. Сумма отклонений индивидуальных значений признака от средней арифметической равна нулю:
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Свойства средней арифметической: 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем сумма квадратов их отклонений от любой другой произвольной величины С: Следовательно, сумма квадратов отклонений индивидуальных значений признака от произвольной величины С больше суммы квадратов их отклонений от своей средней на величину: или
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Свойства средней арифметической: На использовании этого свойства базируется расчет центральных моментов, представляющих собой характеристики вариационного ряда при где - определяет порядок момента (центральный момент второго порядка представляет собой дисперсию). 4. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшиться или увеличиться на ту же величину:
СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ И ЕЕ СВОЙСТВА Свойства средней арифметической: 5. Если все варианты значений признака уменьшить или увеличить в А раз, то средняя арифметическая соответственно уменьшиться или увеличиться в А раз: 6. Если все веса уменьшить или увеличить в А раз, то средняя арифметическая от этого не измениться:
ДРУГИЕ ВИДЫ СРЕДНИХ Средняя гармоническая взвешенная. Рассмотрим вариант, когда известен числитель исходного соотношения средней, но неизвестен его знаменатель Предприятие Добыча нефти, тыс. т Дебит 1 действующей скважины, т/сут Ойл 1 1088, 3 10, 9 Ойл 2 603, 5 12, 1 Ойл 3 1171, 5 17, 5 Ойл 4 1050, 7 8, 8 Средний дебит по нефти предприятия определяется: Ø Общую добычу мы получим простым суммированием по предприятиям. Ø Данные же о количестве скважин в таблице отсутствуют, но их можно получить разделив добычу по каждому предприятию на дебит.
ДРУГИЕ ВИДЫ СРЕДНИХ Таким образом, суммарная добыча по предприятию составила 11, 6 тыс. т на скважину. Расчет был произведен по формуле средней гармонической взвешенной: где
ДРУГИЕ ВИДЫ СРЕДНИХ Средняя гармоническая невзвешенная. Эта форма средней, используемая значительно реже, имеет следующий вид: Средняя геометрическая: § невзвешенная § взвешенная Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста.
ДРУГИЕ ВИДЫ СРЕДНИХ Средняя квадратическая: § невзвешенная § взвешенная Наиболее широко этот вид используется при расчете показателей вариации. В статистической практике также находят применение степенные средние 3 -го и более высоких порядков.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Важнейшей характеристикой центра распределения является средняя арифметическая Для вычисления по данным первичного ряда применяется формула простой средней арифметической. При вычислении по данным ранжированного вариационного ряда применяется формула средней взвешенной. В отличие от средней арифметической, рассчитываемой на основе использования всех вариантов значений признака, мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Модой распределения (Мо) называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто. ПРИМЕР: Определение моды по не сгруппированным данным Дебиты по 11 разведочным скважинам имеют следующие значения: 5, 4, 3, 4, 5, 5, 6, 2, 6, 3, 5. Чаще всего встречаются скважины с дебитом 5 т/сут, то это значение дебита и будет модальным. Для упорядоченного дискретного ряда распределения мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариантов и соответствует варианту с наибольшей частотой.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Группы скважин по дебитам, т/сут х Количество скважин, шт f Накопленные частоты S А 1 2 2 3 4 5 6 20 50 60 70 15 20 70 130 Итого 215 ПРИМЕР: Распределение скважин всего НГДУ по дебитам По данным таблицы видно, что наибольшую частоту (70 скв) имеет группа скважин с дебитом 5 т/сут. Следовательно, она и является модальной (Мо=5 т/сут). В данной совокупности дебитов самым распространенным является дебит 5 т/сут.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Модальный интервал (т. е. содержащий моду) в случае интервального распределения с равными интервалами определяется по наибольшей частоте; с неравными интервалами – по наибольшей плотности, а определение моды требует проведение расчетов на основе формул:
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ ПРИМЕР: Расчет моды для вариационного ряда распределения с равными интервалами Группы скважин по дебитам, т/сут х Количество скважин, % к итогу f Накопленные частоты S А 1 2 1 -2 2 -3 3 -4 4 -5 5 -6 6 -7 7 -8 свыше 8 10 15 21 25 12 7 5 5 10 25 46 71 83 90 95 100 Итого 100 - Интервал с границами 4 -5 в данном распределении будет модальным, так как он имеет наибольшую частоту. Таким образом, в данной совокупности самым распространенным значением дебита является дебит со значением 4, 2 т/сут.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ В качестве характеристики вариационного ряда также применяется медиана (Ме). Медиана (Ме) – величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы – сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: Если в вариационном ряду 2 m+1 случаев (нечетное число вариантов), то значение признака у случая m+1 будет медианным.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Если в ряду четное число 2 m случаев, то медиана равна средней арифметической из двух данных значений. Положение медианы в ряду распределения (по сгруппированным данным) определяется ее номером:
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ ПРИМЕР 1: Определение медианы (нечетное число вариантов: 2 m+1) Рассмотрим определение медианы по данным вариационного ряда из 11 скважин, имеющих дебиты: 5, 4, 3, 4, 5, 5, 6, 2, 6, 3, 5 т/сут. Проведем ранжирование дебитов: 2, 3, 3, 4, 4, 5, 5, 6, 6 т/сут. Центральным в этом ряду будет дебит 5 т/сут, следовательно, данный разряд и будет медианным ПРИМЕР 2: Определение медианы (четное число вариантов: 2 m) Ранжированный ряд включает 12 скв. : 2, 3, 3, 4, 5, 5, 6 т/сут. В данном случае медиана определяется арифметическая из двух центральных значений: как средняя Если мода отражает типичный, наиболее распространенный вариант значения признака, то медиана практически выполняет функцию средней величины для неоднородной совокупности, не подчиняющейся нормальному закону распределения.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ ПРИМЕР: Добыча нефти по скважинам за месяц. № п/п 1 2 3 4 … 50 51 … 99 100 Добыча нефти, т 100 104 107 … 162 164 … 200 50 000 Необходимо дать характеристику средней добычи нефти по группе из 100 скважин, 99 из которых имеют добычу в интервале от 100 до 200 тонн, а месячная добыча последней скважины составляет 50 000 тон. Воспользуемся формулой средней арифметической → получим среднюю добычу, равную примерно 600 – 700 тонн, которая не только в несколько раз меньше добычи 100 -ой скважины, но и имеет мало общего с добычей остальных скважин. Медиана же, равная в данном случае 163 тонны, позволит дать объективную характеристику уровня добычи 99 % данной группы скважин.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ В интервальном ряду распределения сразу можно указать только интервал, в котором будет находиться медиана. Для определения ее величины используется специальная формула: где x 0 – нижняя граница медианного интервала; i – величина медианного интервала; SMe-1 – накопленная частота интервала, предшествующего медианному; f. Ме – частота медианного интервала
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Моду и медиану в интервальном ряду можно определять графически. Мода определяется по гистограмме распределения. 1. Выбирается самый высокий прямоугольник, который в данном случае является модальным. 2. Правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. 3. Левую вершину модального прямоугольника соединяют с левым верхним углом последующего прямоугольника. 4. Из точки их пересечения опускают перпендикуляр на ось абсцисс.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Медиана рассчитывается по кумуляте. 1. Из точки на шкале накопленных частот (частостей), соответствующей 50 %, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. 2. Из точки пересечения опускается перпендикуляр на ось абсцисс. 3. Абсцисса точки пересечения является медианой.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Таким образом, в качестве обобщенной характеристики значений определенного признака у единиц ранжированной совокупности могут быть использованы: Ø средняя арифметическая Ø мода Ø медиана Каждая их них имеет свои особенности. Основной характеристикой центра распределения является средняя арифметическая, для которой характерно то, что все отклонения от нее (положительные или отрицательные) в сумме равны нулю. Для медианы характерно то, что сумма отклонений от нее по модулю является минимальной. Мода представляет собой значение признака, которое наиболее часто встречается. В зависимости от цели исследования распределения должна выбираться одна из упомянутых характеристик, либо же для сравнения вычисляются все три.
ПОКАЗАТЕЛИ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. В симметричных распределениях все три характеристики совпадают. Чем больше расхождение между модой и средней арифметической, тем более асимметричен ряд. Для умеренно асимметричных рядов разность между модой и средней примерно в три раза превышает разность между медианой и средней.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Средняя величина дает обобщающую совокупности изучаемого явления. характеристику всей Однако, исчислив среднюю арифметическую по данным вариационного ряда, мы еще ничего не знаем о том, как отдельные значения изучаемого признака группируются вокруг средней. Нельзя ограничиться вычислением одной средней величины, надо изучать не только среднюю, но и отклонение от нее. Для вариационного ряда важно изучать степень сплоченности всех отдельных значений параметра (признака) вокруг его среднего значения, степень разбросанности этих значений, степень их колеблемости. Øабсолютные Для это в теории статистики используются показатели вариации. Øотносительные. Показатели вариации делятся на две группы:
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА К абсолютным показателям относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. К относительным показателям относятся: коэффициенты
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Вариационный размах (R) (амплитуда колебаний) показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значение признака. Размах рассчитывают как разность между наибольшим (хmax) и наименьшим (xmin) значениями варьирующего признака: НАПРИМЕР: пористость, проницаемость, толщина.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Размах вариации существует, чтобы измерять расстояния между крайними точками. Недостатки размаха вариации: очень низкое и очень высокое значение параметра (признака) по сравнению с основной массой его значений в совокупности могут быть обусловлены какими-либо сугубо случайными обстоятельствами, т. е. эти значения являются аномальными в совокупности. В этих случаях размах вариации даст искаженную амплитуду колебания параметра (признака).
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Среднее линейное отклонение. Для анализа вариации необходим показатель, который бы отражал все колебания варьирующего признака и давал обобщенную его характеристику. Для многих варьирующих признаков возможно допущение, что при прочих равных условиях все единицы совокупности в соответствии с основными законами своего распределения имеют одинаковую и при этом вполне определенную величину в данных условиях места и времени. Вполне логично в качестве такой величины условно принять среднюю величину из всех значений признака, поскольку в ней более или менее погашаются случайные отклонения от закономерного развития явления, и средняя тем самым отражает типичный размер признака у данной однородной совокупности единиц. Но условия существования и развития отдельных единиц совокупности в определенной степени различны, что сказывается на различии значений признака. Средняя величина отражает эти средние условия.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Средняя применяется в качестве своего рода центра тяжести, вокруг которого происходит колебание, рассеяние значений параметра (признака). При обобщении этих колебаний необходимо прибегать к методу средних величин – искать среднюю величину этих отклонений. Такая средняя называется средним линейным отклонением Эта величина вычисляется как средняя арифметическая из абсолютных значений отклонений вариант простая: взвешенная: Поскольку сума отклонений значений признака от средней величины равна нулю, приходится все отклонения брать по модулю.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА ПРИМЕР: Расчет среднего линейного отклонения Распределение скважин по дебитам, т/сут xi Число скважин, % к итогу fi А 1 2 3 4 5 До 10 10 -12 12 -14 14 -16 16 -18 18 -20 Свыше 20 30 25 26 9 4 3 3 9 11 13 15 17 19 21 270 275 338 135 68 57 63 3, 06 1, 06 0, 94 2, 94 4, 94 6, 94 8, 94 91, 8 26, 5 24, 4 26, 5 19, 8 20, 8 26, 8 Итого 100 - 1206 - 236, 6 Середина интервала
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Алгоритм расчета среднего линейного отклонения: 1. Найдем середину интервалов (xi′) по исходным данным (графа А) и запишем в таблицу (графа 2). 2. Определим произведение значений середины интервалов (xi′) на соответствующие им веса (fi) (графа 3). В итоге получим 1206. 3. Рассчитаем среднюю величину по формуле средней арифметической взвешенной: 4. Найдем абсолютные отклонения середины интервалов, принятых нами в качестве вариантов признака (xi′), от средней величины (графа 4). 5. Вычислим произведения отклонений на их веса (fi) и подсчитаем сумму их произведений. Она равна 236, 6. 6. Делим эту сумму на сумму весов, чтобы получить искомую величину
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Ø Таково в среднем отклонение вариантов признака от их средней величины. Ø Это отклонение по сравнению со средней величиной признака небольшое.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Среднее линейное отклонение дает обобщенную характеристику степени колеблемости признака в совокупности. Однако при его исчислении приходится допускать некорректные с точки зрения математики действия, нарушать законы алгебры. Математики и статистики искали иной способ оценки вариации для того, чтобы иметь дело только с положительными величинами. Был найден очень простой выход – возвести все отклонения во вторую степень. Это столь простое решение привело в последующем к большим научным результатам. Оказалось, что обобщающие показатели вариации, найденные с использованием вторых степеней отклонений, обладают замечательными свойствами; позднее на их основе были разработаны новые методы исследования, а также новые показатели количественной характеристики большого класса явления. Полученную меру вариации назвали дисперсией и обозначили
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и в зависимости от исходных данных вычисляется по формулам: простой дисперсии: взвешенной дисперсии: Расчет дисперсии может быть упрощен. В случае равных интервалов в вариационном ряду распределения используется способ отсчета от условного нуля (способ моментов). Для его понимания необходимо знать математические свойства дисперсии.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Математические свойства дисперсии. 1. Дисперсия постоянной величины равна нулю. 2. Уменьшение всех значений признака на одну и ту же величину А не меняет величину дисперсии. 3. Уменьшение всех значений признака в k раз уменьшает дисперсию в k 2 раз, а среднее квадратическое отклонение – в k раз. 4. Если исчислять средний квадрат отклонений от любой величины А, в той или иной степени отличающейся от средний арифметической , то он всегда будет больше среднего квадрата отклонений, исчисленного от средней арифметической:
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Математические свойства дисперсии. Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней и этой условно взятой величины: или Дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, т. е. она имеет свойство минимальности В случае когда А приравнивается к нулю, отклонения не вычисляются, формула принимает вид: или Средний квадрат отклонений равен среднему квадрату значений признака минус квадрат среднего значения признака.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА На приведенных математических свойствах дисперсии основан метод расчета дисперсии по способу моментов, или способу отсчета от условного нуля, который применяется при исчислении средней величины. Расчет производится по формуле: где k – ширина интервала; A – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой; Дисперсия есть средняя величина квадратов отклонений, а варианты признака выражены в первой степени.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Среднее квадратическое отклонение (σ) равно корню квадратному из дисперсии. простое: взвешенное: Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения. Они выражаются в тех же единицах измерения, что и признак (в метрах, тоннах и т. д. ). Среднее квадратическое отклонение часто используется в качестве единицы измерения отклонений от средней арифметической. В зарубежной литературе этот показатель называется нормированным или стандартизированным отклонением.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Среднее квадратическое отклонение играет важную роль в анализе вариационных рядов распределения. В условиях нормального распределения существует следующая взаимосвязь между величиной среднего квадратического отклонения и количеством наблюдений: Ø в пределах располагается 0, 683 (68, 3 %) количества наблюдений; Ø в пределах - 0, 954 или 95, 4 % количества наблюдений; Ø в пределах - 0, 997 или 99, 7 % количества наблюдений; В действительности на практике почти не встречаются отклонения, которые превышают ± 3σ. Отклонение 3σ считается максимально возможным. Это положение называется правилом трех сигм. * Все степенные средние различаются между собой значениями показателя степени. При этом, чем выше показатель степени, тем больше количественное значение среднего показателя.
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА ПРИМЕР: Вычисление σ2 и σ по несгруппированным данным Номер скважины Добыча нефти в год, тыс. т (x) A 1 2 3 4 5 6 60 52 40 60 50 38 +10 +2 -10 +10 0 -12 100 4 100 0 144 Итого 300 - 448 Степень вариации в данной совокупности невелика, т. к. средняя величина равна 50 тыс. т. Это говорит об однородности рассматриваемой
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях представляют интерес показатели вариации, приведенные в относительных величинах. Базой для сравнения должна служить средняя арифметическая. Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего они выражаются в процентах и определяют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному). Различают следующие относительные показатели вариации (V): Ø коэффициент осцилляции (VR) Ø линейный коэффициент вариации Ø коэффициент вариации (Vσ ) Ø квартиль отклонения (Q)
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Коэффициент осцилляции (VR ) Коэффициент вариации (Vσ )
ПОКАЗАТЕЛИ ВАРИАЦИИ И СПОСОБЫ ИХ РАСЧЕТА Характеристика степени вариации ряда может быть определена также по формуле квартильного отклонения (Q), предложенной английским биологом и антропологом Ф. Гальтоном: где Q 3 и Q 1 – соответственно 1 -ая и 3 -я квартили распределения Эта формула дает абсолютный квартильный показатель вариации. В симметричных или умеренно симметричных распределениях Q=2/3σ/ Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднено или невозможно. В частности, этот показатель может быть рекомендован для рядов распределения с открытыми интервалами. В целях сравнения вариации в различных рядах вычисляют относительный квартильный показатель вариации по формуле: где Ме – медиана ряда распределения
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ ДИФФЕРЕНЦИАЦИИ Рассмотренные обобщающие показатели центра распределения и степени вариации не дают понятия о форме распределения, т. е. не вскрывают характера последовательности изменения частот. Для выражения особенностей формы распределения применяются показатели дифференциации, основанные на структурных (ранговых) показателях распределения. Структурные показатели. В системе структурных показателей в качестве показателей особенностей формы распределения выступают варианты, занимающие
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ Квартили представляют собой значение признака, делящее ДИФФЕРЕНЦИАЦИИ ранжированную совокупность на четыре равновеликие части. Ø квартиль нижний (Q 1), отделяющий ¼ часть совокупности с Различают: наименьшими значениями признака, Ø квартиль верхний (Q 3), отсекающий ¼ часть с наибольшими значениями признака. Это означает, что: Ø 25% единиц совокупности будут меньше по величине Q 1; Ø 25% единиц будут заключены между Q 1 и Q 2; Ø 25 % единиц будут заключены между Q 2 и Q 3; Ø 25% единиц превзойдут Q 3. Вторая квартиль Q 2 является медианой. Вычисление квартилей аналогично вычислению медианы.
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ Для расчета квартилей по интервальному вариационному ряду ДИФФЕРЕНЦИАЦИИ используют формулы: где – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%); – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%); – величина интервала; – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль; – тоже для верхнего интервала; – частота интервала, содержащего нижний квартиль; – тоже для верхнего квартиля.
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ ДИФФЕРЕНЦИАЦИИ Квинтили делят распределение на пять равных частей. Децили (di) - это значения вариант, которые делят ранжированный ряд ü 1 -й дециль (d 1) делит совокупность в соотношении 1/10 к 9/10, на десять равных частей: ü 2 -й дециль (d 2) – в соотношении 2/10 к 8/10 и т. д. Вычисляются децили по той же схеме, что и медиана, и квартили: и т. д.
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ Значения признака, делящие ряд распределения на сто частей, ДИФФЕРЕНЦИАЦИИ называются перцентилями. Слово «перцентиль» относится непосредственно к элементу распределения или к значению, промежуточному между двумя элементами. Для того чтобы указать местоположение конкретного наблюдения, в распределении указывается так называемый перцентильный ранг, который равен сумме процентов, приходящихся на наблюдения, которые в распределении стоят ниже его, и половине процентов, которые приходятся на него непосредственно. Метод нахождения перцентилей можно представить с помощью следующей формулы: где – обозначения n-го перцентиля; – нижняя граница интервала; – число оценок, необходимое попасть в точку на горизонтальной оси, которая соответствует данному перцентилю; – расстояние от нижней границы L до верхней границы L+1 (шаг интервала); – число оценок, расположенных в интервале от L до L+1.
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ ДИФФЕРЕНЦИАЦИИ Вышеописанные показатели можно показать в следующем соотношении Децили Перцентили Р а н ж и р о в а н н а я с о в о к у п н о с т ь Медиана Квартили
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ Показатели дифференциации. ДИФФЕРЕНЦИАЦИИ В тех случаях, когда при изучении вариационного ряда возникает необходимость дать относительную характеристику степени вариации ряда и имеются уже предварительно вычисленные квартили и децили, то можно вычислить коэффициент дифференциации (К). В зависимости от заданных ранговых показателей коэффициенты дифференциации рассчитываются по-разному 1. Если заданы 3 -я (Q 3) и 1 -я (Q 1) квартили, то вместо коэффициента вариации (V), можно вычислить коэффициент дифференциации по формуле: В большинстве случаев коэффициент вариации (V) составляет примерно 1, 5 коэффициента дифференциации (Kv), т. е.
СТРУКТУРНЫЕ ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ. ПОКАЗАТЕЛИ ДИФФЕРЕНЦИАЦИИ 2. Если сопоставляются 9 -я (d 9) и 1 -я (d 1) децили, то децильный коэффициент дифференциации (Kd) вычисляется по формуле: 3. Более точно уровень дифференциации можно измерить, сопоставив средние уровни, полученные из 10 % наибольших и наименьших значений признака в совокупности. Такой показатель называется коэффициентом фондовой дифференциации (Кф): - сумма значений признака 10 % самых крупных единиц в совокупности; - сумма значений признака 10 % самых мелких единиц в совокупности; - число единиц совокупности самых мелких и самых крупных.
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ Для подробного описания особенностей распределения используют дополнительные характеристики, в частности определяются моменты распределения. Способ моментов был разработан русским математиком П. Л. Чебышевым и успешно применен А. А. Марковым для рассмотрения возможностей использования закона нормального распределения при изучении сумм большого, но конечного числа независимых случайных величин. Моментом k-го порядка называется средняя из k-х степеней отклонений вариантов х от некоторой постоянной величины А: При исчислении средней в качестве весов могут быть использованы частоты, частости или вероятности. При использовании в качестве весов частот или частостей моменты называются эмпирическими, а при использовании вероятностей – теоретическими.
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ Порядок момента определяется величиной k. Эмпирический момент k–го порядка определяется как соотношение суммы произведений k–х степеней отклонений вариантов от постоянной величины А на частоты к сумме частот: В зависимости от выбора постоянной величины А различают три вида моментов: 1. Начальные моменты (Мk) получаются, если постоянная величина А равна нулю (А=0):
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ 2. Условные и начальные относительно х0 моменты (mk) получаются при А равном не нулю, а некоторой производной величине х0 (начало отсчета): С помощью условных моментов упрощается расчет основных характеристик ряда распределения. При подстановке различных значений k получаем начальные моменты относительно х0. Так, например, если k=1, то:
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ При т. е. средняя арифметическая равна началу отсчета плюс начальный момент первого порядка. Если отклонения (xi - x 0) имеют общий множитель C, то на него можно разделить отклонения, а по окончании вычислить полученный момент, умножив на этот множитель в соответствующей степени, т. е. : Отсюда следует, что при k=1
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ 3. Центральные моменты (μk) получаются, если за постоянную величину А взять среднюю арифметическую (А = х ): В статистической практике пользуются в основном моментами 1 -го, 2 -го, 3 -го, 4 -го порядков, которые представлены в таблице Виды моментов Порядок 1 -й 2 -й 3 -й 4 -й Начальные Центральные Условные
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ Анализируя формулы моментов распределения, можно сделать следующие выводы: Ø Начальный момент первого порядка представляет собой среднюю арифметическую и используется как показатель центра распределения: Ø Начальные моменты 2 -го, 3 -го и 4 -го порядка не имеют самостоятельного значения, а используются для упрощения вычислений центральных моментов. Например, используя начальные моменты 1 -го и 2 -го порядка, можно получить дисперсию по такой формуле: Ø Центральный момент 1 -го порядка всегда равен нулю в соответствии с нулевым свойством средней арифметической Ø Центральный момент 2 -го порядка представляет собой дисперсию и служит основной мерой колеблемости признака
МОМЕНТЫ РАСПРЕДЕЛЕНИЯ Ø Центральный момент 3 -го порядка служит мерой асимметрии распределения, а если распределение симметрично, он равен нулю Ø Центральный момент 4 -го порядка применяется при вычислении показателей эксцесса; Ø Условные моменты 1 -го, 2 -го, 3 -го и 4 -го порядков не имеют самостоятельного значения, а используются для упрощения вычислений центральных моментов.
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ Методы обработки результатов экспериментальных исследований (выбор числа групп) Первый способ (метод) - Формула Стерджесса Существует несколько способов определения оптимального числа групп n - число групп N - число единиц совокупности Согласно формуле Стерджесса выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ Второй способ (метод) - Применение показателя среднего квадратического отклонения (σ) Весь диапазон изменения показателя предполагается равным. величина интервала равна 0, 5σ – совокупность разбивается на 12 групп, величина интервала равна 2/3σ – совокупность разбивается на 9 групп, величина интервала равна σ – совокупность разбивается на 6 групп Однако при определении числа групп данными методами существует большая вероятность получения «пустых» или малочисленных групп. «Пустыми» считаются группы, в которые не попала ни одна единица совокупности. Поэтому данными формулами нельзя пользоваться механически. Их показания требуют корректировки.
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ Интервал группировки - это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою ширину, верхнюю и нижнюю границы или хотя бы одну из них. Нижняя граница интервала – наименьшее значение признака в интервале, а верхняя граница – наибольшее значение признака в нем. Ширина интервала (ее еще часто называют интервальной разностью) –разность между верхней и нижней границами интервала. Интервалы группировки бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле: R = Хmax – h – шаг интервала Хmin размах вариации; R– Хmax – максимальное значение признака в совокупности Хmin –минимальное значения признака в совокупности; n – число групп
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ Правила определения, шага интервала Ø Если шаг интервала, рассчитанный по формуле, представляет собой величину, имеющую один знак до запятой (например: 0, 86; 1, 372; 5, 8), то в этом случае полученные значения целесообразно округлить до десятых долей. Ø Когда шаг интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа. Ø Когда шаг интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50.
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ ПРИМЕР построения группировки с равными интервалами Условия задачи: Интервал Группа 1 -й вариант закрытый 2 -й вариант открытый I 290 - 540 До 540 II 541 -790 III 791 -1040 IV 1041 - 1290 V 1291 - 1540 VI 1541 -1790 VII 1791 -2040 1791 и более N=80 (число единиц совокупности) Хmin =290 (минимальное значение признака в совокупности) Хmax =2040 (максимальное значение признака в совокупности) Открытый интервал – интервал, у которого указана только одна граница: верхняя – у первого, нижняя – у последнего Закрытый интервал – интервал, у которого обозначены обе границы
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ Неравные интервалы применяются, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для толщин пластов, дебитов скважин и т. д. Неравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии, специализированные и произвольные. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом: в геометрической прогрессии: Ø a-константа – число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах; Ø q-константа –положительное число, которое при прогрессивно
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ ПРИМЕР построения группировки с неравными интервалами изменяющихся в арифметической прогрессии Группа Интервал (млн. т) I 500 -800 II 800 -1 300 III 1 300 -2 000 IV 2 000 -2 900 V 2 900 -4 000 Специализированные интервалы группировок – интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку явлений (параметров), находящихся в различных условиях. Произвольные интервалы группировок – применяются при изучении на макроуровне.
Распределение начальных суммарных ресурсов нефти по нефтегазоносным провинциям 7, 7% БАЛТ. НГП 0, 1% 6, 6% 14% 0, 5% 1, 6% 53, 5% 13% 3%
ПРИНЦИПЫ ПОСТРОЕНИЯ СТАТИСТИЧЕСКИХ ГРУППИРОВОК И КЛАССИФИКАЦИЙ От группировок следует отличать классификацию. Классификация – систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Отличительные черты классификации: Ø в основе классификации лежит качественный признак; Ø классификации стандартны: они устанавливаются органами государственной и международной статистики. Если в каждом конкретном исследовании строится своя группировка, то классификация едина для любого исследования независимо от того, проводят его органы государственной статистики или другие учреждения и ведомства (например: форма 6 ГР министерства МПР РФ, Классификация запасов и т. п. ); Ø классификации устойчивы. Они остаются неизменными в течение длительного времени. Однако если появляются новые группы единиц, их классы, разряды, то в классификации вносятся соответствующие изменения и дополнения. Цель классификации - однозначно идентифицировать единицы совокупности, обеспечить эффективный поиск информации и ее систематизацию, достичь сопоставимости с международными
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Ряд распределения – ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, разновидности которого расположены в определенной последовательности. По своей конструкции ряд распределения состоит из двух элементов: Ø вариантов (групп по выделенному признаку) Ø частот (численности групп). Частоты, выраженные в виде относительных величин (доли единиц, процентов), называются частостями. Сумма всех частот называется объемом распределения, или его численностью. Сумма частостей равна 1, если они выражены в долях единицы, и Вариант Частота 100%, если они выражены в хi fi процентах. Он оформляется в виде х1 f 1 х2 f 2 статистической таблицы. х3 f 3 … … хi fi Итого
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Ряды распределения могут быть образованы: Øпо качественному (атрибутивному) признаку; Ø по количественному (прерывному или непрерывному) признаку. В первом случае они называются атрибутивными, во втором - вариационными. ПРИМЕР атрибутивного ряда Распределение добычи нефти по формам собственности № Группы предприятий млн. т % к итогу 2009 2010 Негосударственные, 340 350 86, 1 81, 4 из них малые 40 50 10, 1 11, 6 Государственные 55 80 13, 9 18, 6 Всего добыча 395 430 100 1 2
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Вариационные ряды распределения по способу построения бывают дискретные и интервальные. Дискретный вариационный ряд распределения. В этом ряду группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения. ПРИМЕРОМ данного ряда является распределение законченных разведочным бурением скважин по месторождениям в крае N. Распределение законченных разведочным бурением скважин по месторождениям в крае N Число месторождений шт, f % к итогу w Накопленные частоты F 0 6 5, 9 6 2 1 28 27, 5 34 3 2 22 21, 6 56 4 3 20 19, 6 76 5 4 13 12, 7 89 6 5 8 7, 8 96 7 6 5 4, 9 102 100 - № Количество скважин 1 Итого
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Интервальный вариационный ряд распределения В этом ряду в группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения. Данный ряд распределения целесообразно строить прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. Интервальный вариационный ряд распределения с равными интервалами В этом случае частоты позволяют судить о степени заполнения интервала единицами совокупности. Интервальный вариационный ряд распределения с неравными интервалами В этом случае частоты в отдельных интервалах непосредственно несопоставимы, так как зависят от ширины интервала. Для того чтобы частоты можно было бы сравнивать, исчисляют плотность распределения. Можно рассчитать как абсолютную, так и относительную плотность распределения
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Примеры построения интервального вариационного ряда распределения с равными интервалами интервального вариационного ряда распределения с неравными интервалами Распределение отобранных проб нефтей по скважинам N-го месторождения Распределение пропластков по проницаемости, полученным по результатам ГИС в скважинах Накопленное число выборки S 1 5 5 Ширина интервала Кпрi Число пропластков, fi А 1 2 3 1 до 3 2 150 75 3 – 10 7 254 36, 3 3 10 – 30 20 316 15, 8 2 3 – 5 Группы проницаемости, м. Д 2 1 Число скважин f А № Кол-во отобранных проб нефти x № Плотность распределения 2 5 – 7 8 13 3 7 – 9 10 23 4 30 – 60 30 256 8, 5 4 9 – 11 6 29 5 60 – 150 90 144 1, 6 5 11 - 13 3 32 6 150 – 300 150 90 0, 6 Итого 32 – 7 300 – 600 300 112 0, 37 ИТОГО – 1322 –
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Плотность распределения Абсолютная плотность распределения это частота, приходящаяся на единицу длины интервала Относительная плотность распределения это частость, приходящаяся на единицу длины интервала Плотность распределения используется в рядах распределения с неравными интервалами: Ø для расчета моды (*САМОСТОЯТЕЛЬНО рассмотреть к семинару расчёт моды) Ø для графического изображения
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Кумулятивный ряд Для различных целей бываёт уместным осуществлять еще одно преобразование ряда распределения, заключающееся в построении ряда накопленных частот (кумулятивного ряда). Этот ряд показывает число случаев ниже или выше определенного уровня. Отсюда и возникают два варианта в построении ряда накопленных частот: Ø один показывает число случаев, менее определенного значения варьирующего признака, Ø а другой - число случаев, превышающее определенное значение варьирующего признака.
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Графическое изображение рядов распределения Для изображения вариационных рядов применяются линейные и плоскостные диаграммы, построенные в прямоугольной системе координат: полигон, гистограмма, огива, кумулята и кривая Лоренца. Полигон используется для изображения дискретных вариационных рядов. Распределение законченных разведочным бурением ПРИМЕР скважин по месторождениям в крае N
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Графическое изображение рядов распределения Гистограмма (гр. histos – ткань, строение) применяется для изображения интервального вариационного ряда, который представляют столбики с основаниями, равными ширине интервалов, и высотой, соответствующей частоте. По сути гистограмма является одной из разновидностей столбиковых диаграмм. ПРИМЕР Гистограмма может быть преобразована в полигон распределения Гистограмма распределения отобранных проб нефтей по скважинам N-го месторождения
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Графическое изображение рядов распределения Для графического изображения вариационных рядов может также использоваться кумулятивная кривая. При помощи кумуляты изображается ряд накопленных частот. Кумулята распределения отобранных проб нефтей по скважинам N-го месторождения ПРИМЕР
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Графическое изображение рядов распределения Если в прямоугольной системе координат построим точки, ординаты которых - варианты, а абсциссы - накопленные частоты (или частости), а затем соединим их отрезки прямой, то получим ломаную линию, которая Огива распределения отобранных проб нефтей по называется огивой. ПРИМЕР скважинам N-го месторождения
РЯДЫ РАСПРЕДЕЛЕНИЯ И ГРУППИРОВКИ Графическое изображение рядов распределения Разновидностью кумулятивной кривой является график-кривая Лоренца. График используется для характеристики процессов концентрации, дифференциации, специализации и т. д. В геологии практически не используется.
САМОСТОЯТЕЛЬНО к семинару 25. 02. 13 г. : 1. Привести примеры определения медианы и моды в интервальном ряду распределения. 2. Решить задания № 1, 2, 3, 4.
ЗАДАНИЕ 1 ИСХОДНЫЕ ДАННЫЕ Проницаемость, 10 -3 мкм 2 (x) До 5 5 -10 10 -15 15 -20 20 и более Итого Удельный вес определений проницаемости, % к итогу, (d) 4, 7 10, 6 25, 5 21, 0 38, 2 100 ОПРЕДЕЛИТЬ и СДЕЛАТЬ ВЫВОД ПО ПОЛУЧЕННЫМ ДАННЫМ Среднее значение проницаемости
ЗАДАНИЕ 2 ИСХОДНЫЕ ДАННЫЕ Распределение начальной пластовой температуры по месторождениям в регионе N. Начальная пластовая Количество месторождений, температура, % к итогу, 0 С (d) (x) 33 4 34 12 35 18 36 26 37 20 38 13 39 6 40 1 Итого 100 ОПРЕДЕЛИТЬ и СДЕЛАТЬ ВЫВОД ПО ПОЛУЧЕННЫМ ДАННЫМ 1. Рассчитать моду. 2. Определить медиану.
ЗАДАНИЕ 3 ИСХОДНЫЕ ДАННЫЕ Распределение остаточной нефтенасыщенности по образцам. Остаточная нефтенасыщенность, % (x) До 14 14 -16 16 -18 18 -20 20 и более Итого Число образцов (f) 20 30 25 15 10 100 ОПРЕДЕЛИТЬ и СДЕЛАТЬ ВЫВОД ПО ПОЛУЧЕННЫМ ДАННЫМ 1. Рассчитать моду. 2. Определить медиану. 3. Сделать вывод о соотношении Мо и Ме. 4. Определить первый и третий квартили. 5. Определить первый и девятый децили. 6. Определить квартильный коэффициент вариации и коэффициент децильной вариации.
ЗАДАНИЕ 4 ИСХОДНЫЕ ДАННЫЕ Распределение пористости по образцам. Пористость x, % 17 18 19 20 21 22 23 Итого Количество образцов fi 10 70 80 100 120 160 90 630 ОПРЕДЕЛИТЬ и СДЕЛАТЬ ВЫВОД ПО ПОЛУЧЕННЫМ ДАННЫМ 1. Размах и среднее линейное отклонение. 2. Дисперсию и среднее квадратическое отклонение. 3. Коэффициент осцилляции, линейный коэффициент вариации, коэффициент вариации.


