Статистические характеристики Генеральная выборка: если
Статистические характеристики Генеральная выборка: если набор данных содержит информацию о каждом элементе группы или обо всех возможных измерениях. Выборка: если измерения производились на некотором подмножестве генеральной совокупности. Используется случайная выборка.
Средние величины Средняя арифметическая величина(=СРЗНАЧ) Средняя арифметическая взвешенная величина(=СУММПРОИЗВ()/ СУММ())
Медиана, Мода • Медиана(Ме)-значение признака, приходящееся на середину ранжированной совокупности(=Медиана()) • Медиана(200; 250; 350)=250 • Медиана(200; 250; 300; 350)=275 • Мода(Мо)-чаще всего встречающаяся варианта(с наибольшей частотой)(=Мода())
Статистические характеристики генеральной совокупности • Математическое ожидание (ср. арифм. по совокупности) Сов. • Дисперсия (ДИСПР()) • Стандартное отклонение (СТАНДОТКЛОНП())
Статистические характеристики выборки • Выборочное среднее арифметическое(СРЗНАЧ()) • Размах данных • Выборочная дисперсия(ДИСП()) • Выборочное среднее квадратичное
• Дисперсия – рассеяние значений признака около математического ожидания (средней). • стандартное отклонение – корень из дисперсии
Ошибки, отклонения • Отклонение (для выборки) • xi=xi-xсреднее • Ошибка (для ген. совокупности) • xi=xi-µ • Полигон частот (плотность распределения)- гистограмма частот
Доверительный уровень, уровень достоверности • Доверительный уровень – приемлемый уровень неопределенности, т. е. доля допущенных ошибок. Применяют 95%, т. е. ошибка будет составлять 5%. • Уровень достоверности, соответствующий доверительному уровню 95%, равен • = 1 -0, 95 = 0, 05
Доверительный интервал Интервал возможных значений средних (математического ожидания) – доверительный интервал: • Вычислить выборочное среднее и ст. отклонение; • Определить число значений в выборке; • Выбрать доверительный уровень ( уровень достоверности); • Вычислить t= (СТЬЮДРАСПОБР( , КСС)), где КСС=Nвыборки - 1
Представления об уровне точности и надежности данных дают доверительные интервалы • . Доверительный интервал для среднего где - достоверность того, что при многократном повторении наблюдений доверительный интервал не накроет истинного значения характеристики, обычно эта достоверность изменяется в границах от 0, 10 до 0, 01. к – число степеней свободы, к = n – 1, t , k – статистика Стьюдента (табличная величина).
Доверительный интервал для дисперсии • где p 1 и p 2 – доверительная достоверность, p 1 = /2, p 2 = 1 - /2. • 2 - статистика Пирсона (табличная величина).
Статистическая проверка гипотез • заключается в построении критической области критерия для выбранного уровня значимости. Если статистика, подсчитанная на основании выборки , попадает в критическую область , нулевая гипотеза отбрасывается , что означает несоответствие гипотезы , которая проверяется, опытным данным.
Выбор существенных технологических факторов при анализе систем • Существует ряд методов выявления причинно следственных связей между факторами процесса и поведением системы. Эти методы разделяются на две большие группы: • 1. Методы предварительного выявления существенных факторов. К ним относятся методы корреляционного и дисперсионного анализов. • 2. Методы, в которых выявление существенных факторов связано с построением модели. Значимость или не значимость фактора определяется с помощью значения коэффициента полинома аi при исследуемом факторе.
Корреляционный анализ • Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значения другой величины, а также меру зависимости между данными величинами. • Его задачей является определение меры взаимного влияния факторов друг на друга. • Используется линейный коэффициент корреляции и корреляционное отношение. • Линейный коэффициент корреляции характеризует степень тесноты не всякой, а только линейной зависимости. • При нелинейной зависимости применяют корреляционное отношение.
Корреляционный анализ • Первая задача корреляции заключается в выявлении на основе наблюдения над большим количеством данных того, как изменяется в среднем результативный признак в связи с изменением данного фактора. • Вторая задача в определении степени влияния искажающих факторов. Первая задача решается нахождением уравнения связи, а вторая при помощи различных показателей тесноты связи.
Корреляционный анализ проводится в следующей последовательности: • Эксперимент; • запись данных в виде таблицы; • построение диаграммы рассеивания; • оценка корреляции «на глаз» по их виду; • расчет коэффициента корреляции; • проверка значимости коэффициента корреляции.
Диаграммы рассеяния • а – позитивная корреляция (прямая связь) 0
Расчет коэффициента корреляции • Расчет выборочного коэффициента корреляции • где Sx 2, Sy 2 - оценки дисперсий
Шкала Чеддока • Численное значение коэффициента корреляции находится в интервале от – 1 до +1. Предельные значения коэффициента корреляции (-1 или +1) свидетельствуют о функциональной связи между величинами, r=0 означает отсутствие связи. • Считают, что связь между величинами слаба, если |r| 0, 3; при | r| 0, 4… 0, 6 - средняя; | r| 0, 7 - сильная, при | r| 0, 9 - весьма сильная (шкала Чеддока). • Отрицательные значения коэф. корреляции говорят об обратной зависимости.
Таблица данных • По выборочным данным необходимо установить наличие взаимосвязи между показателями (данные Госкомстата РФ)
Пакет анализа Excel, режим Корреляция
Результаты расчета коэффициентов корреляции • Связь «Уровень образования УО– Отношение числа безработных…ОЧБВ» - слабая обратная – 0, 26, т. е. с повышением УО ОЧБВ уменьшается. • Связь УО-УП заметная, обратная – 0, 66, т. е. с повышением УО УП уменьшается. • Связь ОЧБВ – УП слабая, прямая 0, 24, т. е. С увеличением ОЧБВ увеличивается и УП. • Функция КОРРЕЛ()
Построение гистограммы
Для проверки гипотезы о наличии взаимосвязи между величинами, которые изучаются, вычисляют статистику t • Данную статистику сравнивают с критической величиной t , k, где - уровень значимости, • к = n – 2. Если • то взаимосвязь между величинами, которые изучаются, существует.
Вывод о значимости коэффициента корреляции • Вывод: • 3, 018>2, 179 • Коэффициент корреляции значим, т. е. Влияние уровня образования на уровень преступности не случайно
Значимость коэффициента корреляции
Доверительный интервал
Разброс
Корреляционный анализСтатХарактеристики.ppt
- Количество слайдов: 28

