Обработка результатов химического анализа 2012.ppt
- Количество слайдов: 28
Обработка результатов химического анализа Как обеспечить точность анализа?
chem. msu. rus/teaching/analyt/garmasch. pdf
Основные понятия математической статистики МАТЕМАТИЧЕСКАЯ СТАТИСТИКА — наука о методах обработки экспериментальных данных, полученных при изучении закономерностей в массовых измерениях, выполненных при одинаковых условиях. СЛУЧАЙНАЯ ВЕЛИЧИНА (Х) — физическая величина, значение которой при измерении изменяется от случая к случаю с той или иной вероятностью. ВЕРОЯТНОСТЬ — категория, обозначающая количественную степень возможности появления массовых случайных событий при фиксированных условиях наблюдения. Вероятность характеризующая устойчивость их относительных частот событий. ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬ — множество всех мыслимых значений случайной величины X. ВЫБОРКА ОБЪЕМА n — конечная совокупность значений X = (x 1, x 2, x 3…xn) полученных в результате n независимых экспериментов, выполненных при одинаковых условиях. СТАТИСТИЧЕСКИЕ МОДЕЛИ — зависимости между входными и выходными переменными, носящие вероятностный характер, например xi = + ei.
Гистограмма и эмпирическая функция распределения (визуализация данных) • Ранжирование совокупности X = (x 1, x 2, …xn) • Разбиение совокупности на интервалы • Подсчет частот попадания данных в интервалы разбиения • Подсчет накопленных слева от данного интервала относительных частот
Основные задачи математической статистики • Описание выборочных данных • Оценивание (вероятностное) параметров распределения • Проверка статистических гипотез о свойствах генеральной совокупности
Закон больших чисел обоснование метода выборок при обработке результатов анализа • Суммарное поведение достаточно большого числа случайных величин почти утрачивает случайный характер и становится закономерным. • При увеличение числа измерений случайная погрешность сходится, по вероятности, к нулю.
Нормальное распределение r(z) F(z) 2 z
Теоретические распределения НЕПРЕРЫВНЫЕ: • Нормальное • Логарифмически нормальное • Равномерное распределение ДИСКРЕТНЫЕ: • Биномиальное распределение • Распределение Пуассона Знание распределений необходимо для построения статистических выводов из выборочных данных: оценивание, проверка гипотез, отыскание допустимые отклонений, вероятностей ошибок и др.
Логическая модель нормального закона вероятностей l l l Погрешность измерения (анализа) – это сложное событие, складывающееся из большого числа N элементарных событий. Элементарное событие (т. е. элементарная погрешность) – такое событие, которое с равной вероятностью может завышать «+» или занижать «–» результат анализа. Вклады элементарных событий в результат одинаковы по абсолютной величине. Отсюда задачу о законе распределения частот погрешностей анализа можно решить методами комбинаторики, т. е. простым подсчетом числа комбинаций «+» и «–» . Этот подсчет для N приводит к нормальному закону.
Вероятности суммарных вкладов 10 элементарных факторов в погрешность измерений физической величины при 10 параллельных опытах (р = ½) б м но и ал и но ь ра е пр с де е л и ен е
Вычисления при разработке (аттестации) аналитической методики 1. 2. 3. 4. 5. Проверка выполнения нормального закона распределения в исходных данных. Проверка годности первичных данных для вычисления коэффициента вариации. Вычисление коэффициента вариации по выборке n 20. Исследование функции правильности: x = f(xист) ≈ a + bxист Вычисление коэффициента вариации по ранее накопленным данным.
Вычисления при выполнении анализа 1. 2. 3. 4. Проверка годности результатов параллельных определений (обычно при n = 2): d < dкр. Анализ резервной пробы в случае промаха. Оценка среднего медианой. Отыскание и устранения причин промахов при анализе контрольного образца. Вычисление среднего и погрешности среднего (доверительного интервала) по годным данным:
Описательные статистики в Excel Среднее (простое) Стандартная ошибка Медиана Мода Me - значение признака, приходящееся на середину ранжированного интервала Мо - значение признака с максимальной частотой Стандартное отклонение Дисперсия выборки D(x) = s 2 Эксцесс Асимметричность Интервал (размах) R= xmax- xmin Счет n Уровень надежности (95%)
Оценивание действительного содержания на основе принципа наименьших квадратов Принцип наименьших квадратов: «Лучшей оценкой действительного содержания x. A по выборке является значение содержания a, минимизирующее сумму квадратов отклонений» : Отсюда следует, что
Точечное оценивание математического ожидания и дисперсии результатов анализа n-1= f – число степеней свободы
Интервальное оценивание действительного содержания Если известно s, тогда l l l Интервальное оценивание – это указание интервала значений, в котором находится действительное содержание с заданной вероятностью (надежностью). Чем уже доверительный интервал при Если известно s, тогда заданной доверительной вероятности, тем точнее оценка. Чем уже доверительный интервал при заданной допустимой погрешности, тем выше доверительная вероятность (надёжность) x. A результата анализа.
Правила округления результатов анализа 1. В значении погрешности удерживается не более двух значащих цифр. Причем если первая значащая цифра погрешности 3, то оставляют две цифры, если первая значащая цифра погрешности 3, то оставляют одну цифру. Примеры: х = (34. 28 ± 0, 07)%; х = (10, 9 ± 2, 2)%; х = (786 ± 14) мг/л. 2. Если численное значение результата х 1%, тогда погрешность анализа можно выразить одной значащей цифрой: х = 0, 3423 ± 0, 0238 = (0, 34 ± 0, 02)% Погрешность - случайная величина и устанавливается с доверительной вероятностью 95%.
Проверка статистических гипотез Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке l Процедуру сопоставления высказанной гипотезы с выборочными данными называют проверкой статистической гипотезы l H 0: нуль-гипотеза; H 1: альтернатива l
Распределения Стьюдента t
Распределение Фишера f=5 f=3
Основные виды гипотез в аналитической практике l l Гипотеза о нормальном законе вероятностей ( 2 - критерий) Гипотеза об отсутствии систематической погрешности, т. е. m(x) = x. A (z- или t-критерий) О равенстве двух средних, т. е. m(x 1) = m(x 2) (t-критерий) О равной точности измерения двух случайных величин, т. е. 1 = 2 (F-критерий)
Как задают доверительную вероятность? (ошибки первого и второго рода) - вероятность отвергнуть гипотезу Н 0 когда она верна (риск производителя) - вероятность принять Н 0, когда она не верна (риск потребителя)
Проверка годности первичных данных по Диксону l l Упорядочить выборку по возрастанию Найти разность двух крайних значений |a| Вычислить размах d Вычислить Q-статистику и сравнить с ее табличным Q d хх хх хх х a
Регрессионный анализ Основные этапы 1. 2. 3. Задание аналитической формы уравнения регрессии Определение в регрессии степени взаимосвязи результативного признака (y) и факторов (xi) при проверке общего качества уравнения регрессии. Проверка статистической значимости каждого коэффициента регрессии. Шаг 1
Теория МНК Шаг 2 Шаг 3
Систематическая погрешность По определению = m(x) - x. A. l Пусть m(x) = f(x. A) = a + bx. A. l Тогда = a + (b-1)x. A. l При b=1, = a = const. l При a=0, /x. A = b-1 = const. l a 0; b 1 b=1 a=0 x. A
Способы устранения систематических погрешностей Релятивизация измерений: одинаковость процедур градуировки и анализа, анализ «холостой» пробы l Рандомизация измерений: перевод систематических погрешностей в случайные (междулабораторные анализы). l Аттестация методик анализа. l Систематические погрешности можно устранять, поэтому говоря об ошибках методики анализа подразумевают только случайные ошибки.
Способы обнаружения систематических погрешностей Сравнение результата анализа ОС с его номинальным содержанием. : Находят a, b-1, и x. A, решая систему: Решение системы l l Сравнение результата анализа данным методом с результатами анализа образцовым методом. l Метод добавки и варьирования размера пробы.
Обработка результатов химического анализа 2012.ppt