Скачать презентацию Xемометрика это научная дисциплина находящаяся на стыке Скачать презентацию Xемометрика это научная дисциплина находящаяся на стыке

Part1-2011.ppt

  • Количество слайдов: 23

Xемометрика – это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются Xемометрика – это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются математические методы изучения химических явлений. (Cайт Российского хемометрического общества) Xемометрика – это химическая дисциплина, которая использует математические, статистические и другие методы, включая формальную логику, во-первых, для конструирования и выбора оптимальных измерительных процедур и экспериментов, во-вторых, для извлечения наиболее важной и достоверной химической информации при анализе химических данных. (Массарт с соавторами ) Три основных этапа измерительной процедуры: 1. Разработка метода (выбор метода и оптимизация) 2. Проведение измерения (подготовка образца и сбор данных) 3. Интерпретация данных (первичная обработка данных, перевод «сырых» данных в химическую информацию и переход от химической информации к потребительской). Хемометрика касается 1 и 3 этапа.

D. L. Massart, B. G. M. Vandeginste, S. N. Deming, Y. Michotte, L. Kaufman. D. L. Massart, B. G. M. Vandeginste, S. N. Deming, Y. Michotte, L. Kaufman. Chemometrics: a textbook. – Elsevier, 1988. – 488 p. Шараф М. А. , Иллмэн Д. Л. , Ковальски Б. Р. Хемометрика. Пер. с англ. – Л. : Химия, 1989. Дж. Бендат, А. Пирсол. Прикладной анализ случайных данных. Дж. -О. Ким, Ч. У. Мьюллер, У. Р. Клекка и др. Факторный, дискриминантный и кластерный анализ: Пер. с англ. – М. : Финансы и статистика, 1989. 2003

INTRODUCTION TO CHEMOMETRICS M ath Richard G Brereton em a tic Centre for Chemometrics INTRODUCTION TO CHEMOMETRICS M ath Richard G Brereton em a tic Centre for Chemometrics s University of Bristol United Kingdom r. g. brereton@bris. ac. uk St ati sti cs nic y ga istr Or em Ch Phone +44 -117 -9287658 y og iol B Analytical Computing CHEMOMETRICS Chemistry Applications Industrial among others Th ine ng E er ing an eor et d Ch Phy ical em sica ist l ry p Ph ar ma ce ut ica ls

Исходные «сырые» данные X = {xij}, где i – номер объекта, j – номер Исходные «сырые» данные X = {xij}, где i – номер объекта, j – номер признака. Признак 1 Признак 2 ……… …. Признак m Объект 1 x 12 … x 1 m Объект 2 x 21 x 22 … x 2 m ………. … … Объект n xn 1 xn 2 … xnm i = 1, …, n; j = 1, …, m.

По допустимым преобразованиям принято выделять пять типов шкал: Допустимые преобразования • номинальная или классификационная По допустимым преобразованиям принято выделять пять типов шкал: Допустимые преобразования • номинальная или классификационная • порядковая или ранговая • шкала интервалов • шкала отношений • абсолютная шкала любое взаимооднозначное соответствие

Погрешности измерений и причины возникновения погрешностей Погрешность (ошибка) – это разность показываемого значения и Погрешности измерений и причины возникновения погрешностей Погрешность (ошибка) – это разность показываемого значения и истинного (т. е. измеренного идеальным прибором в идеальном эксперименте)

Случайные величины, параметры случайных величин Случайные процессы x(t 1) и Rxx(t 1, t 1+ Случайные величины, параметры случайных величин Случайные процессы x(t 1) и Rxx(t 1, t 1+ ) зависят x(t 1) и Rxx(t 1, t 1+ ) не зависят от момента времени Стационарные Нестационарные x(k) и Rxx( , k), вычисленные по различным реализациям, совпадают Неэргодические Эргодические

Ансамбль реализаций случайного процесса По ансамблю: Среднее (мат. ожидание) Ковариация По времени: Ансамбль реализаций случайного процесса По ансамблю: Среднее (мат. ожидание) Ковариация По времени:

Двумерные случайные величины Нормировка Если обе переменные x и y статистически независимы p(x, y) Двумерные случайные величины Нормировка Если обе переменные x и y статистически независимы p(x, y) = p(x)p(y) Ковариация Корреляция

Моменты случайных величин Моменты случайных величин

Практический анализ экспериментальных данных • Таблица исходных (матричное представление) • Визуализация (графическое представление) Частотное Практический анализ экспериментальных данных • Таблица исходных (матричное представление) • Визуализация (графическое представление) Частотное представление

Гистограмма Гистограмма

Диаграмма Музера – Пирсона для соединений типа АВ Диаграмма Музера – Пирсона для соединений типа АВ

Диаграмма Рамачадрана Диаграмма Рамачадрана

Определение основных статистик по выборке, оценивание параметров случайных величин Если какая-нибудь мера вычислена для Определение основных статистик по выборке, оценивание параметров случайных величин Если какая-нибудь мера вычислена для всей генеральной совокупности, то она называется параметром. Мера, вычисленная по выборке, является оценкой параметра. Любая функция называется статистикой от всех значений в выборке Центр рассеяния случайное величины или оценка математического ожидания характеризуется мерами центральной тенденции. Среднее арифметическое Мода – значение, которое встречается наиболее часто Медиана – значение, которое делит группу наблюдений пополам, половина всех измерений лежит выше медианы, половина – ниже

Свойства оценок Несмещенность. Если среднее выборочного распределения оценки равно величине оцениваемого параметра, то оценка Свойства оценок Несмещенность. Если среднее выборочного распределения оценки равно величине оцениваемого параметра, то оценка называется несмещенной. Состоятельность. Состоятельная оценка, даже если она смещенная, при постоянном увеличении объема выборки приближается к значению параметра, который она оценивает. Относительная эффективность оценок. Характеризует, как сильно изменяется оценка от выборки к выборке. Чем меньше дисперсия ошибки оценки, тем эффективнее оценка.

Параметры и оценки параметров Параметры и оценки параметров

Ошибка измерения случайная ошибка систематическая ошибка Случайная ошибка не может быть предсказана заранее, не Ошибка измерения случайная ошибка систематическая ошибка Случайная ошибка не может быть предсказана заранее, не известны ни ее абсолютная величина, ни ее знак. Однако можно высказать суждение о ее статистических свойствах. Систематические ошибки нельзя исключить повторением измерения, они отличаются своей воспроизводимостью. Их абсолютная величина и знак остаются неизменными при заданных условиях.

Pаспространение погрешностей исходных данных на конечный результат Пусть y = f(x 1, x 2, Pаспространение погрешностей исходных данных на конечный результат Пусть y = f(x 1, x 2, …, xn) – функция, вычисленная по измеренным в эксперименте величинам xi Для систематической погрешности: Для пределов погрешностей:

Pаспространение погрешностей исходных данных на конечный результат Для случайной погрешности: Если отдельные влияющие величины Pаспространение погрешностей исходных данных на конечный результат Для случайной погрешности: Если отдельные влияющие величины взаимно независимы и << xi Если вместо стандартных отклонений представлены их оценки, то