
Part1-2011.ppt
- Количество слайдов: 23
Xемометрика – это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются математические методы изучения химических явлений. (Cайт Российского хемометрического общества) Xемометрика – это химическая дисциплина, которая использует математические, статистические и другие методы, включая формальную логику, во-первых, для конструирования и выбора оптимальных измерительных процедур и экспериментов, во-вторых, для извлечения наиболее важной и достоверной химической информации при анализе химических данных. (Массарт с соавторами ) Три основных этапа измерительной процедуры: 1. Разработка метода (выбор метода и оптимизация) 2. Проведение измерения (подготовка образца и сбор данных) 3. Интерпретация данных (первичная обработка данных, перевод «сырых» данных в химическую информацию и переход от химической информации к потребительской). Хемометрика касается 1 и 3 этапа.
D. L. Massart, B. G. M. Vandeginste, S. N. Deming, Y. Michotte, L. Kaufman. Chemometrics: a textbook. – Elsevier, 1988. – 488 p. Шараф М. А. , Иллмэн Д. Л. , Ковальски Б. Р. Хемометрика. Пер. с англ. – Л. : Химия, 1989. Дж. Бендат, А. Пирсол. Прикладной анализ случайных данных. Дж. -О. Ким, Ч. У. Мьюллер, У. Р. Клекка и др. Факторный, дискриминантный и кластерный анализ: Пер. с англ. – М. : Финансы и статистика, 1989. 2003
INTRODUCTION TO CHEMOMETRICS M ath Richard G Brereton em a tic Centre for Chemometrics s University of Bristol United Kingdom r. g. brereton@bris. ac. uk St ati sti cs nic y ga istr Or em Ch Phone +44 -117 -9287658 y og iol B Analytical Computing CHEMOMETRICS Chemistry Applications Industrial among others Th ine ng E er ing an eor et d Ch Phy ical em sica ist l ry p Ph ar ma ce ut ica ls
Исходные «сырые» данные X = {xij}, где i – номер объекта, j – номер признака. Признак 1 Признак 2 ……… …. Признак m Объект 1 x 12 … x 1 m Объект 2 x 21 x 22 … x 2 m ………. … … Объект n xn 1 xn 2 … xnm i = 1, …, n; j = 1, …, m.
По допустимым преобразованиям принято выделять пять типов шкал: Допустимые преобразования • номинальная или классификационная • порядковая или ранговая • шкала интервалов • шкала отношений • абсолютная шкала любое взаимооднозначное соответствие
Погрешности измерений и причины возникновения погрешностей Погрешность (ошибка) – это разность показываемого значения и истинного (т. е. измеренного идеальным прибором в идеальном эксперименте)
Случайные величины, параметры случайных величин Случайные процессы x(t 1) и Rxx(t 1, t 1+ ) зависят x(t 1) и Rxx(t 1, t 1+ ) не зависят от момента времени Стационарные Нестационарные x(k) и Rxx( , k), вычисленные по различным реализациям, совпадают Неэргодические Эргодические
Ансамбль реализаций случайного процесса По ансамблю: Среднее (мат. ожидание) Ковариация По времени:
Двумерные случайные величины Нормировка Если обе переменные x и y статистически независимы p(x, y) = p(x)p(y) Ковариация Корреляция
Моменты случайных величин
Практический анализ экспериментальных данных • Таблица исходных (матричное представление) • Визуализация (графическое представление) Частотное представление
Гистограмма
Диаграмма Музера – Пирсона для соединений типа АВ
Диаграмма Рамачадрана
Определение основных статистик по выборке, оценивание параметров случайных величин Если какая-нибудь мера вычислена для всей генеральной совокупности, то она называется параметром. Мера, вычисленная по выборке, является оценкой параметра. Любая функция называется статистикой от всех значений в выборке Центр рассеяния случайное величины или оценка математического ожидания характеризуется мерами центральной тенденции. Среднее арифметическое Мода – значение, которое встречается наиболее часто Медиана – значение, которое делит группу наблюдений пополам, половина всех измерений лежит выше медианы, половина – ниже
Свойства оценок Несмещенность. Если среднее выборочного распределения оценки равно величине оцениваемого параметра, то оценка называется несмещенной. Состоятельность. Состоятельная оценка, даже если она смещенная, при постоянном увеличении объема выборки приближается к значению параметра, который она оценивает. Относительная эффективность оценок. Характеризует, как сильно изменяется оценка от выборки к выборке. Чем меньше дисперсия ошибки оценки, тем эффективнее оценка.
Параметры и оценки параметров
Ошибка измерения случайная ошибка систематическая ошибка Случайная ошибка не может быть предсказана заранее, не известны ни ее абсолютная величина, ни ее знак. Однако можно высказать суждение о ее статистических свойствах. Систематические ошибки нельзя исключить повторением измерения, они отличаются своей воспроизводимостью. Их абсолютная величина и знак остаются неизменными при заданных условиях.
Pаспространение погрешностей исходных данных на конечный результат Пусть y = f(x 1, x 2, …, xn) – функция, вычисленная по измеренным в эксперименте величинам xi Для систематической погрешности: Для пределов погрешностей:
Pаспространение погрешностей исходных данных на конечный результат Для случайной погрешности: Если отдельные влияющие величины взаимно независимы и << xi Если вместо стандартных отклонений представлены их оценки, то