14_2_Validation_statistics_ru_2.ppt
- Количество слайдов: 85
Statistica di base Poznan 2006 LA VALIDAZIONE DEI METODI DI ANALISI CHIMICA Prof. Saverio Mannino
Statistica di base METODI DI PROVA E DI TARATURA E VALIDAZIONE DEI METODI p. to 5. 4. 5 Poznan 2006 LA VALIDAZIONE E’ LA CONFERMA ATTRAVERSO ESAME E L’APPORTO DI EVIDENZA OGGETTIVA CHE I REQUISITI PARTICOLARI PER L’UTILIZZAZIONE PREVISTA DEL METODO SIANO SODDISFATTI Il laboratorio deve validare : • i metodi non normalizzati • i metodi sviluppati/progettati dal laboratorio • i metodi normalizzati utilizzati al di fuori del proprio scopo e campo di applicazione • i metodi risultanti da estensioni e modifiche apportate metodi normalizzati per confermare che i metodi siano adatti all’utilizzazione prevista. La validazione deve essere estesa in modo da soddisfare le esigenze di una data applicazione o di un campo di applicazione. Il laboratorio deve registrate i risultati ottenuti, le procedure utilizzate per la validazione, cosi pure una dichiarazione circa l’idoneità del metodo utilizzato. Prof. Saverio Mannino
Statistica di base METODI DI PROVA E DI TARATURA E VALIDAZIONE DEI METODI p. to 5. 4. 5 Poznan 2006 La validazione può comprendere procedure di campionamento, la manipolazione e il trasporto. Le tecniche utilizzate per la determinazione della prestazione di un metodo dovrebbero essere una, o una combinazione delle seguenti : 1) taratura, utilizzando campioni o materiali di riferimento 2) confronto dei risultati ottenuti con altri metodi 3) confronti interlaboratorio 4) valutazione sistematica dei fattori che influenzano il risultato 5) stima dell’incertezza dei risultati sulla base di una conoscenza scientifica dei principi teorici del metodo e di un’esperienza pratica. Quando sono effettuati dei cambiamenti nei metodi non normalizzati validati, l’influenza di tali cambiamenti dovrebbe essere documentata, e se necessario, dovrebbe essere eseguita una nuova validazione. Prof. Saverio Mannino
Statistica di base METODI DI PROVA E DI TARATURA E VALIDAZIONE DEI METODI STIMA DELL’INCERTEZZA DI MISURA p. to 5. 4. 6 Poznan 2006 Un laboratorio di taratura o un laboratorio di prova che esegue le proprie tarature, deve avere e deve applicare una procedura per stimare l’incertezza di misura per tutte le tarature e tipi di taratura. I laboratori di prova devono avere e devono applicare procedure per stimare l’incertezza delle misure. In certi casi la natura dei metodi di prova può escludere il calcolo dell’incertezza di misura rigoroso e valido dal punto di vista metrologico e statistico. In questi casi il laboratorio deve almeno tentare di identificare tutte le componenti dell’incertezza e fare una stima ragionevole, e deve garantire che l’espressione del risultato non fornisca un’impressione errata dell’incertezza. Una stima ragionevole deve essere basata sulla conoscenza del metodo e sullo scopo della misura e deve fare uso, per esempio, delle esperienze precedenti e della validazione dei dati. Prof. Saverio Mannino
Statistica di base METODI DI PROVA E DI TARATURA E VALIDAZIONE DEI METODI STIMA DELL’INCERTEZZA DI MISURA p. to 5. 4. 6 Poznan 2006 Il livello di rigore necessario in una stima dell’incertezza di misura dipende da fattori come : - i requisiti del metodo di prova - i requisiti del cliente - l’esistenza di limiti stretti su cui sono basate le decisioni della conformità ad una specifica o ad una disposizione di legge. Nei casi un cui un , metodo di prova ben conosciuto specifica i limiti delle maggiori sorgenti di incertezza e specifica la forma di presentazione dei risultati calcolati, si ritiene che il laboratorio abbia soddisfatto questo punto , seguendo i metodi di prova e le istruzioni per la presentazione dei risultati. Prof. Saverio Mannino
Statistica di base METODI DI PROVA E DI TARATURA E VALIDAZIONE DEI METODI STIMA DELL’INCERTEZZA DI MISURA p. to 5. 4. 6 Poznan 2006 Quando si stima l’incertezza di misura, devono essere prese in considerazione, utilizzando appropriati metodi di analisi, tutte le componenti dell’incertezza che sono di rilievo in una data situazione. Le fonti che contribuiscono all’incertezza di misura includono, in modo non esaustivo: - i campioni di riferimento e i materiali di riferimento utilizzati, - i metodi e le apparecchiature utilizzate, - le condizioni ambientali, - le condizioni degli oggetti da provare o da tarare, - l’operatore. Il comportamento previsto a lungo termine dell’oggetto sottoposto a prova e/o taratura non è, di regola, preso in considerazione quanto si stima l’incertezza di misura. Per ulteriori informazioni sull’incertezza di misura vedere tra l’altro : - La norma ISO 5725 - parti 1/2/3/4/6 - La norma italiana sperimentale UNI CEI ENV 13005 : 2000 “Guida all’espressione dell’incertezza di misura “ - Documenti dell’organismo di accreditamento ( es. DT -0002 SINAL) “ Guida per la dichiarazione dell’incertezza di misura”. Prof. Saverio Mannino
Statistica di base Poznan 2006 5. 4. 5 Validazione dei metodi 5. 4. 5. 1 La validazione è la conferma attraverso esame e l’apporto di evidenza oggettiva che i requisiti particolari per l’utilizzazione prevista siano soddisfatti. 5. 4. 5. 2 Il laboratorio deve validare i metodi normalizzati, i metodi sviluppati/progettati dal laboratorio, i metodi normalizzati utilizzati al di fuori del proprio scopo e campo di applicazione prefissato, come pure estensioni e modifiche di metodi normalizzati per confermare che i metodi siano adatti all’utilizzazione prevista. La validazione deve essere estesa in modo da soddisfare le esigenze di una data applicazione o di un campo di applicazione. Il laboratorio deve registrare i risultati ottenuti, le procedure utilizzate per la validazione, così pure una dichiarazione circa l’idoneità del metodo per l’utilizzo previsto. Prof. Saverio Mannino
Statistica di base Poznan 2006 NOTA 1: La validazione può comprendere procedure per il campionamento, la manipolazione e il trasporto. NOTA 2: Le tecniche utilizzate per la determinazione della prestazione di un metodo dovrebbero essere una, o una combinazione delle seguenti: § taratura, utilizzando campioni o materiali di riferimento; § confronto dei risultati ottenuti con altri metodi; § confronti interlaboratorio; § valutazione sistematica dei fattori che influenzano il risultato; § stima dell’incertezza dei risultati sulla base della conoscenza § scientifica dei principi teorici del metodo e dell’esperienza pratica. NOTA 3: Quando sono effettuati dei cambiamenti nei metodi non normalizzati validati, l’influenza di tali cambiamenti dovrebbe essere documentata, e se necessario, dovrebbe essere eseguita una nuova validazione. Prof. Saverio Mannino
Statistica di base Poznan 2006 (dalla UNI CEI EN ISO/IEC 17025) 5. 4. 5. 3 Il campo e l'accuratezza dei valori ottenibili da metodi validati (per esempio l'incertezza dei risultati, i limiti di rilevazione, la selettività del metodo, la linearità, la ripetibilità e/o la riproducibilità, la robustezza nei confronti di influenze esterne e/o la sensibilità incrociata nei confronti di interferenze provenienti dalla matrice del campione/oggetto da provare), così come valutati per l'utilizzo previsto, devono corrispondere alle esigenze del cliente. Nota 1: La validazione comprende la specifica dei requisiti, la determinazione delle caratteristiche dei metodi, un controllo che i requisiti possano essere soddisfatti utilizzando il metodo e una dichiarazione relativa alla validità. Nota 2: In funzione dello sviluppo del metodo, dovrebbero essere eseguiti riesami regolari per verificare che le esigenze del cliente continuino ad essere soddisfatte. Qualsiasi variazione dei requisiti che richieda modifiche al piano di sviluppo dovrebbe essere approvata e autorizzata. Nota 3: La validazione è sempre un bilancio fra i costi, i rischi e le possibilità tecniche. Vi sono molti casi in cui il campo e l'incertezza dei valori (per esempio l‘accuratezza, i limiti di rilevazione, la selettività, la linearità, la ripetibilità e la riproducibilità, la robustezza e/o la sensibilità alle interferenze) possono essere solo forniti in modo semplificato a causa di mancanza di informazioni. Prof. Saverio Mannino
Statistica di base Poznan 2006 Esempi di situazioni sperimentali richiedenti la validazione: ü un nuovo metodo è sviluppato per scopi particolari; ü un metodo analitico stabilito deve essere aggiornato, migliorato o esteso ad un nuovo problema analitico; ü il controllo di qualità evidenzia variazioni temporali dei parametri di qualità; ü un metodo stabilito deve essere usato in un diverso laboratorio, da un diverso analista, con diversa strumentazione; ü è necessario dimostrare l’equivalenza del metodo in esame con un metodo standard. Prof. Saverio Mannino
Statistica di base Poznan 2006 La validazione riguarda l’intera procedura analitica totale ü Definizione generale del problema ü Definizione analitica del problema ü Scelta di metodo, tecnica, procedura, protocollo ü Campionamento VALIDAZIONE ü Trattamento del campione ü Analisi ü Valutazione dei dati ü Conclusioni ü Relazione sui risultati Prof. Saverio Mannino
Statistica di base Poznan 2006 Le procedure di validazione dipendono dal tipo di analisi da eseguire. Parametri di interesse nelle procedure di validazione di metodi di: analisi qualitativa § Accuratezza (esattezza e precisione) § Range dinamico e lineare § Selettività/specificità § Limite di rivelabilità § Limite di quantificazione § Robustezza § Recupero analisi quantitativa - - Prof. Saverio Mannino
Statistica di base Poznan 2006 В последнее десятилетие почти все официальные методы для анализа пищевых продуктов в разделе “Точные науки (Precision)“ начинаются одним из следующих предложений: “Повторяемость (r): Разница между двумя отдельными результатами обнаруживается на идентично анализируемом материале одним специалистом, с использованием одного и того же оборудования за один короткий промежуток времени не превышающий 2, 0% от среднеарифметического результата. “ 13 Prof. Saverio Mannino
Statistica di base Poznan 2006 или “Повторяемость(r): Разница между двумя измерениями, выполняемыми одновременно или в быстрой последовательности одним специалистом, не должна превышать 0, 6 гр. масла на 100 г. образца. “ или “Повторяемость(r): Разница между результатами двух исследований, выполняемых одновременно или в быстрой последовательности одним специалистом на одном аппарате, не должна превышать 6% относительно средне арифметического из результатов как для калия, так и для натрия. “ 14 Prof. Saverio Mannino
Statistica di base Poznan 2006 ЧЕТКОСТЬ (ACCURACY) Четкость аналитического метода описывает близость средних результатов испытаний, полученных методом к истинному значению (концентрации) аналита. • Четкость определяется повтором анализа проб, содержащих известное количество аналита. • Четкость должна быть измерена с помощью минимум 5 исследований концентраций. И к исследованиям рекомендованы минимум 3 концентрации в ожидаемых диапазонах. 15 Prof. Saverio Mannino
Statistica di base Poznan 2006 ТОЧНОСТЬ (PRECISION) Точность аналитического метода характеризуется близостью отдельных методов аналита, когда процедура применяется не однократно на несколько aliquots одного однородного объема биологической матрицы. Точность должна быть измерена с помощью минимум 5 определений в концентрации. Рекомендуется исследование минимум 3 концентраций в ожидаемых диапазонах. 16 Prof. Saverio Mannino
Statistica di base Poznan 2006 ТОЧНОСТЬ Точность далее подразделяется на: • повторяемость или перспектива (into within-run), точность внутри партии, которая оценивается во время одного исследования, и между сериями исследований проведенных одним специалистом в одной лаборатории • воспроизводимость или точность среди партий, которые могут измеряться во времени, и могут быть измерены разными специалистами, оборудованием, реагентами и лабораториями. 17 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A B C D 8 13 9 11 9 9 9 8 11 11 11 12 12 8 7 7 10 14 9 12 18 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A B C D 8 13 9 11 9 9 9 8 11 11 11 12 12 8 7 7 10 14 9 12 M = 10 M= 11 M= 9 M= 10 19 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A B C D 8 11 9 8 11 12 12 7 10 12 M = 10 M= 11 M= 9 M= 10 20 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A 11 8 12 7 12 M = 10 X - M +1 -2 +2 -3 +2 (X – M)2 1 4 4 9 4 M 2= 22 21 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A X - M (X – M)2 11 +1 1 8 -2 4 12 +2 4 7 +3 9 12 +2 4 M = 10 M 2= 22 Разделенные по 5 мы имеем в среднем 4. 5 и квадратный корень будет составлять 2. 3 называется стандартным отклонением (s) 22 Prof. Saverio Mannino
Statistica di base Poznan 2006 Случайные электронные ошибки системы A 8 9 11 12 10 M = 10 s = 1. 6 B 13 9 11 8 14 M= 11 s = 2. 5 C 9 9 11 7 9 M= 9 s = 1. 4 D 11 8 12 7 12 M= 10 s = 2. 3 23 Prof. Saverio Mannino
Statistica di base Poznan 2006 Средние и стандартные отклонения Среднее Расхождение Стандартное отклонение Prof. Saverio Mannino 24
Statistica di base Poznan 2006 Нормальное распределение – Кривая Гаусса = Sigma = = отклонение ( Квадратный корень из дисперсии) 7 6 5 4 3 2 1 0 -1 -2 -3 -4 -5 -6 -7 Axis graduated in Sigma между + / - 1 68. 27 % между + / - 2 95. 45 % 45500 ppm между + / - 3 99. 73 % 2700 ppm между + / - 4 99. 9937 % 63 ppm между + / - 5 99. 999943 % 0. 57 ppm между + / - 6 99. 9999998 % 0. 002 ppm результат: 317300 ppm внешнее (отклонение) 25 Prof. Saverio Mannino
Statistica di base Poznan 2006 Пример расчета точных данных Образец был проанализирован 5 раз и мы хотим вычислить SD (стандартное отклонение) 26 Prof. Saverio Mannino
Statistica di base Poznan 2006 Точность и четкость Соотношение точности и четкости можно проиллюстрировать известным примером стрельбы из винтовки по мишеням, где черные точки ниже представляют просмотр целей. Вы можете видеть, что хорошая прицельность не обязательно даст точное попадание. Однако, если инструмент хорошо прилажен, четкость и воспроизводимость результата является хорошей мерой точности. Prof. Saverio Mannino 27
Statistica di base Poznan 2006 Границы доверительного интервала: Учитывая набор данных измерений (N), из которых известно, среднее и стандартное отклонение, можно вычислить интервал, известный как доверительный интервал, в пределах которого можно найти истинное значение на заданном уровне вероятности. Экстремальные значения называются доверительными интервалами и рассчитываются следующим соотношением: Где t - это t-Student найденная в таблице. Это зависит от уровня свободных АНФ (anf) на выбранном уровне 28 вероятности. Prof. Saverio Mannino
Statistica di base Poznan 2006 Стандартная ошибка среднего значения (SEM): в то время как стандартное отклонение является мерой данных изменчивости, стандартная ошибка средних значений это мера того, на сколько точно известно среднее число популяции ( ). Как видно это зависит от числа мер. 29 Prof. Saverio Mannino
Statistica di base Poznan 2006 Доверительный интервал Пример: Расчет доверительного интервала (или лимита) в среднем на уровне вероятности 80, 95 e 99% при следующем наборе данных: 47. 64; 47. 69; 47. 52; 47. 55 M= 47. 60 s= 0. 08 = n-1= 4 -1= 3 30 Prof. Saverio Mannino
Statistica di base Poznan 2006 Пример: Расчет доверительного интервала в среднем на уровне вероятности 95 E 99% при следующем наборе данных: Среднее = m = 3. 203 and SD = 0. 077 Как вы можете заметить, с большей степенью вероятности являются доверительные интервалы. 31 Prof. Saverio Mannino
Statistica di base Poznan 2006 РАСЧЕТ СТАНДАРТНОГО ОТКЛОНЕНИЯ (SD) d = дубликаты K = количество дубликатов Пример 1 ый: SD рассчитывается из серии дубликатов анализов из одного образца Пример 2 ой: SD рассчитывается из серии дубликатов анализов из разных, но похожих образцов 32 Prof. Saverio Mannino
Statistica di base Poznan 2006 Пример 1 7 продублированных анализов из одного образца 33 Prof. Saverio Mannino
Statistica di base Poznan 2006 Пример 2 6 подобных образцов, но из разных сортов сыра 34 Prof. Saverio Mannino
Statistica di base Poznan 2006 Факторы стандартного отклонения (SD) от диапазона n d 2 2 1. 128 3 1. 693 4 2. 059 5 2. 326 For n=2 35 Prof. Saverio Mannino
Statistica di base Poznan 2006 или “Повторяемость (r): Разница между двумя измерениями, выполняемыми одновременно или в быстрой последовательности одним специалистом не должна превышать 0. 6 гр. масла на 100 гр. образца. “ или “Повторяемость (r): разница между двумя результатами двух исследований, выполненных одновременно или в быстрой последовательности одним специалистом используя один аппарат, не должна превышать 6% относительно среднего арифметического результата и для натрия и для калия. “ 36 Prof. Saverio Mannino
Statistica di base Poznan 2006 Предел повторяемости: t - это t-Student (2 фракции) для = и в 95% случаев вероятности это t = 1, 96 2. r – повторяемость стандартного отклонения. r – максимальное значение, которое можно спрогнозировать для различий двух результатов, полученных в условиях повторяемости. 37 Prof. Saverio Mannino
Statistica di base Poznan 2006 Предел повторяемости Это исходит из формулы, что позволяет рассчитать стандартное отклонение от двойных измерений Где n= 1 38 Prof. Saverio Mannino
Statistica di base Poznan 2006 Предел повторяемости: То же, что и раньше, но в условиях воспроизводимости 39 Prof. Saverio Mannino
Statistica di base Poznan 2006 40 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Часто, мы должны принять решение о видах популяции, на основе данных полученных из образцов. Пример: Нам нужно знать, какая партия лучше другой или который поставщик лучший. Для достижения результата необходимо предположений о двух видах популяции. начать с Такое предположение называется статистической гипотезой. Процедуры, приводящие к установлению истины или ложности гипотезы статистический тест или тест значимости или испытание гипотезы. 41 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Проверяемые гипотезы, обозначаются H 0, называются Нулевая Гипотеза, потому что это означает, что на самом деле нет реальной разницы между истинным значением параметров популяции и его предположением о ценности образца. Пример: Если мы желаем определить когда один процесс лучше другого, мы создаем гипотезу что нет разницу между двумя процессами. Любая гипотеза, которая отличается от Нулевой Гипотезы обозначается H 1 и называется Альтернативной Гипотезой 42 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ При проверке статистических гипотез нет абсолютной уверенности, что выводы будут правильными. На 5% отметке (уровне), мы можем быть не правы 1 к 20 (или 5 к 100) и на уровне 1% - 1 к 100. α значение 43 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Возможны два вида не верных выводов. Если гипотеза верна и выбранный образец говорит об ошибке, мы говорим, что мы совершили Тип ошибки № 1 или ошибку α Если окажется, что гипотеза проходящая испытание на самом деле ошибочна, и образец это подтверждает, мы говорим, что был совершен Тип ошибки № 2. ( или ошибка β) 44 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Есть 4 варианта результатов испытаний Реальные ситуации H 0 правильная H 0 ошибочная Результаты испытаний H 0 ошибочная Тип ошибки № 2 P= β Тип ошибки № 1 P= α H 0 правильная Правильное решение P = 1 - α Правильное решение P= 1 - β α -риск производителя и β – риск потребителя 45 Prof. Saverio Mannino
Statistica di base Poznan 2006 Тест F F-тест используется для определения, существенно ли различаются две дисперсии. F объем определяется следующим соотношением: F = sa 2 / sb 2 где sa 2 = это дисперсия популяции «А» оценивается с помощью na-1 degree of freedom sb 2 = это дисперсия популяции «B» оценивается с помощью na-1 degree of freedom sa 2 – большая дисперсия 46 Prof. Saverio Mannino
Statistica di base Poznan 2006 Тест F Расчет значения F сравнивается с отчетом в F-таблице. При выполнении F-теста мы предполагаем, что дисперсия обоих популяций и «A» и «B» одинаковы. Таким образом Нулевая гипотеза: H 0 : A = B E и альтернативная гипотеза, что дисперсии различны: H 1 : A B Если значение F имеет меньший показатель расчета чем табличный вариант, мы предполагаем что нет разницы между двумя дисперсиями, таким образом верна Альтернативная гипотеза. 47 Prof. Saverio Mannino
Statistica di base Poznan 2006 T-тест В • • аналитической практике часто встречается необходимость сопоставить два средства с целью найти в них разницу. В таком случае может быть использован t-тест. Процедура Сформулируйте нулевую гипотезу Выберите доверительный уровень (p = 0. 05) Вычислите t от данных Сравните t с табличным вариантом Если t-величина вычисленная из данных ниже чем табличные данные мы можем заявить, что там нет существенной разницы между двумя средствами. 48 Prof. Saverio Mannino
Statistica di base Poznan 2006 Примеры • Компания производит замороженные креветки с отметкой на упаковке “Каждая 12 унций”. Образцы из четырех пакетов выбранные случайным образом показали следующий вес: 12. 2; 11. 6; 11. 8; 11. 6 На уровне 5%, это означает, что образцы значительно отличаются от отметки на упаковке? 49 Prof. Saverio Mannino
Statistica di base Poznan 2006 Пример • Среднее значение= 47. 2/4 = 11. 8 s = 0. 282 tвычисленная = 1. 41 tтабличная = 3. 18 for 3 degree of freedom Если tтабличная больше чем tвычисленная значит нет значительной разницы между M и X 50 Prof. Saverio Mannino
Statistica di base Poznan 2006 Примеры • Новые микропипетки предполагают дозировать 20, 0 µl. Чтобы проверить 5 исследований использовались аналитические весы. Вот результаты: 19. 6 - 19. 4 - 20. 1 - 19. 9 – 19. 5 На 5% уровне, это означает, что образцы значительно отличаются от отметки на упаковке? НЕТ……. ПОЧЕМУ 51 Prof. Saverio Mannino
Statistica di base Poznan 2006 Примеры • M= 19. 7 s= 0. 291 t вычисленная = 2. 3 t вычисленная = 2. 776 for 5 degree of freedom Если tтабличная больше чем tвычисленная значит нет значительной разницы между M и X 52 Prof. Saverio Mannino
Statistica di base Poznan 2006 Примеры • M= 19. 7 s= 0. 291 X = 20 t вычисленная = 2. 3 tвычисленная = 2. 776 for 5 degree of freedom Значение знаменателя 0. 130 и это стандартная ошибка среднего значения. Это означает, что наш результат можно представить в виде: µ = 19. 7 ± 2. 776 (0. 13) Начиная с 19. 34 до 20. 06 И 20 в этом интервале Prof. Saverio Mannino 53
Statistica di base Poznan 2006 54 Prof. Saverio Mannino
Statistica di base Poznan 2006 Парные Т тесты Мы проанализировали образец двумя методами и его результаты представлены ниже. Нам нужно знать, дают ли два разных метода одинаковый результат. 6. 1 5. 8 7. 0 6. 1 5. 8 6. 4 6. 1 6. 0 5. 9 5. 8 5. 9 5. 7 6. 1 5. 8 5. 9 5. 6 5. 9 5. 7 5. 6 55 Prof. Saverio Mannino
Statistica di base Poznan 2006 Парный T тест Для начала вычислили разницу: Σ d = 3. 2 и dсредний= 0. 32 0. 2 0. 1 0. 9 0. 3 -0. 1 0. 8 0. 5 0. 1 0. 2 И затем возвели в квадрат разницу Σd 2 = 1. 94 0. 01 0. 81 0. 09 0. 1 0. 64 0. 25 0. 1 0. 04 56 Prof. Saverio Mannino
Statistica di base Poznan 2006 Парный T тест Σ d = 3. 2 и dсредний = 0. 32 Σd 2 = 1. 94 and df = 9 Гипотезы: H 0 : a = b H 1 : a ≠ b α = 0. 05 • 57 Prof. Saverio Mannino
Statistica di base Poznan 2006 Парный T тест t из таблицы на 9 degree of freedom is : t = 2. 26 Being 3. 172 > 2. 26 Мы можем заключить что два метода в 95% случаев дают разные результаты 58 Prof. Saverio Mannino
Statistica di base Poznan 2006 ТОЧНОСТЬ Точность аналитического метода описывает близость средних данных результатов полученных методом к истинному значению (концентрации) аналита. • Точность определяется повтором анализа проб, содержащие известное количество аналита. • Точность должна быть измерена не менее чем в 5 вычислениях концентрата. Рекомендуется исследование минимум 3 концентраций в ожидаемом диапазоне концентраций. • Среднее значение должно быть в пределах 15% от фактического значения, кроме LLOQ, где оно не должно отклоняться более чем на 20%. Отклонение среднего от истинного значения служит мерой точности. 59 Prof. Saverio Mannino
Statistica di base Poznan 2006 ВОССТАНОВЛЕНИЕ Процент извлечения аналита из сложной матрицы - это отношение отклика детектора экстрагированного из сложной матрицы аналита, к отклику детектора подлинного образца аналита с истинной концентрацией. Восстановление относится к эффективности применения аналитического метода в пределах изменчивости. Восстановление аналита не должно быть на все 100%, но степень восстановления аналита и внутренний стандарт должен быть последовательным, точным и воспроизводимым. Эксперимент восстановления должен проводиться путем сравнения результатов анализа исследований трех концентратов (низкий, средний, высокий) со стандартом, который представляет 100% восстановление. 60 Prof. Saverio Mannino
Statistica di base Poznan 2006 СЕЛЕКТИВНОСТЬ Селективность это способность аналитического метода дифферинцировать и определять количество аналита в других компонентах образца. Для селективности, анализы чистого образца, соответствующие биологической матрице (плазма, моча или другие матрицы) должны быть получены как минимум из 6 источников. Каждый чистый образец должен быть протестирован на интерференции, и селективность должна быть проверена на нижнем уровне количественного анализа (LLOQ). Потенциальные вмешательства интерференций в биологические матрицы включая эндогенные компоненты матрицы, метаболиты, продукты распада, и при фактическом исследовании, сопутствующие препараты и другие внешние ксенобиотики. Если метод предназначен для определения более одного аналита, каждый аналит должен быть протестирован, чтобы гарантировать отсутствие интерференций. 61 Prof. Saverio Mannino
Statistica di base Poznan 2006 Калибровка/Стандартная кривая Стандартная калибровочная кривая - это взаимосвязь между итогами анализа и известными концентрациями анализируемого. Стандартная кривая должна быть сделана для каждого вещества в образце. Должно быть использовано достаточное количество стандартов для надлежащего определения соотношения между концентрацией и анализом. Калибровочная кривая должна быть создана по той же биологической матрице, что и образец, предназначенный для создания пиков матрицы с известными концентрациями анализируемого. Сумма стандартов, используемых при строении калибровочной кривой, – это функция ожидаемого ряда аналитических величин и сущность анализируемого/итог 62 соотношений. Prof. Saverio Mannino
Statistica di base Poznan 2006 КАЛИБРОВОЧНАЯ КРИВАЯ Концентрации стандартов должны быть выбраны на основе концентраций, ожидаемых при исследованиях. Калибровочная кривая должна состоять из чистого образца (матрица образца обрабатывается без внутреннего стандарта), нулевого образца (матрица образца обрабатывается с учетом внутреннего стандарта), и от 6 до 8 не нулевых образцов диапазона ожидаемого покрытия, в том числе LLOQ. 63 Prof. Saverio Mannino
Statistica di base Poznan 2006 1. Нижний предел количественного анализа (LLOQ) Самый низкий уровень кривой должен быть принят как стандарт квантификации, если соблюдены следующие условия: Реакция аналита на LLOQ должна быть проверена минимум в 5 случаях и сравнена с реакцией на чистую реакцию. Пик аналита (реакции) должен быть идентифицорованым, дискретным, и воспроизводимым с четкостью 20% и точностью 80 -120%. 64 Prof. Saverio Mannino
Statistica di base Poznan 2006 2. Калибровочной кривой/Стандартной кривой/Реакция концентрации Должна быть использована простейшая модель, которая адекватно описывает взаимодействие реакция-концентрация. Должен быть оправдан выбор взвешивания и использования комплексного уравнения регрессии. Должны быть выполнены следующие условия при создании кривой: #20% отклонение LLOQ от номинальной концентрации #15% отклонение от стандартов, кроме LLOQ от номинальной концентрации По крайней мере 4 из 6 не нулевых стандартов должны соответствовать вышеуказанным критериям, в том числе LLOQ и эталоны высокой концентрации. Исключая стандарты не должны меняться модели. 65 Prof. Saverio Mannino
Statistica di base Poznan 2006 Глоссарий ØТочность: Степень близости определяемого номинального значения или истинное значение при определенных условиях. Также иногда называют достоверностью. ØАналит: специфический измеряемый химический компонент, который может содержаться в наркотиках, биомолекулы или его производные, метаболиты, и/или деградация продукта в биологической матрице. ØАналитическая работа: Полный набор аналитических и изучаемых образцов с соответствующим количеством стандартов и QCs для их проверки. Несколько работ могут быть завершены за один день, или одна работа может занять несколько дней. 66 Prof. Saverio Mannino
Statistica di base Poznan 2006 Ø Калибровочный стандарт: Биологические матрицы, в которых известно количество аналита. Калибровочные стандарты используются для построения калибровочной кривой, с помощью которых определяются концентрации аналита в QCs и в неизвестных образцах. ØВнутренний стандарт: тестовые соединения (на пример структурно подобранные аналоги) добавляются как калибровочные стандарты и известные образцы и постоянные концентрации для упрощения квантификации аналита. ØПредел обнаружения (LOD): Наименьшая концентрация аналита в биоаналитической процедуре может надежно отличить от его «фонового шума» . ØНижний предел квантификации (LLOQ): Наименьшее количество аналита в образце, который может быть определен в с соответствующей точность и аккуратностью. 67 Prof. Saverio Mannino
Statistica di base Poznan 2006 Ø Эффект матрицы: Прямые или косвенные изменения или вмешательства в реакцию из-за случайного наличия аналитов или других мешающих веществ в образце. ØМетод: подробное описание всех процедур, используемых при анализе образца. ØЧеткость: Близость совпадений (степень разброса) между серией исследований, отобранных из нескольких подобных однородных образцов по заданным условиям. ØКоличественный диапазон: Диапазон концентраций, включающий ULOQ и LLOQ, которые могут быть надежными и воспроизводимыми с количественной точностью и точностью за счет соотношений концентрация-реакция. 68 Prof. Saverio Mannino
Statistica di base Poznan 2006 ØВозмещение: Выборка эффективности аналитического процесса, формируется в процентах от известного количества аналита и осуществляется путем извлечения образца и проработки шагов методики. ØВоспроизводимость: Точность между двумя лабораториями. Она также представляет точность метода и при одинаковых условиях эксплуатации в течении короткого периода времени. ØЧистый: Образец биологической матрицы на котором нет аналитов и который используется для оценки специфических биоаналитических методов. ØКонтроль качества образцов (QC): Образцы используются для мониторинга производительности биоаналитического метода, для оценки целостности и достоверности результатов неизвестных образцов из отдельных партий. 69 Prof. Saverio Mannino
Statistica di base Poznan 2006 ØСелективность: Возможность биоаналитического метода измерять и различать наличие аналитов в компонентах. ØСтабильность: Химическая стабильность аналита из данных матрицы в определенных условиях в заданный промежуток времени. ØСтандартная кривая: Отношения между экспериментальными значениями отклика и аналитической концентрацией (также называется калибровочной кривой). ØСистема пригодности: Определение инструментов производительности (например чувствительность и хроматографическое удерживание) по анализу эталоном до запуска аналитического пакета. ØВерхний предел количественного показателя (ULOQ): Большая величина аналита в образце, которая может быть определена с высокой точностью. 70 Prof. Saverio Mannino
Statistica di base Poznan 2006 Аттестация ØПолная аттестация: Создание всех параметров проверки для возможности анализа проб биоаналитическим методом для каждого вещества (аналита). ØЧастичная аттестация: Модификация утвержденных биоаналитических методов, которые не обязательно требуют полной переаттестации. ØПерекрестная аттестация: Сопоставление контрольных параметров двух аналитических методов. 71 Prof. Saverio Mannino
Statistica di base Poznan 2006 72 Prof. Saverio Mannino
Statistica di base Poznan 2006 Доверительный интервал Целью осуществления случайной выборки из партии или популяции с использованием вычислительной статистики, такое, как среднее из данных, является приближенный показатель к популяции. На сколько правильна статистика оценки базового значения всегда остается вопросом. Доверительный интервал решает этот вопрос, поскольку он обеспечивает диапазон значений, которые могут содержать параметры популяции. 73 Prof. Saverio Mannino
Statistica di base Poznan 2006 Доверительный интервал создается на доверительном уровне, таком как 95%, выбранном пользователем. Что то значит? Это значит, что если пробы одной и той же популяция брались неоднократно и интервальные оценки сделаны по каждому случаю, в результате интервалы показывают границы истинных параметров популяции примерно в 95% случаев. Достоверность исследования на уровне 1 -alfa можно рассматривать как обратное значение уровня alfa. 74 Prof. Saverio Mannino
Statistica di base Poznan 2006 Доверительный интервал Таким образом статистические тесты могут быть одно и двусторонними, доверительные интервалы также могут быть одно и двусторонними. Двусторонний доверительный интервал – границы параметров популяции «от» и «до» . Односторонний доверительный интервал – границы параметров популяции либо ниже нижнего параметра, либо выше верхнего параметра. Пример двустороннего доверительного интервала. 75 Prof. Saverio Mannino
Statistica di base Poznan 2006 Доверительный интервал На пример, a 100% доверительный интервал для среднего значения нормальной популяции; Где средне выборочное, является верхним критическим значением от нормального стандартного распределения, которое находится в таблице нормального стандартного определения, где известно стандартное отклонение, и N является размером выборки. 76 Prof. Saverio Mannino
Statistica di base Poznan 2006 Какова взаимосвязь между тестом и доверительным интервалом? В основном, для тестирования гипотезы есть эквивалентное утверждение о том, что значение параметра включено в доверительный интервал. На пример, рассматривая предыдущий пример ширины линий где фотошаблоны проверяются, чтобы их линии были имели средний размер 500 мкм. Нулевая и альтернативная гипотезы: H 0: средняя ширина = 500 micrometers Ha: средняя ширина # 500 micrometers 77 Prof. Saverio Mannino
Statistica di base Poznan 2006 Какова взаимосвязь между тестом и доверительным интервалом? Для теста выборочное среднее рассчитывается из N ширины линий выбранной позиции по каждому фотошаблону. Для целей тестирования, предполагается, что стандартное отклонение, известно из долгой истории этого процесса. Статистика тестов рассчитывается из образцов статистик и нулевая гипотеза отвергается, если: где значения представлены из нормального распределения. 78 Prof. Saverio Mannino
Statistica di base Poznan 2006 Какова взаимосвязь между тестом и доверительным интервалом Немного математики и будет видно, что нулевая гипотеза не верна если и только если значение 500 micrometers не входит в доверительный интервал Эквивалент доверительного интервала. На самом деле, все значения, заключенные в этот интервал будут приняты в качестве нулевого значения для данного набора тестовых данных. 79 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Статистический тест способствует созданию механизма для принятия решений количественном о процессе или процессах. Целью является определение, достаточно ли существует доказательств чтобы отклонить предположение или гипотезу о процессе. Предположение называется «нулевой гипотезой» . Не отклонение гипотезы может дать хороший результат если мы хотим продолжить работу, и если мы “верим" что «нулевая гипотеза» верна. Или это может дать разочаровывающий результат, возможно показывая, что у нас не хватает данных для того, чтобы “доказать" несостоятельность нулевой гипотезы. 80 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Классическое использование статистического теста происходит в процессе контрольной стадии. К примеру, предположим, что мы заинтересованы в обеспечении того, чтобы фотошаблоны в организации производственного процесса имели среднюю ширину 500 мкм. Нулевая гипотеза, в данном случае, это то, что средняя ширина равна 500 мкм. Неявным в этом заявлении является то, что нужен индикатор фотошаблона, который обозначает ширину линий, которые либо гораздо больше или гораздо меньше чем 500 мкм. Это приводит к альтернативной гипотезе, что ширина линии не менее 500 мкм. Это двусторонняя альтернатива, поскольку она предусматривает противоположное мнение; а именно, что ширина линий слишком мала или слишком большая. 81 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Процедура тестирования происходит следующим образом. Ширина линий в произвольной позиции на фотошаблонах измеряются с помощью электронного сканирующего микроскопа. Тестовая статистика вычисляется из данных и снова тестируется в заранее определенной плоскости верхних и нижних значений. Если тестовая статистика больше верхнего критического значения или меньше нижнего критического значения, нулевая гипотеза отвергается, потому что есть доказательство того, что средняя ширина линий не 500 мкм. 82 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Нулевая и альтернативная гипотезы также могут быть односторонними. К примеру, предположение, что электролампы имеют среднюю продолжительность горения по крайней мере 500 часов, осуществляем тестирование программы. Нулевая гипотеза, в данном случае, предполагает, что жизнь лампочки больше или равна 500 часам. Альтернативная или дополнительная гипотеза предусматривает, что средняя продолжительность жизни лампочки меньше 500 часов. Сравниваем тестовую статистику с показателями нижней критической отметки, и если она меньше данного показателя, то нулевая гипотеза отвергается. Таким образом, статистический тест требует наличия двух гипотез, а именно: H 0: нулевая гипотеза Ha: альтернативная гипотеза 83 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Нулевая гипотеза – это то что кажется верным. Мы можем подозревать, что нулевая гипотеза верна, вот почему мы ее тестируем. Альтернативная гипотеза может, по факту, оказаться истинной. Процедура тестирования построена таким образом, что риск того, что нулевая гипотеза окажется не верной, когда она верна на самом деле, очень мал. Этот риск, часто упоминается как уровень значимости теста. При наличии теста с малыми данными, мы считаем, что на самом деле «доказали» что-то, когда мы опровергаем нулевую гипотезу. 84 Prof. Saverio Mannino
Statistica di base Poznan 2006 СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ Угроза срыва отклонения нулевой гипотезы возможна, когда на самом деле она ложная и не выбрана пользователем, а определяется, как и следовало ожидать, от величины реального расхождения. Этот риск, обычно называют ошибкой второго рода. Большие расхождения между реальностью и нулевой гипотезой легче обнаружить и привести к небольшой ошибке второго рода; в то время как небольшие расхождения являются более трудными и могут привести к большим ошибкам второго рода. Кроме того, когда один риск возрастает, то другой уменьшается. 85 Prof. Saverio Mannino
14_2_Validation_statistics_ru_2.ppt