
P4 Indukce a odhady.pptx
- Количество слайдов: 28
STATISTICKÁ INDUKCE
Statistická indukce POPULACE VÝBĚR (základní soubor) (výběrový soubor) výběr populace data výběrová statistika indukce populační parametr vs. výběrová statistika konstanta náhodná veličina
Příklad populace: všichni studenti oboru Pa. A – kurzu Statistika I Pa. A, ZS 2013/2014 průměrný bodový zisk z prvního zápočtového testu pro všechny studenty byl 12, 06 bodů výběry Populační parametr – n 1=30; konstanta! n 2=26; n 3=50; n 4=22; n 5=28; n 6=25; n 7=35; . . . . μ =12, 06 Výběrová charakteristika – náhodná veličina s určitou variabilitou!
Statistické šetření – ◦ úplné (census) ◦ neúplné výběrové (rychlejší, levnější) reprezentativnost výběru
Způsoby výběru výběr na základě dobrovolnosti (anketa) výběr na základě dostupnosti kvótní výběr náhodný výběr ◦ prostý náhodný výběr ◦ každý výběrový soubor o rozsahu n má stejnou ppst výběru (= každý prvek populace má stejnou ppst, že bude vybrán)
populace vs. výběr POPULACE VÝBĚR mladí Američané Jedná se o reprezentativní výběr?
Teorie odhadu bodový odhad populačních charakteristik (populační průměr, populační rozptyl, …) intervalový
Bodový odhad T bodový odhad populačního parametru θ Žádoucí vlastnosti výběrové statistiky, kterou použiji k odhadu • konzistentní – s rostoucím počtem pozorování se odhad blíží k hodnotě populačního parametru s pravděpodobností 1 • nestranná – při opakovaných výběrech kolísá odhad tak, že v průměru se odhady z výběrů rovnají populační hodnotě, tj. střední hodnota výběrové statistiky se rovná odhadovanému populačnímu parametru, jde o nestranný odhad (E(T) = θ) • vydatná – rozptyl odhadů při opakovaných výběrech je malý • postačující – neexistuje další statistika, která by obsahovala o odhadované pop. charakteristice další informaci
Bodový odhad průměru výběrový průměr je nestranným odhadem populačního průměru rozptyl výběrového průměru σ2/n směrodatná odchylka výběr. průměru σ/√n směrodatná chyba výběrového průměru ukazatel variability výběrových průměrů
Bodový odhad populačního rozptylu a populační směrodatné odchylky nestranným odhadem populačního rozptylu je výběrový rozptyl odhad populační směrodatné odchylky je pouze asymptoticky nestranný s rostoucím rozsahem souboru se vychýlení zmenšuje
Značení výběrový soubor rozsah souboru základní soubor n N aritm. průměr μ rozptyl směrodatná odchylka s relativní četnost p (fi) σ π
Intervalový odhad Hodnotu populačního parametru Θ odhadneme číselným intervalem, který s předem zvolenou pravděpodobností obsahuje odhadovaný populační parametr Θ. 1 -α. . . spolehlivost odhadu (koeficient spolehlivosti) α. . . hladina významnosti P(T 1 < Θ < T 2) = 1 - α
Oboustranný interval spolehlivosti P(T 1 < Θ < T 2) = 1 - α dolní mez horní mez intervalu spolehlivosti pravděpodobnost, s jakou interval (T 1 , T 2) pokrývá neznámou hodnotu Θ α = 0, 05 α = 0, 01
Jednostranné intervaly spolehlivosti P(- ∞ < Θ < T 2) = 1 – α pravostranný interval spolehlivosti P(T 1 < Θ < + ∞ ) = 1 – α levostranný interval spolehlivosti
Interval spolehlivosti pro populační průměr μ Předpoklad: výběr z velké populace s normálním rozdělením N(μ, σ2) Δ. . . přípustná chyba odhadu oboustranný interval spolehlivosti
Odhad při známém populačním rozptylu σ2 uα…kritická hodnota normálního rozdělení pro hladinu významnosti α σ. . . populační směrodatná odchylka n…rozsah výběrového souboru
Odhad při neznámém populačním rozptylu σ2 tα(f)…kritická hodnota Studentova t-rozdělení pro hladinu významnosti α a f=n-1 st. vol. s…výběrová směrodatná odchylka n…rozsah výběrového souboru
Příklad Obyvatelé domků u frekventované silnice si stěžují na vysokou rychlost projíždějících automobilů. Pro 30 náhodně vybraných automobilů byla zjištěna rychlost v km. Odhadněte pomocí bodového i intervalového odhadu (α = =0, 05), jaká je průměrná rychlost projíždějících vozidel. n = 30 bodový odhad průměrné rychlosti s = 7, 03
Příklad - pokračování n=30 s=7, 03 intervalový odhad 95% interval spolehlivosti pro μ 95 % interval spolehlivosti pro μ: (skutečnou průměrnou rychlost) tento interval s 95 % pravděpodobností pokrývá neznámou hodnotu populačního průměru
α = 0, 01 99 % interval spolehlivosti pro μ (průměrnou rychlost)
Příklad - pokračování U kolika automobilů by musela být rychlost měřena, aby bylo možné na 5% hladině významnosti odhadnout populační průměr s maximální přípustnou chybou 1 km? stanovení rozsahu výběru
Intervalový odhad rozptylu Předpoklad: výběr z populace s normálním rozdělením N(μ, σ2), parametr μ je neznámý kritické hodnoty χ2 rozdělení s f = n-1 stupni volnosti
Intervalový odhad směrodatné odchylky symbolika viz odhad rozptylu
Intervalový odhad relativní četnosti π π p π. . . relativní četnost jednotek s vlastností A v populaci p. . . relativní četnost jednotek s vlastností A ve výběru výběry s opakováním → binomické rozdělení výběry bez opakování → hypergeometrické r. velký výběrový soubor – aproximace normálním rozdělením
Předpoklad: velký rozsah výběru interval spolehlivosti pro populační relativní četnost π p. . . výběrová relativní četnost uα. . . kritická hodnota normálního rozdělení pro hladinu významnosti α
Příklad V náhodném výběru 400 studentů je 88 leváků. Zkonstruujte 95% interval spolehlivosti pro podíl leváků v populaci.
Neparametrický odhad mediánu citlivost aritmetického průměru na vybočující hodnoty, důležité zvláště u malých souborů medián – robustní charakteristika polohy - výběrový medián M – populační medián Intervalový odhad populačního mediánu M Předpoklad: spojitost znaku X
• data uspořádaná od min po max • podle rozsahu výběru n se nalezne takové přirozené číslo k , pro které P(xk ≤ M ≤ xn-k+1) ≥ 1 - α Příklad: u skupiny 15 náhodně vybraných osob byl zjišťován čistý měsíční příjem (v tis. Kč), sestrojte 95% interval spolehlivosti pro populační medián. 15, 16, 19, 21, 22, 23, 24, 25, 26, 27, 28
P4 Indukce a odhady.pptx