Скачать презентацию Analýza dat pomocí software od SAS Institute Jaroslav Скачать презентацию Analýza dat pomocí software od SAS Institute Jaroslav

65e32078448378f7fe78894e8866cf3c.ppt

  • Количество слайдов: 82

Analýza dat pomocí software od SAS Institute Jaroslav Půlpán, SAS Institute, Praha czejap@cze. sas. Analýza dat pomocí software od SAS Institute Jaroslav Půlpán, SAS Institute, Praha [email protected] sas. com For 22 Years: “If It Moves, We Can Analyze It” 5/98 Data Analysis 1

SAS System: modulární software Přístup do: Sybase, Oracle, Informix ODBC. . . Sběr dat SAS System: modulární software Přístup do: Sybase, Oracle, Informix ODBC. . . Sběr dat Enterprise miner Client-server SAS dataset MDDB SPDS DMDB. . . Enterprise reporter Stat. analýza, časové řady, oper. výzkum, kontrola kvality. . . Sestavy grafy, tabulky EIS, WEB. . . Analýza Presentace Uložení SAS System Warehouse Administrator SAS language, SAS Macro, SCL, OOP (AF a EIS objekty) Od desktopu po mainframe: Windows, Mac, Unix, MVS, VMS 5/98 Data Analysis 2

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML (Modul SAS/OR Modul SAS/QC) • Další produkty SAS Institute 5/98 Data Analysis 3

Interaktivní SAS nástroje • SAS/ASSISTS • menu ovládaný interface do všech hlavních funkcí • Interaktivní SAS nástroje • SAS/ASSISTS • menu ovládaný interface do všech hlavních funkcí • (SAS menu Globals/Analyze) – (Interactive data analysis ) = SAS/INSIGHT • nástroj pro interaktivní statistickou. analýzu a vizualizaci dat a výsledků – (Time Series Forecasting System)= SAS/TSFS • menu ovládaný interface do modulu SAS/ETS – (Guided data analysis ) = SAS/LAB • řízená statistická analýza zaměřená na analýzy laboratorních tesů 5/98 Data Analysis 4

Interaktivní SAS nástroje – (Quality improvement) = SAS/QC (SQC) • integrovaný GUI pro řízení Interaktivní SAS nástroje – (Quality improvement) = SAS/QC (SQC) • integrovaný GUI pro řízení a kontrolu kvality – (Project management) = PROJMAN SAS/OR • operační výzkum a řízení projektů – (Design of experiments) = ADX • interaktivní nástroj pro návrh experimentů • SAS/SPECTRAVIEW - zobrazeni 3 D • ANALYST (volně šířený modul) • interaktivní nástroj pro statistikou analýzu • RESEARCH ANALYST • modifikovatelný analytický nástroj 5/98 Data Analysis 5

SAS/INSIGHT - nástroj pro vizualizaci dat • Je dynamický nástroj pro zkoumání a analýzu SAS/INSIGHT - nástroj pro vizualizaci dat • Je dynamický nástroj pro zkoumání a analýzu dat. • Zkoumání distribuce dat je možno provádět prostřednictvím interaktivních histogramù, oblastí, a 3 D rotačních bodových grafù. • Lze zkoumat korelace mezi proměnnými a vypočítávat základní komponenty aby nalezl strukturu dat. • Všechny grafy a tabulky dat se objevují v oknech, která jsou navzájem propojena, takže změna výběru se automaticky promítne do druhého okna. 5/98 Data Analysis 6

Interaktivita grafů v INSIGHTu 5/98 Data Analysis 7 Interaktivita grafů v INSIGHTu 5/98 Data Analysis 7

Typy grafů - menu Analyze • Line Plot lze volit typ čáry • Scatter Typy grafů - menu Analyze • Line Plot lze volit typ čáry • Scatter Plot 5/98 Data Analysis 8

Typy grafů - menu Analyze • Rotating Plot lze vypinat/ potlačit krychli, osy; či Typy grafů - menu Analyze • Rotating Plot lze vypinat/ potlačit krychli, osy; či rotovat graf; 5/98 Data Analysis 9

Označování bodů v grafech – Zobrazení Tools toolbaru - Edit, Tools – výběrem ikony Označování bodů v grafech – Zobrazení Tools toolbaru - Edit, Tools – výběrem ikony barvy nebo symbolu lze nastavit podmínku, při jejichž splnění se pozorování na grafu obarví dle vybrané ikony pokud jsou body vybrány v grafu pomocí myši, pak výběr ikony barvy nebo symbolu je obarví automaticky 5/98 Data Analysis 10

Ukázka: použití INSIGHT Variable INTERCEPT X 5/98 DF Estimate Std Error Prob >|T| 1 Ukázka: použití INSIGHT Variable INTERCEPT X 5/98 DF Estimate Std Error Prob >|T| 1 50. 7926 5. 2081 0. 0001 1 0. 9833 0. 1795 0. 0001 Data Analysis 11

INSIGHT - distribuce residuii 5/98 Data Analysis 12 INSIGHT - distribuce residuii 5/98 Data Analysis 12

Prokládání křivek rozložením • Menu: Analyze, Distribution; tlačítko: Output 5/98 Data Analysis 13 Prokládání křivek rozložením • Menu: Analyze, Distribution; tlačítko: Output 5/98 Data Analysis 13

SAS/ASSIST-nejsnažší ovládání 5/98 Data Analysis 15 SAS/ASSIST-nejsnažší ovládání 5/98 Data Analysis 15

SAS/ASSIST =menu interface • Systém menu zastřešující všechny nástroje – tvorbu dat a jejich SAS/ASSIST =menu interface • Systém menu zastřešující všechny nástroje – tvorbu dat a jejich úpravy – provádění statistických analýz z STAT a ETS • nevyžaduje znalost programování – log výpis poskytuje informaci jak byly použity procedury STAT a ETS modulů • možnost uschovat programy a znovu je spouštět v dávkovém režimu 5/98 Data Analysis 16

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML (Modul SAS/OR Modul SAS/QC) • Další produkty SAS Institute 5/98 Data Analysis 18

Spouštění SAS systému LOG (F 6) NOTE: Copyright (c) 1989 -1996 by SAS Institute Spouštění SAS systému LOG (F 6) NOTE: Copyright (c) 1989 -1996 by SAS Institute Inc. , Cary, NC, USA. NOTE: SAS (r) Proprietary Software Release 6. 12 TS 020 License d to SAS INSTITUTE CZECH OFFICE/INTERNAL USE, Site 0030001130. PGM (F 5) Command==> NUM OFF Command==> 0001 0002 0003 0004 0005 5/98 OUTPUT (F 7) Command Line: (F 11) SUBMIT OUTPUT The SAS System 09: 50 Monday, April 27, 1998 3 OBS TRTMNT RESPONSE 109 4 1736. 17 110 5 1781. 37 Data Analysis 19

Base SAS - základní modul SAS System – 4 GL programovací jazyk SAS pro Base SAS - základní modul SAS System – 4 GL programovací jazyk SAS pro tvorbu programů (Data Step) – výkonný makro procesor (SAS Macro) – procedura SQL pro práci relačními tabulkami – prostředí SAS System (editor, menu systém, knihovny, nápověda) – základní procedury pro řízení prostředí (PROC OPTIONS. . . ) – základní procedury pro práci s datasety (PROC PRINT, PROC CATLOG, PROC SORT. . ) 5/98 Data Analysis 20

Ukázka SAS programu: {zapsán do PGM okna a spuštěn pomocí SUBMIT (F 8) } Ukázka SAS programu: {zapsán do PGM okna a spuštěn pomocí SUBMIT (F 8) } /* toto je komentar */ * take toto je az to znaku strednik komentar; /*DATASTEP - zakladni krok pri praci se soubory a datasety, implicitne se definovane prikazy provadi pro vsechny radky vstupniho datasetu */ DATA STAT. TEST 1; * vytvor novy dataset ; DO i=0 TO 50; * cyklus pro kazdy radek vstupu; y=y+RANUNI(123); * pridej nahodne cislo; PUT y; * vypis Y do logu; OUTPUT; * zapis do vystupniho datasetu; END; * konec cyklu; RUN; * sputi datastep; 5/98 Data Analysis 21

Ukázka SAS Macro: %MACRO GENETS(b 0, b 1, a 2, c, n, name); DATA Ukázka SAS Macro: %MACRO GENETS(b 0, b 1, a 2, c, n, name); DATA &name (drop=seed); do x=0 to &n; if x=0 then do seed=12; e 1=&c*rannor(seed); e 2=&c*rannor(seed); end; e=-&a 1*e 1 - &a 2*e 2 + &c*rannor(seed); e 2=e 1; e 1=e; y=&b 0+&b 1*x+e; output; end; %MEND %let name=stat. testets; %genets(50, 1, 0. 8, 0. 5, 12, 50, &name); run; 5/98 Data Analysis 22

Ukázka SQL procedury /* Proc SQL = uplna ANSI-SQL implementace s moznosti pouzivat nativni Ukázka SQL procedury /* Proc SQL = uplna ANSI-SQL implementace s moznosti pouzivat nativni SQL dialekty jinych databazi (pass-through) */ proc sql noprint; select max(e), min(e) into : maxe , : mine from stat. testets; /* je mozna spoluprace PROC SQL s makro procesorem */ data _null_; %put &mine; %put &maxe; x=abs(max(&maxe, &mine)); put x; run; 5/98 Data Analysis 23

SAS/GRAPH grafický výstup: proc gplot data=&name; plot y *x / haxis=axis 1 vaxis=axis 2 SAS/GRAPH grafický výstup: proc gplot data=&name; plot y *x / haxis=axis 1 vaxis=axis 2 nolegend grid cframe=white; axis 1 label=( h=2 " x") ; axis 2 label=( h=2 a=90 r=0 " Y"); symbol interpol=sm ci=blue w=3; 5/98 Data Analysis 24

Ukázka 3 D plochy 5/98 Data Analysis 25 Ukázka 3 D plochy 5/98 Data Analysis 25

Ukázka grafu s vrstevnicemi 5/98 Data Analysis 26 Ukázka grafu s vrstevnicemi 5/98 Data Analysis 26

SAS/SPECTRAVIEW 5/98 Data Analysis 27 SAS/SPECTRAVIEW 5/98 Data Analysis 27

SAS/GIS • geografický informační systém pro presentaci obchodních dat na mapách 5/98 Data Analysis SAS/GIS • geografický informační systém pro presentaci obchodních dat na mapách 5/98 Data Analysis 28

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML (Modul SAS/OR Modul SAS/QC) • Další produkty SAS Institute 5/98 Data Analysis 29

Moduly SAS System pro analýzu dat – SAS/STAT -statistická analýza – SAS/ETS -analýza časových Moduly SAS System pro analýzu dat – SAS/STAT -statistická analýza – SAS/ETS -analýza časových řad – SAS/IML -maticový programovací jazyk – SAS/OR -operační výzkum a řízení projektů – SAS/QC -kontrola kvality – (SAS/LAB -statistická analýza lab. testů ) 5/98 Data Analysis 30

Modul SAS/STAT • • 5/98 Regresní analýza Analýza rozptylu Neparametrické analýzy Analýza kategorických dat Modul SAS/STAT • • 5/98 Regresní analýza Analýza rozptylu Neparametrické analýzy Analýza kategorických dat Diskriminační analýza Shluková analýza Analýza přežití Soustavy strukturních rovnic Data Analysis 31

Procedury pro regresní analýzu • REG obecná regrese s úplnou diagnostikou • GLM zobecněný Procedury pro regresní analýzu • REG obecná regrese s úplnou diagnostikou • GLM zobecněný lineární model • MIXED lineární modely se smíšenými efekty • ORTHOREG regresení analýza se spec. metodou pro špatně podmíněná data • RSREG regresní modely s kvadratickou odezvou 5/98 Data Analysis 32

Procedury pro regresní analýzu • LOGISTIC - regrese pro binární data • PROBIT - Procedury pro regresní analýzu • LOGISTIC - regrese pro binární data • PROBIT - regrese několika stavových proměnných • GENMOD - lineární model s „link“ funkcí • NLIN - obecný nelineární regresní model • TRANSREG - použití k nalezení optimální transformace vstupních proměnných 5/98 Data Analysis 33

Proceura REG Model: y = X. b + e y vektor pozorování (y 1…yn) Proceura REG Model: y = X. b + e y vektor pozorování (y 1…yn) b vektor parametrů modelu (b 1. . bk ) X matice (xij) hodnot vysvětlujících proměnných , rozměr n x k (design matrix) • řešení metodou nejmenších čtverců • 9 metod výběru modelu (forward, backward. . ) • rozsáhlá diagnostika (grafy, intervaly spolehlivosti, . . . ) • • 5/98 Data Analysis 34

Řešení OLS pomocí REG X Y 0 48. 25 1 46. 53. . . Řešení OLS pomocí REG X Y 0 48. 25 1 46. 53. . . proc reg data=stat. testets graphics; model y=x; output out=p p=yhat l 95=lcl u 95=ucl r=res; proc gplot data=p; plot y*x=1 yhat*x=2 lcl*x=3 ucl*x=3 /overlay cframe=white ; run; 5/98 Data Analysis 35

Ukázka: výstup PROC REG 5/98 Data Analysis 36 Ukázka: výstup PROC REG 5/98 Data Analysis 36

Zobecněný lineární model (GLM) • Model: y = X. b + e • s Zobecněný lineární model (GLM) • Model: y = X. b + e • s kovarianční maticí • • 5/98 lze zadat i interakce (xi*xj. . . ) testování hypotéz včetně kontrastů interaktivního vyhodnocování modelu analýza variance (pro všechny typy návrhů vyvážené, nevyvážené, vicefaktorové ) Data Analysis 37

Smíšené modely - procedura MIXED Data heights; input family gender$ height; . . . Smíšené modely - procedura MIXED Data heights; input family gender$ height; . . . proc mixed data=sp; class family gender; model height = gender random family ; run; 5/98 Data Analysis 39

Procedura RSREG Proc glm; model = x 1*x 1 x 2 x 1*x 2 Procedura RSREG Proc glm; model = x 1*x 1 x 2 x 1*x 2 x 2*x 2 x 3 x 1*x 3 x 2*x 3 x 3*x 3 proc rsreg; model y = x 1 x 2 x 3; 5/98 Data Analysis 40

Procedury LOGISTIC a PROBIT • Logistická regrese - modelování binární proměnné • • • Procedury LOGISTIC a PROBIT • Logistická regrese - modelování binární proměnné • • • 5/98 probit rovnice logistická Gompetz normální lze užít i na vicestavové proměnné Data Analysis 41

Procedura GENMOD Generalized linear model • Link funkce g: – – – 5/98 • Procedura GENMOD Generalized linear model • Link funkce g: – – – 5/98 • Distribuce chyb: – – – identity logit probit power log-log Data Analysis normalní binomická Poisson gama inversní Gaussovo 42

Procedury pro analýzu variance • ANOVA vícerozměrná analýza rozptylu – varianta GLM výhodná pro Procedury pro analýzu variance • ANOVA vícerozměrná analýza rozptylu – varianta GLM výhodná pro vyvážené návrhy • NESTED analýza rozptylu pro blokové experimentální návrhy • VARCOMP analýza rozptylu ve smíšených modelech 5/98 Data Analysis 43

Neparametrické analýzy • UNIVARIATE - Wilcoxonův test • FREQ - n-rozměrné kontingenční tabulky (Chi-square, Neparametrické analýzy • UNIVARIATE - Wilcoxonův test • FREQ - n-rozměrné kontingenční tabulky (Chi-square, Fisher exact test, …-15 testů) • NPAR 1 WAY neparametrické testy pro uspořádané výběry – Wilcoxon, Savage, Van der Waerden, Kolmogorov-Smirnov statistiky 5/98 Data Analysis 44

Procedury pro analýzu kategorických dat • CATMOD - modelování kontingenčních tabulek • CORRESP - Procedury pro analýzu kategorických dat • CATMOD - modelování kontingenčních tabulek • CORRESP - analýza vícerozměrných kontingenčních tabulek metodou hlavních komponent 5/98 Data Analysis 45

Vícerozměrné analýzy • FACTOR faktorová analýza • PRINCOMP analýza hlavních komponent • PRINQUAL hlavních Vícerozměrné analýzy • FACTOR faktorová analýza • PRINCOMP analýza hlavních komponent • PRINQUAL hlavních komponent pro kvalitativní data • CANCORR kanonická korelace 5/98 Data Analysis 46

Diskriminační analýza • DISRIM diskriminační analýza (i neparametrická) • CANDISC kanonická diskriminace • STEPDISC Diskriminační analýza • DISRIM diskriminační analýza (i neparametrická) • CANDISC kanonická diskriminace • STEPDISC postupná diskriminační analýza (postupný výběr, zpětné odebírání) 5/98 Data Analysis 47

Shluková analýza • CLUSTER implementace 9 algoritmů shlukování • FASTCLUS k-means algoritmus pro rozsáhlá Shluková analýza • CLUSTER implementace 9 algoritmů shlukování • FASTCLUS k-means algoritmus pro rozsáhlá data • ACECLUS přibližná metoda odhadu kovariační matice (mezi shluky pozorování) • VARCLUS shlukování dle numerických proměnných 5/98 Data Analysis 48

Shluková analýza • MODECLUS shlukování založené na neparametrickém popisu hustoty • TREE výstup shlukové Shluková analýza • MODECLUS shlukování založené na neparametrickém popisu hustoty • TREE výstup shlukové analýzy formou stromových diagramů • STANDARD normalizace proměnných před shlukovou analýzou 5/98 Data Analysis 49

Analýza přežití • LIFETEST - neparametrické testy rozložení rizik, porovnání křivek přežití • LIFEREG Analýza přežití • LIFETEST - neparametrické testy rozložení rizik, porovnání křivek přežití • LIFEREG - regrese parametrických model křivek přežití (Weibull, Gompertz) • PHREG - analýza přežití (Cox proportional hazard model) • lze použít i na analýzu spolehlivosti (doby bezporuchové chodu) 5/98 Data Analysis 50

Proportional hazards models • Influence of the explanatory variables • exponecial • Gompetz • Proportional hazards models • Influence of the explanatory variables • exponecial • Gompetz • Cox proportional hazard model (PHREG) – maximum partial likelihood concept 5/98 Data Analysis 54

Proc CALIS - analýza lineárních strukturních rovnic • Soustava lineárních rovnic provázaných společnou proměnnou Proc CALIS - analýza lineárních strukturních rovnic • Soustava lineárních rovnic provázaných společnou proměnnou 5/98 Data Analysis 55

Proc CALIS analýza lineárních strukturních rovnic – Multiple and multivariate linear regression – Measurement Proc CALIS analýza lineárních strukturních rovnic – Multiple and multivariate linear regression – Measurement error models – Structural equations with latent variables – Path analysis and causal modeling – Simultaneous equation models with reciprocal causation – Exploratory and confirmatory factor analysis of any order – Three-mode factor analysis , Canonical correlation 5/98 Data Analysis 56

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML (Modul SAS/OR Modul SAS/QC) • Další produkty SAS Institute 5/98 Data Analysis 57

Modul ETS (Econometrics and Time Series) • Postup analýzy časových řad – identifikace procesu Modul ETS (Econometrics and Time Series) • Postup analýzy časových řad – identifikace procesu – odhad parametrů modelu – diagnostika předpokladů • Použití analýzy časových řad (modelů) – popsání modelu a parametrů procesu – předpověď budoucího vývoje procesu – modelování vztahů mezi více časovými řadami – predikce vlivu změn jedné časové řady na ostatní 5/98 Data Analysis 58

Procedura FORECAST předpovědi jednoduše • rychlá generace předpovědi pro velký počet časových řad • Procedura FORECAST předpovědi jednoduše • rychlá generace předpovědi pro velký počet časových řad • kombinuje trend a autoregresní modely • jádro interaktivní nadstavby SAS/TSFS (Time Series Forecasting System) 5/98 Data Analysis 59

Výsledky FORECAST 5/98 Data Analysis 60 Výsledky FORECAST 5/98 Data Analysis 60

Metody modelování časových řad implementované v modulu ETS • AUTOREG: modely s autoregresním náhodným Metody modelování časových řad implementované v modulu ETS • AUTOREG: modely s autoregresním náhodným členem • ARIMA: Box-Jenkins modely (Auto. Regressive Integrated Moving. Average) • X 11: sezonní korekce časových řad • FORECAST: automatický výběr modelu z tříd (ARIMA + trend + sezonní vliv) 5/98 Data Analysis 61

Metody modelování časových řad implementované v modulu ETS • PLDREG: regresní analýza řad se Metody modelování časových řad implementované v modulu ETS • PLDREG: regresní analýza řad se zpožděnými efekty vyjádřenými polynomem (polynomial distributed lag model) • TSCREG: regresní analýza několika časových řad (Time Series Cross Section Regression) • STATESPACE: modely založené na stavovém prostoru (Markovovy procesy) 5/98 Data Analysis 62

Ekonometrické modelování implementované v modulu ETS • MODEL: nelineární vícerozměrné modely • SYSLIN: regresní Ekonometrické modelování implementované v modulu ETS • MODEL: nelineární vícerozměrné modely • SYSLIN: regresní analýza provázaných systémů lineárních rovnic v kterých je regresor svázán s residui • SIMLIN: simulace řad zpracovaných procedurou SYSLIN • SPECTRA: spektrální analýza řad - rychlá Fourierova transformace 5/98 Data Analysis 63

Procedure AUTOREG • Modelování časových řad s autokorelovanou náhodnou složkou • Durbin-Watson test autokorelace Procedure AUTOREG • Modelování časových řad s autokorelovanou náhodnou složkou • Durbin-Watson test autokorelace 5/98 Data Analysis 65

PROC AUTOREG výstup 5/98 Data Analysis 67 PROC AUTOREG výstup 5/98 Data Analysis 67

Další modely v AUTOREG • Rozptyl náhodné složky – konstantní – proměnný rozptyl = Další modely v AUTOREG • Rozptyl náhodné složky – konstantní – proměnný rozptyl = generalized autoregressive conditional heteroscedasticity model GARCH(p, q) – (IGARCH, EGARCH, GARCH-in-mean) 5/98 Data Analysis 69

Procedura ARIMA • Box-Jenkinsova metodologie modelování časových řad – stacionární proces - vlastnosti řady Procedura ARIMA • Box-Jenkinsova metodologie modelování časových řad – stacionární proces - vlastnosti řady nezávisí na čase – po transformaci lze modelovat širokou škálu časových řad z praxe – existuje diagnostika napomáhající výběru modelu • lze pracovat i s více svázanými časovými řadami (ARIMAX modely) 5/98 Data Analysis 70

Modely v PROC ARIMA • proces klouzavých součtů – (Moving Average - MA(q) ) Modely v PROC ARIMA • proces klouzavých součtů – (Moving Average - MA(q) ) • autoregresní proces – (Auto. Regression AR(p) ) 5/98 Data Analysis 71

Modely v PROC ARIMA • smíšený proces – ( ARMA(p, q) ) • Integrovaný Modely v PROC ARIMA • smíšený proces – ( ARMA(p, q) ) • Integrovaný smíšený model – model ARMA(p, q) aplikovaný na d-té diference – ( ARIMA(p, q, d) ) 5/98 Data Analysis 72

Modelování sezónních vlivů pomocí ETS • Sezónní vlivy popsatelné ARIMA modely – sezónní autoregresní Modelování sezónních vlivů pomocí ETS • Sezónní vlivy popsatelné ARIMA modely – sezónní autoregresní model – aditivní sezónní model – multiplikativní sezónní model • Procedura X 11 pro popis sezónních vlivů – implementace programu X 11 U. S. Bureau of Census – složky: sezónní variace, dlouhodobý trend, vliv počtu pracovních dní – multiplikativní i aditivní dekompozice 5/98 Data Analysis 73

Vyrovnání sezonních cyklů • Výstup z procedury X 11 5/98 Data Analysis 74 Vyrovnání sezonních cyklů • Výstup z procedury X 11 5/98 Data Analysis 74

Nelineární modely (MODEL) • Nástroj pro – regresní analýzu – řešení – a předpovědi Nelineární modely (MODEL) • Nástroj pro – regresní analýzu – řešení – a předpovědi • obecné soustavy nelineárních rovnic s časovými řadami • možnosti odhadu korelační matice parametrů metodou Monte Carlo 5/98 Data Analysis 77

Použití procedury MODEL proc model data=uspop; pop = a / ( 1 + exp( Použití procedury MODEL proc model data=uspop; pop = a / ( 1 + exp( b - c * (year-1790) ) ); fit pop start=(a 1000 b 5. 5 c. 02)/ out=resid outpredict; run; 5/98 Data Analysis 78

Modely popsané stavovým prostorem (proc STATESPACE) • popis několika vzájemně provázaných časových řad • Modely popsané stavovým prostorem (proc STATESPACE) • popis několika vzájemně provázaných časových řad • • e = náhodný vektor x =vektor pozorování ; z=stavový vektor výstup i ve formě ARIMA modelu podmínkou je stacionarita řad (nebo nutno užít diference) • možnost omezení prvků matic F a G 5/98 Data Analysis 79

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML Modul SAS/OR Modul SAS/QC • Další produkty SAS Institute 5/98 Data Analysis 81

Modul SAS/IML - naprogramujte co jste vymysleli • programovací jazyk pro operace s maticemi Modul SAS/IML - naprogramujte co jste vymysleli • programovací jazyk pro operace s maticemi • rychlá a prověřená implementace pokročilých maticových operací a matematických metod • spolupráce s ostatními SAS System moduly • zahrnuje grafické rutiny (GKS) pro tvorbu vlastních grafických aplikací 5/98 Data Analysis 82

Příklad: IML program proc iml; start lreg; n=nrow(x) ; k=ncol(x); xpx=x`*x; xpy=x`*y; xpxi=inv(xpx); b=xpxi*xpy; Příklad: IML program proc iml; start lreg; n=nrow(x) ; k=ncol(x); xpx=x`*x; xpy=x`*y; xpxi=inv(xpx); b=xpxi*xpy; yhat=x*b; print , , "Fit", , b; resid=y-yhat; print , , "Results", , y yhat resid; finish lreg; 5/98 Data Analysis use glmtest; read all var {one x} into x; print x; read all var {y} into y; print y; run lreg; 83

Matice a IML • Maticové funkce – DET = determinantů ; INV = inverse Matice a IML • Maticové funkce – DET = determinantů ; INV = inverse – GINV = generalized matrix inversion (N*M) – HALF = Choleski dekompozice – SVD = singular value decomposition – SOLVE =řešení lin. soustavy – FFT, IFFT Fourierova transformace – EIGVEC = charakteristická čísloa matice – POLYROOT = řešení polynomu 5/98 Data Analysis 84

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML Modul SAS/OR Modul SAS/QC • Další produkty SAS Institute 5/98 Data Analysis 85

Modul SAS/OR (Operations Research) • LP - řešení problémů lineárního programování (včetně případů celočíselných Modul SAS/OR (Operations Research) • LP - řešení problémů lineárního programování (včetně případů celočíselných a smíšených vstupních parametrů) • NLP - řešení problémů nelineárního programování • NETFLOW- řešení problémů LP popsaných ohodnoceným orientovaným grafem • ASSIGN - řešení přiřazovacího problému 5/98 Data Analysis 86

Modul SAS/QC (Quality Control) • Sada procedur pro řízení procesu kontroly kvality – nástroje Modul SAS/QC (Quality Control) • Sada procedur pro řízení procesu kontroly kvality – nástroje na tvorbu a vyhodnocování diagramy kontroly kvality (Isikawa, Pareto, Shewhart) – procedury a interface pro návrh experimentů (ADX) • • částečné faktoriální návrhy ortogonální pole Taguchiho pole smíšené návrhy – procedury pro vyhodnocování exprimentů (ADX) • regrese, analýza variance, Bayesovské grafy 5/98 Data Analysis 89

Shewhart Control Chart • Speciální testy 5/98 Data Analysis 90 Shewhart Control Chart • Speciální testy 5/98 Data Analysis 90

ADX - Typy návrhů • Full or fractional factorial – with and without blocking ADX - Typy návrhů • Full or fractional factorial – with and without blocking factorial • • 5/98 Response Surface Mixture level Optimal design Data Analysis 91

ADX-Interaction plot 5/98 Data Analysis 92 ADX-Interaction plot 5/98 Data Analysis 92

ADX-Hledání optima 5/98 Data Analysis 93 ADX-Hledání optima 5/98 Data Analysis 93

SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS SAS System - analytické nástroje • Přehled SAS System software • Interaktivní nástroje SAS System - moduly SAS/ASSIST a SAS/INSIGHT • Programovací prostředí • Analytické moduly – – Modul SAS/STAT Modul SAS/ETS Modul SAS/IML (Modul SAS/OR Modul SAS/QC) • Další produkty SAS Institute 5/98 Data Analysis 94

JMP statistical software • „Statistics Made Visual“ • úplný statistický balík: – lin. a JMP statistical software • „Statistics Made Visual“ • úplný statistický balík: – lin. a nonlin. regrese – 2 D a 3 D grafy – statistické testy – návrh experimetů – analýza přežití – clustering • Funkčnost srovnatelná se statistickými moduly SAS System, chybí možnosti programování 5/98 Data Analysis 95

Další informace: • • • SAS Institute Praha Václavské náměstí 66 100 00 Praha Další informace: • • • SAS Institute Praha Václavské náměstí 66 100 00 Praha 1 Tel: +420 /2 22 21 20 64 E-mail: [email protected] sas. com • SAS Institute WEB site: • http: //www. sas. com 5/98 Data Analysis 96