puu rekonstrueerimise meetodid UPGMA

Скачать презентацию puu rekonstrueerimise meetodid UPGMA — unweighted pair

f225436729f820575c500e4e046cc84b.ppt

Количество слайдов: 39

puu rekonstrueerimise meetodid

UPGMA - unweighted pair group method with arithmetic means

üldkujul i j k m n Li 1998

TD - transformed distance method

UPGMA - (Sokal, Michener 1958)

puu harupikkuste hindamine 1 x z 3 Fitch-Margoliash’i meetod (1967) y 2

Fitch-Margoliash’i meetod (1967) haru pikkuste jaoks

890 bp mt. DNA HC: 73 transitsiooni 5 transversiooni (Brown et al. 1982)

distantsid K 2 mudeli j’rgi antud näite korral 6. 2

saadud tabel

vähimruutude (least squares, LS) meetod mittenegatiivsete haru pikkuste piiranguga d - vaadeldud kaugused e - patristilised (hinnangulised) kaugused kaalutud LS Fitch-Margoliash’i puhul

LS harupikkuste hinnangud, Nei, Rzhetsky (1992, 1993) algoritm

puu rekonstrueerimise meetodid

minimum evolution (ME) G H b 4 b 1 C b 2 O b 3 b 5 b 6 b 7 B -kõigi võimalikke puude seast (optimummeetod) valitakse väikseima S-ga puu -Arvutatavuse probleem kui järjestuste arv m suur -Suure m-i korral leidub ja leitakse miinimumpuu, mis on lühem kui tõeline, Sm

puu rekonstrueerimise meetodid

Neighbor Joining (NJ) meetod naabrid klastermeetod, mis ‘naabrite’ tuvastamisega miniseerib puu pikkust

algoritm

NJ meetod -konstrueerib vaid ühe puu -Kumar (1996) modifikatsioon käsitleb ka miinimumilähedasi Sij-sid -Võrreldes ME-ga NJ kiire algoritm ja sobilik suurte andmestike jaoks

MP puude otsingud Ockham’s razor Henning 1966 morfoloogilistele tunnustele Eck, Dayhoff 1966 aminohappelised järjestused arendused: Fitch 1971 Wiley 1981 Felsenstein 1982 PHYLIP Maddison 1992 Swofford, Begle 1993 PAUP, PAUP*

klastermeetod optimummeetod

Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga

igas positsioonis antud seisundite sobitamine etteantud puule

kaalude kasutamine

MP eksimused: -kui halvad (kvaliteedilt) andmed (informatiivsete positsioonide arv) või kui liiga vähe neid -ka suure informatsiooni hulgal aga väikese tippude arvu korral ‘telefoniposti’ ehk pika haru probleem, mille avastas Joe Felsenstein

MP probleem - ‘long branch attraction’ A C B D

MP probleem - ‘long branch attraction’ - leebem suurte puude korral

MP-informatiivsed positsioonid hunt karu rebane siil jänes A A A G G G mittevarieeruv positsioon (invariable site) hunt karu rebane siil jänes C C G C A C T A C A T T T C A C C T C G T G A G T C G T G mitteinformatiivne positsioon (non-informative site) C C T T G A A A C. . . + A C A T. . . + G T T C A C. . . + G C C T G T. . . + G C G T A T G T. . . + G C G vähemalt kaks vähemalt kahest erinevast

MP hinnagud hunt karu rebane siil jänes consistency index: ci=mi /si kus C C T T T G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G Tunnuste konflikt mi on minimaalne võimalik asenduste arv i-ndas positsioonis antud positsioonile kõige säästlikuma topoloogia korral si on minimaalne võimalik asenduste arv i-ndas positsioonis antud topoloogia korral H 5 5 R 2 S 2 K 1 34 CI=5/7=0. 71 J H J 5 4 1 5 R 2 3 S 4 3 CI=5/9=0. 55 Probleemiks long branch attraction 1 K

MP hinnagud hunt karu rebane siil jänes consistency index: alumine piir pole 0, rescaled RI: 5 5 R 2 S 2 K G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G gi on maksimaalne asenduste arv positsioonis, vastavlt tähttopoloogiale, kui keskel on kõige sagedasem täht retention index: H C C T T T 1 34 J RI=10 -7/10 -5=0. 6 RC=RI x CI=0. 43 H J 5 4 1 3 5 R 2 3 S 4 1 K RI=10 -9/10 -5=0. 2 RC=0. 11

Maximum Likelihood (ML) - suurima tõepära meetod otsib lähimat lahendit mudeli poolt eeldatavale

ML meetod -Olgu Pij(t) tõenäosus, et ühes antud positsioonis nukleotiid i asendub nukleotiidiga j hulgast {A, C, G, T} -Oodatud haru pikkus (v) on võrdeline aja (t) ja mutatsioonikiiruse (r) korrutisega v=rt -Haru pikkused on parameetrid mida hinnatakse tõepära maksimeerimisel vastavalt andmestiku nukleotiidsele koostisele ja asendusmustrile, vastavalt mudelile (JC, K 2, HKY, etc)

Maximum Likelihood (ML) - suurima tõepära meetod erinevalt MP meetodist vaadeldakse (mitte ei rekonstrueerita) kõiki võimalikke eellasseisundeid, nelja tipu korral 16 varianti

Maximum Likelihood (ML) - suurima tõepära meetod likelihood (tõepära): L=Pr(D/H) teoreetiliselt parim ln. L=-2064. 80 ln. L=-2691. 76 ln. L=-2424. 79 ln. L=-2075. 41

Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga igale positsioonile (5) F 81: v (6) gx 5 – tõenäosus, et 5 ndas sõlmes esines nukleotiid x; enamasti vastavalt järjestuse üldisele nukl. kompositsioonile. Maximum Likelihood (ML) - tõepära meetod

puid iseloomustavad efficiency - kiirus, arvutusaja suhtes power - võimsus, kui palju andmeid vajab consistency - kooskõlasus ‘õige’ puuga; ja suunitlus sellele andmete juurde toomisel robustness - tundlikkus kõrvalekallete suhtes esitatatvatele eeldustele falsifiability - ümberlükatavus, kontrollitavus n. kella eeldus