Скачать презентацию puu rekonstrueerimise meetodid UPGMA — unweighted pair Скачать презентацию puu rekonstrueerimise meetodid UPGMA — unweighted pair

f225436729f820575c500e4e046cc84b.ppt

  • Количество слайдов: 39

puu rekonstrueerimise meetodid puu rekonstrueerimise meetodid

UPGMA - unweighted pair group method with arithmetic means UPGMA - unweighted pair group method with arithmetic means

üldkujul i j k m n Li 1998 üldkujul i j k m n Li 1998

TD - transformed distance method TD - transformed distance method

UPGMA - (Sokal, Michener 1958) UPGMA - (Sokal, Michener 1958)

puu harupikkuste hindamine 1 x z 3 Fitch-Margoliash’i meetod (1967) y 2 puu harupikkuste hindamine 1 x z 3 Fitch-Margoliash’i meetod (1967) y 2

Fitch-Margoliash’i meetod (1967) haru pikkuste jaoks Fitch-Margoliash’i meetod (1967) haru pikkuste jaoks

890 bp mt. DNA HC: 73 transitsiooni 5 transversiooni (Brown et al. 1982) 890 bp mt. DNA HC: 73 transitsiooni 5 transversiooni (Brown et al. 1982)

distantsid K 2 mudeli j’rgi antud näite korral 6. 2 distantsid K 2 mudeli j’rgi antud näite korral 6. 2

saadud tabel saadud tabel

vähimruutude (least squares, LS) meetod mittenegatiivsete haru pikkuste piiranguga d - vaadeldud kaugused e vähimruutude (least squares, LS) meetod mittenegatiivsete haru pikkuste piiranguga d - vaadeldud kaugused e - patristilised (hinnangulised) kaugused kaalutud LS Fitch-Margoliash’i puhul

LS harupikkuste hinnangud, Nei, Rzhetsky (1992, 1993) algoritm LS harupikkuste hinnangud, Nei, Rzhetsky (1992, 1993) algoritm

puu rekonstrueerimise meetodid puu rekonstrueerimise meetodid

minimum evolution (ME) G H b 4 b 1 C b 2 O b minimum evolution (ME) G H b 4 b 1 C b 2 O b 3 b 5 b 6 b 7 B -kõigi võimalikke puude seast (optimummeetod) valitakse väikseima S-ga puu -Arvutatavuse probleem kui järjestuste arv m suur -Suure m-i korral leidub ja leitakse miinimumpuu, mis on lühem kui tõeline, Sm

puu rekonstrueerimise meetodid puu rekonstrueerimise meetodid

Neighbor Joining (NJ) meetod naabrid klastermeetod, mis ‘naabrite’ tuvastamisega miniseerib puu pikkust Neighbor Joining (NJ) meetod naabrid klastermeetod, mis ‘naabrite’ tuvastamisega miniseerib puu pikkust

algoritm algoritm

NJ meetod -konstrueerib vaid ühe puu -Kumar (1996) modifikatsioon käsitleb ka miinimumilähedasi Sij-sid -Võrreldes NJ meetod -konstrueerib vaid ühe puu -Kumar (1996) modifikatsioon käsitleb ka miinimumilähedasi Sij-sid -Võrreldes ME-ga NJ kiire algoritm ja sobilik suurte andmestike jaoks

MP puude otsingud Ockham’s razor Henning 1966 morfoloogilistele tunnustele Eck, Dayhoff 1966 aminohappelised järjestused MP puude otsingud Ockham’s razor Henning 1966 morfoloogilistele tunnustele Eck, Dayhoff 1966 aminohappelised järjestused arendused: Fitch 1971 Wiley 1981 Felsenstein 1982 PHYLIP Maddison 1992 Swofford, Begle 1993 PAUP, PAUP*

klastermeetod optimummeetod klastermeetod optimummeetod

Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga

igas positsioonis antud seisundite sobitamine etteantud puule igas positsioonis antud seisundite sobitamine etteantud puule

kaalude kasutamine kaalude kasutamine

MP eksimused: -kui halvad (kvaliteedilt) andmed (informatiivsete positsioonide arv) või kui liiga vähe neid MP eksimused: -kui halvad (kvaliteedilt) andmed (informatiivsete positsioonide arv) või kui liiga vähe neid -ka suure informatsiooni hulgal aga väikese tippude arvu korral ‘telefoniposti’ ehk pika haru probleem, mille avastas Joe Felsenstein

MP probleem - ‘long branch attraction’ A C B D MP probleem - ‘long branch attraction’ A C B D

MP probleem - ‘long branch attraction’ - leebem suurte puude korral MP probleem - ‘long branch attraction’ - leebem suurte puude korral

MP-informatiivsed positsioonid hunt karu rebane siil jänes A A A G G G mittevarieeruv MP-informatiivsed positsioonid hunt karu rebane siil jänes A A A G G G mittevarieeruv positsioon (invariable site) hunt karu rebane siil jänes C C G C A C T A C A T T T C A C C T C G T G A G T C G T G mitteinformatiivne positsioon (non-informative site) C C T T G A A A C. . . + A C A T. . . + G T T C A C. . . + G C C T G T. . . + G C G T A T G T. . . + G C G vähemalt kaks vähemalt kahest erinevast

MP hinnagud hunt karu rebane siil jänes consistency index: ci=mi /si kus C C MP hinnagud hunt karu rebane siil jänes consistency index: ci=mi /si kus C C T T T G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G Tunnuste konflikt mi on minimaalne võimalik asenduste arv i-ndas positsioonis antud positsioonile kõige säästlikuma topoloogia korral si on minimaalne võimalik asenduste arv i-ndas positsioonis antud topoloogia korral H 5 5 R 2 S 2 K 1 34 CI=5/7=0. 71 J H J 5 4 1 5 R 2 3 S 4 3 CI=5/9=0. 55 Probleemiks long branch attraction 1 K

MP hinnagud hunt karu rebane siil jänes consistency index: alumine piir pole 0, rescaled MP hinnagud hunt karu rebane siil jänes consistency index: alumine piir pole 0, rescaled RI: 5 5 R 2 S 2 K G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G gi on maksimaalne asenduste arv positsioonis, vastavlt tähttopoloogiale, kui keskel on kõige sagedasem täht retention index: H C C T T T 1 34 J RI=10 -7/10 -5=0. 6 RC=RI x CI=0. 43 H J 5 4 1 3 5 R 2 3 S 4 1 K RI=10 -9/10 -5=0. 2 RC=0. 11

Maximum Likelihood (ML) - suurima tõepära meetod otsib lähimat lahendit mudeli poolt eeldatavale Maximum Likelihood (ML) - suurima tõepära meetod otsib lähimat lahendit mudeli poolt eeldatavale

ML meetod -Olgu Pij(t) tõenäosus, et ühes antud positsioonis nukleotiid i asendub nukleotiidiga j ML meetod -Olgu Pij(t) tõenäosus, et ühes antud positsioonis nukleotiid i asendub nukleotiidiga j hulgast {A, C, G, T} -Oodatud haru pikkus (v) on võrdeline aja (t) ja mutatsioonikiiruse (r) korrutisega v=rt -Haru pikkused on parameetrid mida hinnatakse tõepära maksimeerimisel vastavalt andmestiku nukleotiidsele koostisele ja asendusmustrile, vastavalt mudelile (JC, K 2, HKY, etc)

Maximum Likelihood (ML) - suurima tõepära meetod erinevalt MP meetodist vaadeldakse (mitte ei rekonstrueerita) Maximum Likelihood (ML) - suurima tõepära meetod erinevalt MP meetodist vaadeldakse (mitte ei rekonstrueerita) kõiki võimalikke eellasseisundeid, nelja tipu korral 16 varianti

Maximum Likelihood (ML) - suurima tõepära meetod likelihood (tõepära): L=Pr(D/H) teoreetiliselt parim ln. L=-2064. Maximum Likelihood (ML) - suurima tõepära meetod likelihood (tõepära): L=Pr(D/H) teoreetiliselt parim ln. L=-2064. 80 ln. L=-2691. 76 ln. L=-2424. 79 ln. L=-2075. 41

Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga igale positsioonile (5) F 81: v (6) gx 5 – tõenäosus, et 5 ndas sõlmes esines nukleotiid x; enamasti vastavalt järjestuse üldisele nukl. kompositsioonile. Maximum Likelihood (ML) - tõepära meetod

puid iseloomustavad efficiency - kiirus, arvutusaja suhtes power - võimsus, kui palju andmeid vajab puid iseloomustavad efficiency - kiirus, arvutusaja suhtes power - võimsus, kui palju andmeid vajab consistency - kooskõlasus ‘õige’ puuga; ja suunitlus sellele andmete juurde toomisel robustness - tundlikkus kõrvalekallete suhtes esitatatvatele eeldustele falsifiability - ümberlükatavus, kontrollitavus n. kella eeldus