![Скачать презентацию puu rekonstrueerimise meetodid UPGMA — unweighted pair Скачать презентацию puu rekonstrueerimise meetodid UPGMA — unweighted pair](https://present5.com/wp-content/plugins/kama-clic-counter/icons/ppt.jpg)
f225436729f820575c500e4e046cc84b.ppt
- Количество слайдов: 39
puu rekonstrueerimise meetodid
UPGMA - unweighted pair group method with arithmetic means
üldkujul i j k m n Li 1998
TD - transformed distance method
UPGMA - (Sokal, Michener 1958)
puu harupikkuste hindamine 1 x z 3 Fitch-Margoliash’i meetod (1967) y 2
Fitch-Margoliash’i meetod (1967) haru pikkuste jaoks
890 bp mt. DNA HC: 73 transitsiooni 5 transversiooni (Brown et al. 1982)
distantsid K 2 mudeli j’rgi antud näite korral 6. 2
saadud tabel
vähimruutude (least squares, LS) meetod mittenegatiivsete haru pikkuste piiranguga d - vaadeldud kaugused e - patristilised (hinnangulised) kaugused kaalutud LS Fitch-Margoliash’i puhul
LS harupikkuste hinnangud, Nei, Rzhetsky (1992, 1993) algoritm
puu rekonstrueerimise meetodid
minimum evolution (ME) G H b 4 b 1 C b 2 O b 3 b 5 b 6 b 7 B -kõigi võimalikke puude seast (optimummeetod) valitakse väikseima S-ga puu -Arvutatavuse probleem kui järjestuste arv m suur -Suure m-i korral leidub ja leitakse miinimumpuu, mis on lühem kui tõeline, Sm
puu rekonstrueerimise meetodid
Neighbor Joining (NJ) meetod naabrid klastermeetod, mis ‘naabrite’ tuvastamisega miniseerib puu pikkust
algoritm
NJ meetod -konstrueerib vaid ühe puu -Kumar (1996) modifikatsioon käsitleb ka miinimumilähedasi Sij-sid -Võrreldes ME-ga NJ kiire algoritm ja sobilik suurte andmestike jaoks
MP puude otsingud Ockham’s razor Henning 1966 morfoloogilistele tunnustele Eck, Dayhoff 1966 aminohappelised järjestused arendused: Fitch 1971 Wiley 1981 Felsenstein 1982 PHYLIP Maddison 1992 Swofford, Begle 1993 PAUP, PAUP*
klastermeetod optimummeetod
Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga
igas positsioonis antud seisundite sobitamine etteantud puule
kaalude kasutamine
MP eksimused: -kui halvad (kvaliteedilt) andmed (informatiivsete positsioonide arv) või kui liiga vähe neid -ka suure informatsiooni hulgal aga väikese tippude arvu korral ‘telefoniposti’ ehk pika haru probleem, mille avastas Joe Felsenstein
MP probleem - ‘long branch attraction’ A C B D
MP probleem - ‘long branch attraction’ - leebem suurte puude korral
MP-informatiivsed positsioonid hunt karu rebane siil jänes A A A G G G mittevarieeruv positsioon (invariable site) hunt karu rebane siil jänes C C G C A C T A C A T T T C A C C T C G T G A G T C G T G mitteinformatiivne positsioon (non-informative site) C C T T G A A A C. . . + A C A T. . . + G T T C A C. . . + G C C T G T. . . + G C G T A T G T. . . + G C G vähemalt kaks vähemalt kahest erinevast
MP hinnagud hunt karu rebane siil jänes consistency index: ci=mi /si kus C C T T T G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G Tunnuste konflikt mi on minimaalne võimalik asenduste arv i-ndas positsioonis antud positsioonile kõige säästlikuma topoloogia korral si on minimaalne võimalik asenduste arv i-ndas positsioonis antud topoloogia korral H 5 5 R 2 S 2 K 1 34 CI=5/7=0. 71 J H J 5 4 1 5 R 2 3 S 4 3 CI=5/9=0. 55 Probleemiks long branch attraction 1 K
MP hinnagud hunt karu rebane siil jänes consistency index: alumine piir pole 0, rescaled RI: 5 5 R 2 S 2 K G A A C C C T T A A A G G C T T . . . . + + + A G G C T C C C A T C G G gi on maksimaalne asenduste arv positsioonis, vastavlt tähttopoloogiale, kui keskel on kõige sagedasem täht retention index: H C C T T T 1 34 J RI=10 -7/10 -5=0. 6 RC=RI x CI=0. 43 H J 5 4 1 3 5 R 2 3 S 4 1 K RI=10 -9/10 -5=0. 2 RC=0. 11
Maximum Likelihood (ML) - suurima tõepära meetod otsib lähimat lahendit mudeli poolt eeldatavale
ML meetod -Olgu Pij(t) tõenäosus, et ühes antud positsioonis nukleotiid i asendub nukleotiidiga j hulgast {A, C, G, T} -Oodatud haru pikkus (v) on võrdeline aja (t) ja mutatsioonikiiruse (r) korrutisega v=rt -Haru pikkused on parameetrid mida hinnatakse tõepära maksimeerimisel vastavalt andmestiku nukleotiidsele koostisele ja asendusmustrile, vastavalt mudelile (JC, K 2, HKY, etc)
Maximum Likelihood (ML) - suurima tõepära meetod erinevalt MP meetodist vaadeldakse (mitte ei rekonstrueerita) kõiki võimalikke eellasseisundeid, nelja tipu korral 16 varianti
Maximum Likelihood (ML) - suurima tõepära meetod likelihood (tõepära): L=Pr(D/H) teoreetiliselt parim ln. L=-2064. 80 ln. L=-2691. 76 ln. L=-2424. 79 ln. L=-2075. 41
Maximum Parsimony (MP) - säästu meetod sõlmedes tunnusseisundite (character states) rekonstrueerimine minimaalse sammude arvuga igale positsioonile (5) F 81: v (6) gx 5 – tõenäosus, et 5 ndas sõlmes esines nukleotiid x; enamasti vastavalt järjestuse üldisele nukl. kompositsioonile. Maximum Likelihood (ML) - tõepära meetod
puid iseloomustavad efficiency - kiirus, arvutusaja suhtes power - võimsus, kui palju andmeid vajab consistency - kooskõlasus ‘õige’ puuga; ja suunitlus sellele andmete juurde toomisel robustness - tundlikkus kõrvalekallete suhtes esitatatvatele eeldustele falsifiability - ümberlükatavus, kontrollitavus n. kella eeldus