Скачать презентацию Seqüenciamento e montagem do genoma humano e análise Скачать презентацию Seqüenciamento e montagem do genoma humano e análise

a23ed1f33baeed14e61ec8d090f52590.ppt

  • Количество слайдов: 41

Seqüenciamento e montagem do genoma humano e análise de transcriptoma Seqüenciamento e montagem do genoma humano e análise de transcriptoma

Seqüenciamento do Genoma Humano • Embate: Consórcio público x Celera genomics: – Consórcio público: Seqüenciamento do Genoma Humano • Embate: Consórcio público x Celera genomics: – Consórcio público: mapeamento físico, shotgun hieráriquico. – Celera genomics: whole genome shotgun • Em fevereiro de 2001 foi publicada de forma independendente versão draft ou preliminar ambos grupos.

Seqüenciamento do Genoma Humano • 2003: Consórcio público apresenta versão final do seqüenciamento do Seqüenciamento do Genoma Humano • 2003: Consórcio público apresenta versão final do seqüenciamento do genoma humano – Comprimento total: 3 bilhões pb – 99% deste total foi seqüenciado – Erro de seqüenciamento estimado em 1/10. 000 nt – 99. 9% não apresenta diferenças entre indivíduos. – 25. 000 genes – Genes codificadores de proteínas correspondem a apenas 2% do genoma – 50 % do genoma consiste de regiões repetitivas (D. melanogaster 3%, C. elegans 7%)

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) Genoma Biblioteca genômica Plasmídeo (inserto Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) Genoma Biblioteca genômica Plasmídeo (inserto 10 kb) BAC (inserto 100 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs AGCGTTACAAC Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs AGCGTTACAAC AGCGTTACAAC Contig

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig BAC contendo inserto de maior comprimento Contig

Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Celera Genomics – Iniciativa privada Whole genome shotgun (WGS) – Montagem Mate pairs Contig Mate pairs Scaffold Contig

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 Kb) Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 Kb) Fragmento cromossômico Biblioteca genômica em BAC

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 Kb) Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 Kb) Fragmento cromossômico Biblioteca genômica em BAC

Consórcio público Mapeamento físico, shotgun hierárquico Montagem BAC Biblioteca Plasmídeo (inserto 10 kb) Leituras Consórcio público Mapeamento físico, shotgun hierárquico Montagem BAC Biblioteca Plasmídeo (inserto 10 kb) Leituras ou reads Seqüenciamento das extremidades do inserto

Consórcio público Mapeamento físico, shotgun hierárquico Montagem Mate pairs AGCGTTACAAC AGCGTTACAAC Contig Consórcio público Mapeamento físico, shotgun hierárquico Montagem Mate pairs AGCGTTACAAC AGCGTTACAAC Contig

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb) Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb) Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb) Consórcio público Mapeamento físico, shotgun hierárquico Cromossomo Biblioteca genômica em BAC (inserto 100 kb)

Avaliação de estratégias de seqüenciamento Vantagens WGS • Estratégia mais simples com menos etapas. Avaliação de estratégias de seqüenciamento Vantagens WGS • Estratégia mais simples com menos etapas. Vantagens Shotgun Hierárquico • Menos vulnerável que a estratégia WGS em relação a montagem de regiões repetitivas.

Avaliação de estratégias de seqüenciamento Repetições no genoma Processo de montagem é suscetível a Avaliação de estratégias de seqüenciamento Repetições no genoma Processo de montagem é suscetível a erros quando empregado em genomas com alto índice de repeticões. Genoma Montagem Cenário I X X X WGS: Montagem de 3 bilhões de bases (todo genoma). Shotgun hierárquico: Montagem de 100 mil bases (inserto de cada BAC).

In silico In silico

Base-calling • Geração de uma seqüência de nucleotídeos através da análise dos chromatogramas PHRED Base-calling • Geração de uma seqüência de nucleotídeos através da análise dos chromatogramas PHRED gaattcggcacgagagttctcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttc ccgccactttgctcgcctgcgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgt ttttgttgtcgttgttgcagcaatagtagaggacgggcgctttttgtcaagagaaagggggagggg cgtactaccgctttatcgaggttggtattatttcttataaagggaaagagcaacgtgaagcgggtaa gggaagagtgaaagtcgag

Mascaramento • Eliminar fragmentos de vetor cross_match >5’ gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcag gaattcggcacgagagttc tcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctg cgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca >3’ gcaatagtagaggacgggcgctttttgtcaagagaaagggggaggggcgtactaccgctttatcga Mascaramento • Eliminar fragmentos de vetor cross_match >5’ gctccaccgcggtggcggccgctctagaactagtggatcccccgggctgcag gaattcggcacgagagttc tcccggagacgctccgtgcgaagattatggaggccgtcaatgtggtcggttcccgccactttgctcgcctg cgcatcgatgtaacagtccgtggtgacgaagtcataccgttaagtattacgtttttgttgtcgttgttgca >3’ gcaatagtagaggacgggcgctttttgtcaagagaaagggggaggggcgtactaccgctttatcga ggttggtattatttcttataaagggaaagagcaacgtgaagcgggtaagggaagagtgaaa gtcgag ggggggcccggtacccaattc

Montagem • Produzir uma seqüência contígua através de seqüências menores que possuam regiões de Montagem • Produzir uma seqüência contígua através de seqüências menores que possuam regiões de sobreposição PHRAP, Celera Assembler, Arachne leituras contig

Anotação • Localizar na seqüencia genômica final: • Genes que codificam proteínas e RNAs Anotação • Localizar na seqüencia genômica final: • Genes que codificam proteínas e RNAs não traduzidos (t. RNA, r. RNA, sn. RNA) • Determinar, se possível, o produto provável de cada gene encontrado. • Associar cada gene à uma categoria funcional ou via metabólica. Ex. : síntese de lipídeos, maquinaria de tradução, fosforilação oxidativa, etc.

Anotação Streptococcus pneumoniae R 6 Anotação Streptococcus pneumoniae R 6

Anotação Automática contig Glimmer RBSfinder Gene. Mark t. RNAscan CDS Anotação Automática contig Glimmer RBSfinder Gene. Mark t. RNAscan CDS

Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual PSORT Interpro

BLAST (Basic Local Alignment Search Tool) Bancos de seqüências COG > SEQ 1 atgggcacgagagttctcccggagac BLAST (Basic Local Alignment Search Tool) Bancos de seqüências COG > SEQ 1 atgggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg KEGG BLAST Gen. Bank Nucleotídeos Gen. Bank Proteínas

BLAST (Basic Local Alignment Search Tool) ØAldolase Trypanosoma cruzi. . 1. . 2. . BLAST (Basic Local Alignment Search Tool) ØAldolase Trypanosoma cruzi. . 1. . 2. . 3. . 4. . 5. . 6. . 7. . 8. . 9. . 10 acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt BLAST it!

Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual PSORT Interpro

Interpro • Procura na seqüências por domínios, assinaturas ou motivos conhecidos. • Se utiliza Interpro • Procura na seqüências por domínios, assinaturas ou motivos conhecidos. • Se utiliza de outros bancos de domínios para produzir seu relatório final. PFAM, SMART, PROSITE, etc ØAldolase Trypanosoma cruzi. . 1. . 2. . 3. . 4. . 5. . 6. . 7. . 8. . 9. . 10 acaagctggagctcccgcggtggtcggcgctctagaactagtggatcccccgggctgcaggaattcggcacgagaacaacttcaaccgcgtctggaaggc gccacgccgcccgtttgagaaggaacgccttgaccgcgagatgaaactctgcggccagtacggccttcngttgcaacgcgtgagatttggcgccgtgaac atgacgctctccaagatgcgtcgtaccgcccgtctgttgttgacgttgccggagaaccacccgcgccggcagctggagggttccgccatcatgcgccgct gccacgactacggcttcctcgagggggggcccggtacccaattcgccctatagtgagtcgtattacannattcactggccgntnntttacaacgtc gntnngactgggnannaaaccctggnnncgttacccaacttaatcgcctt Interpro

Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual Anotação Automática BLAST contra KEGG BLAST contra COG BLAST contra Gen. Bank Anotação manual PSORT Interpro

Anotação Streptococcus pneumoniae R 6 Anotação Streptococcus pneumoniae R 6

Sabiá System for Automated Bacterial Integrated Annotation • LNCC – Coordenação do Projeto Genoma Sabiá System for Automated Bacterial Integrated Annotation • LNCC – Coordenação do Projeto Genoma Brasileiro • Gerenciamento de todos softwares de Base-calling, Mascaramento, Montagem e Anotação automática. • Disponibilização da Anotação automática dos resultados via Web possibilitando a realização da Anotação manual por pesquisadores distribuídos geograficamente. Exemplo Sabiá Mapa Antes Mapa Depois

Análise do transcriptoma Projetos que precedem seqüenciamento do genoma nuclear: • Identificação de novos Análise do transcriptoma Projetos que precedem seqüenciamento do genoma nuclear: • Identificação de novos genes. • Estimativa do perfil de expressão da linhagem celular, estágio de desenvolvimento ou tecido avaliado

Transcrição e Transcriptoma EST RNA total 5’ CAP cístron Poli A 3’ m. RNA Transcrição e Transcriptoma EST RNA total 5’ CAP cístron Poli A 3’ m. RNA

Transcrição e Transcriptoma EST Poli A c. DNA Poli A Vetor + c. DNA Transcrição e Transcriptoma EST Poli A c. DNA Poli A Vetor + c. DNA

Transcrição e Transcriptoma EST ~ 800 pb Vetor c. DNA completo Sequenciamento extremidades 5’ Transcrição e Transcriptoma EST ~ 800 pb Vetor c. DNA completo Sequenciamento extremidades 5’ 3’ Vetor 5’ 3’ Poli A Vetor

Transcrição e Transcriptoma EST X EST 5’ 3’ Poli A 5’ Vetor 3’ Poli Transcrição e Transcriptoma EST X EST 5’ 3’ Poli A 5’ Vetor 3’ Poli A 5’ 3’ X X Vetor Remoção Sequencia de vetor (cross_match, Lucy) Remoção Poli A (Script Perl)

Análise do transcriptoma EST – Anotação 5’ 3’ Bancos de seqüências >clone_23 5’ ggcacgagagttctcccggagac Análise do transcriptoma EST – Anotação 5’ 3’ Bancos de seqüências >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg Gen. Bank Nucleotídeos BLASTX E BLASTN Gen. Bank Proteínas clone_23 5’ = amastina

Análise do transcriptoma EST – Anotação >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg = amastina Análise do transcriptoma EST – Anotação >clone_23 5’ ggcacgagagttctcccggagac gctccgtgcgaagattatggagg ccgtcaatgtggtcggttcccg ccactttgctcgcctg = amastina Agrupamento de seqüência similares ou agrupamento via anotação Número de ESTs Anotação 4 amastina 6 Tc. MUC II

Transcrição e Transcriptoma de amastigotas Transcrição e Transcriptoma de amastigotas

Transcrição e Transcriptoma de amastigotas Transcrição e Transcriptoma de amastigotas