768fd643c57eaf4112aa4ef746c31782.ppt
- Количество слайдов: 37
Институт биоорганической химии им. академиков М. М. Шемякина и Ю. А. Овчинникова Лаборатория структуры и функций генов человека Использование NGS в анализе транскриптомов бактерий на примере микобактерий Тимофей Скворцов Москва 2013
I. Бактериальный транскриптом и NGS
Бактериальный транскриптом Содержание основных классов РНК в транскриптоме Размер генома типичной бактерии: Масса РНК в одной бактериальной клетке: ≈5 млн п. о. ≈0. 1 -0. 2 пг
Сложность бактериального транскриптома транс-малые РНК цис-малые РНК (Toledo-Arana and Solana, 2010, Bioessays)
Сложность бактериального транскриптома Рибопереключатели Длинные НТО Перекрывающиеся НТО Безлидерные РНК (Guell et al. , 2011, Nat Rev Microbiol) (Toledo-Arana and Solana, 2010, Bioessays)
Сложность бактериального транскриптома Альтернативная транскрипция Влияние хроматина и структуры нуклеоидов на регуляцию транскрипции Эпигенетические модификации Локализованная трансляция Сплайсинг РНК Полиаденилирование РНК (Guell et al. , 2011, Nat Rev Microbiol) Редактирование РНК Процессинг РНК
Упрощенная схема анализа транксриптома бактерий Выделение РНК Синтез к. ДНК Пробоподготовка и секвенирование @read 1 GCATGATCGTA + 9: ; <=>? @ABC РНК Бактерии • • • Культура In vivo/in planta Некультивированные образцы • • Обогащение Фракционирование Фрагментирование Модификации Данные NGS к. ДНК • • • Амплификация Модификации Фракционирование • • • Платформа Мультиплексирование Paired end/Single end sequencing
Схема анализа данных NGS FASTQ file(s) Контроль качества FASTQC Фильтрация ридов Удаление адаптерных последовательностей FASTX toolkit IGV, Artemis Картирование ридов Bowtie, BWA, SOAP, Tophat etc. Визуализация SAM/BAM file(s) Качественный анализ Фильтрация Дедупликация Различные программы GTF/GFF/BED file(s) reference genome FASTA file SAMtools, Picard tools Количественный анализ edge. R, DESeq, bayseq etc. Gene set enrichment анализ GOSeq, GSEA, DAVID etc.
Бактериальный транскриптом Выявление функциональных особенностей генома (Sorek and Cossart, 2010, Nat Rev Genet)
Бактериальный транскриптом Поиск дифференциально экспрессирующихся генов Нормализация: RPKM/FPKM, TMM etc. Сравнение: edge. R, DESeq, DEGSeq, bayseq, NOISeq etc. Условие 1 Условие 2 Ген 1 Ген 2 Ген 3
II. Качественное описание бактериального транскриптома на примере Mycobacterium avium
Mycobacterium avium Согласно современной таксономической классификации, род Mycobacterium включает более 60 видов и более 100 подвидов. Mycobacterium avium Условно-патогенные микобактерии. Вызывают диссеминированные инфекции у людей с иммунодефицитами. Возможно вызывает болезнь Крона. Mycobacterium avium внутри макрофагов Mycobacterium avium paratuberculosis вызывают болезнь Джонса у жвачных животных.
Новые малые РНК Mycobacterium avium Положение s. RNA-кандидатов в геноме Нами были обнаружены 4 кандидатных малых РНК Mycobacterium avium, 3 из них были гомологичны уже известным малым РНК M. tuberculosis. MAV_1034 -1035 не имеет гомологии в геноме M. tuberculosis и обладает стабильной вторичной структурой (RNAfold). (Ignatov et al. 2010)
Mycobacterium avium – транскриптом in vitro Мы провели RNA-seq (Illumina) транскриптома M. avium subsp. avium TMC 724 из культуральной среды в mid-log фазе клеточного роста. Было получено ≈42 млн ридов, 28. 2 млн ридов было картировано на геном M. avium. 0. 2 млн 1% Representation of functional classes among the genes with the highest expression (top 10% of genes ranked by their RPKM values) 4. 4 млн 16% 3. 6 млн 13% Transport and binding proteins Unknown function Central intermediary metabolism Mobile and extrachromosomal element. . . Fatty acid and phospholipid metabolism Amino acid biosynthesis Cell envelope DNA metabolism Cellular processes Energy metabolism Purines, pyrimidines, nucleosides, and. . . Biosynthesis of cofactors, prosthetic groups, . . . Signal transduction Regulatory functions Protein fate Transcription Protein synthesis 18. 8 млн 70% reads mapped to r. RNA operon reads mapped to CDS (antisense orientation) reads mapped to IGR -3 -2 -1 0 1 2 3 4 5 (Ignatov et al. , unpublished results)
Mycobacterium avium – транскриптом in vitro Точки старта транскрипции (TSS) § Для 844 генов были определены точки старта транскрипции (TSS), для 652 из них в 5 -8 п. о. upstream от TSS были найдены консенсусные промотерные последовательности. § 33% из предполагаемых TSS были картированы в ± 3 п. о. от старт-кодонов соответствующих генов, что говорит в пользу того, что их м. РНК являются безлидерными. Визуализация картирования ридов на геном (Artemis) § Для остальных генов 5’-НТО были от 3 до 728 п. о. в длину, среднее значение – 83 п. о. 6 из этих генов имели в составе 5’-НТО рибопереключатели, из них 3 – лидерные последовательности ykok, Mg 2+-сенсоров, контролирующих экспрессию белковтранспортеров ионов магния. (Ignatov et al. , unpublished results)
Mycobacterium avium – транскриптом in vitro Антисмысловая транскрипция § Нами было выявлено 86 кандидатных антисмысловых РНК, протяженностью от одного до нескольких генов. § Также было обнаружено 10 кандидатных транс-малых РНК, 4 из которых не имели гомологии с геномом M. tuberculosis. Малая РНК MAV_1034 -1035 представляет особый интерес для дальнейшего изучения, т. к. обладает высоким уровнем экспрессии и не имеет гомологии с геномом M. tuberculosis. (Ignatov et al. , unpublished results)
III. Сравнительный анализ транскриптомов бактерий на примере Mycobacterium tuberculosis
Mycobacterium tuberculosis Патогенные микобактерии, возбудители туберкулеза. Примерно 30% населения Земли инфицировано M. tuberculosis. Туберкулез уносит каждый год около 1. 5 млн человеческих жизней (больше, чем рак легкого). Mycobacterium tuberculosis
Mycobacterium tuberculosis – дормантное состояние Активные MTB Овоидные формы MTB (По Chao and Rubin, 2010, Annu Rev Microbiol) (Shleeva et al. , 2011, Tuberculosis)
Поиск дифференциально экспрессирующихся генов Мы провели сравнение транскриптомов M. tuberculosis H 37 Rv в дормантном состоянии (Dorm) и логарифмической фазе роста (Log). Секвенирование проводилось на платформе Illumina, в биологических трипликатах. Репликат Число прочтений, картированных прочтений на геном 1 раз Dorm 1 27 913 346 9 019 444 (32%) Dorm 2 7 352 103 6 007 569 (82%) Dorm 3 13 973 841 11 803 273 (85%) Log 1 18 798 208 10 422 051 (55%) Log 2 17 736 079 15 828 832 (89%) Log 3 11 046 464 9 914 746 (90%) (Ignatov et al. , unpublished results)
Поиск дифференциально экспрессирующихся генов Вычисление корреляции между репликатами. D 1 Dorm 2 Dorm 3 Log 1 Log 2 Log 3 D 2 D 3 L 1 L 2 L 3 1 0, 85 1 0, 86 0, 88 1 0, 77 0, 61 1 0, 74 0, 63 0, 64 0, 95 1 0, 71 0, 62 0, 93 0, 99 D 1_AS D 2_AS D 3_AS L 1_AS L 2_AS L 3_AS Dorm 1_AS 1 Dorm 2_AS 0, 74 1 Dorm 3_AS 0, 77 0, 74 1 Log 1_AS 0, 65 0, 53 1 Log 2_AS 0, 65 0, 54 0, 57 0, 93 1 Log 3_AS 0, 61 0, 52 0, 54 0, 91 0, 97 1 1 Мы вычислили корреляционный коэффициент Спирмена для выявления сходимости репликатов. Сходимость результатов внутри групп была высокой (до 0, 99) и превышала межгрупповую. Для антисмысловых транскриптов (AS) сходимость была ниже, тем не менее оставаясь значимой. (Ignatov et al. , unpublished results)
Поиск дифференциально экспрессирующихся генов Top 30 генов с повышенной экспрессией при переходе в Dorm Gene PE_PGRS 17 PE_PGRS 10 Rv 0789 c Rv 3424 c Rv 2662 Rv 1405 c Rv 2013 Rv 3428 c Description PE-PGRS family protein PE_PGRS 17 PE-PGRS family protein PE_PGRS 10 Hypothetical protein Putative methyltransferase Transposase Possible transposase fad. D 18 cut 1 PE_PGRS 18 PPE 39 bpo. A Rv 0841 Rv 2656 c gal. K PE_PGRS 49 Rv 1403 c Rv 0612 lpq. X PE_PGRS 56 PE_PGRS 27 PE_PGRS 25 PE_PGRS 34 PE_PGRS 50 PE_PGRS 3 PE_PGRS 54 Probable fatty-acid-Co. A ligase Fad. D 18 Probable cutinase Cut 1 PE-PGRS family protein PE_PGRS 18 PPE family protein PPE 39 Possible peroxidase Bpo. A (non-haem peroxidase) Probable conserved transmembrane protein Possible Phi. Rv 2 prophage protein Probable galactokinase Gal. K (galactose kinase) PE-PGRS family protein PE_PGRS 49 Putative methyltransferase Conserved hypothetical protein Probable lipoprotein Lpq. X PE-PGRS family protein PE_PGRS 56 PE-PGRS family protein PE_PGRS 27 PE-PGRS family protein PE_PGRS 25 PE-PGRS family protein PE_PGRS 34 PE-PGRS family protein PE_PGRS 50 PE-PGRS family protein PE_PGRS 3 PE-PGRS family protein PE_PGRS 54 Мы применили программу edge. R для поиска генов, чья относительная представленность транскриптов которых внутри каждого из транскриптомов увеличилась/уменьшилась. 890 генов увеличает экспрессию при переходе в дормантное состояние (Dorm), при это снижается экспрессия 939 генов (Ignatov et al. , unpublished results)
Поиск дифференциально экспрессирующихся генов Анализ категорий генной онтологии (Gene Ontology, GO) и представленности генов (Gene Set Enrichment Analysis, GSEA) был предпринят при помощи программы GOseq. Обогащено в Dorm Обогащено в Log Категория PE-PGRS F 0 F 1 -type ATP synthase Common Pathway For Synthesis of Aromatic Compounds (DAHP synthase to chorismate) Respiratory Complex I DNA repair, bacterial Rec. BCD pathway Ribosome SSU bacterial Chorismate Synthesis Ribosome LSU bacterial Arginine Biosynthesis extended TCA Cycle (Ignatov et al. , unpublished results)
IV. Перспективы транскриптомики бактерий
Перспективные направления РНК-белковые взаимодействия Модификации РНК (Guell et al. , 2011, Nat Rev Microbiol) Вторичная структура РНК Альтернативная транскрипция
Перспективные направления Пространственная организация (локализомика) Секвенирование транскриптома одной клетки (Guell et al. , 2011, Nat Rev Microbiol) (Campos and Jacobs-Wagner, 2013, Curr Opin Microbiol) (Raj and van Oudenaarden, 2008, Cell)
Наш коллектив ИБХ РАН • Ажикина Т. Л. • Игнатов Д. В. • Скворцов Т. А. ЦНИИТ РАМН МГУ, кафедра биотехнологии Институт биохимии им. А. Н. Баха РАН • Апт А. С. • Майоров К. Б. • Малахо С. Г. • Капрельянц А. С. • Салина Е. Г.
Спасибо за внимание
Сложность бактериального транскриптома
Сложность бактериального транскриптома
Сложность бактериального транскриптома Малые РНК бактерий
Сложность бактериального транскриптома
Инфекционный цикл туберкулеза Излечение Трансмиссия Латентная инфекция ≈2 000 000 человек Смерть ≈2 000 случаев в год Стерилизация инфекции Активный туберкулез (вероятность – 10% в течение жизни) ≈10 000 случаев в год
Mycobacterium avium – транскриптом in vitro (Ignatov et al. , unpublished results)
Схема анализа
Новые малые РНК Mycobacterium avium Положение s. RNA-кандидатов в геноме Нами были обнаружены 4 кандидатных малых РНК Mycobacterium avium, 3 из них были гомологичны уже известным малым РНК M. tuberculosis. MAV_1034 -1035 не имеет гомологии в геноме M. tuberculosis и обладает стабильной вторичной структурой (RNAfold). (Ignatov et al. 2010)
Поиск дифференциально экспрессирующихся генов В Dorm клетках содержится в ≈100 раз меньше м. РНК, чем в Log. Мы применили программу edge. R для поиска генов, чья относительная представленность внутри каждого из транскриптомов увеличилась/уменьшилась. (Loven et al. , 2012, Cell)
768fd643c57eaf4112aa4ef746c31782.ppt