
intro_AAl.ppt
- Количество слайдов: 48
Курс «Биоинформатика» ф-т биоинженерии и биоинформатики МГУ А. В. Алексеевский. 1
Биоинформатика ≈ вычислительная молекулярная биология БИО – информатика • Цели и задачи – биологические • Результаты – биологические вычислительная МОЛЕКУЛЯРНАЯ биология • Объекты изучения – “биологические” молекулы и их “поведение”: • белки • ДНК • РНК • ……………. . 1 био – ИНФОРМАТИКА 2 • Создание и использование • баз данных • алгоритмов и программ • математических методов анализа данных 3 ВЫЧИСЛИТЕЛЬНАЯ молекулярная биология • Типичный объект – результаты массовых экспериментов: • последовательности • данные экспрессии генов • пространственные структуры больших молекул 2 • …………. . 4
CRISPRs (Clustered Regularly Interspaced Short Palindrome Repeats) История одного открытия
Инфекция и иммунитет • Бывают ли инфекционные болезни у бактерий? – Да • Кто заражает бактерии? – Бактериофаги, плазмиды из других бактерий • Есть ли “иммунитет” у бактерий? 4
Микрофотография бактериофага Т- 4 Схема бактериофага Т- 4 Заражение бактерии (схема). Клеточная стенка бактерии показана светло-коричневым, цитоплазма бактерии – коричневым, ДНК фага – желтым. 5
Как бактерии защищаются от вторжения чужеродной ДНК? • Один механизм изучен в 1960 -70 х г. г. (Нобелевская премия 1978 г. ): системы рестрикции-модификации • Другой открыт в 2007 г. : CRISPR 6
Открытие 1. • (1987) Ishino с соавторами обнаружили загадочную последовательность в ДНК кишечной палочки, штамм K 12. 7
Вот этот фрагмент последовательности ДНК E. coli. >ecoli_crispr 1 TGGGTTTGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTCCAAGTGATAT CCATCATCGCATCCAGTGCGCCCGGTTTATCCCCGCTGATGCGGGGAACACCAGCGTCAG GCGTGAAATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCTCGGTTCA GGCGTTGCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCGTAGTCC ATCATTCCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCCCGGGG GATAATGTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCTGGGC GGCTTGCAGCCAGCTCCAGCAGCGGTTTATCCCCGCTGGCGCGGGGAACTCAAGC TGGCAATCTCTTTCGGGGTGAGTCCGGTTTATCCCCGCTGGCGCGGGGAACTCTAG TTTCCGTATCTCCGGATTTATAAAGCTGACGGTTTATCCCCGCTGGCGCGGGGAACTCGC AGGCGGCGACGCGCAGGGTATGCGCGATTCGCGGTTTATCCCCGCTGGCGCGGGGAACTC GCGACCGCTCAGAAATTCCAGACCCGATCCAAACGGTTTATCCCCGCTGGCGCGGGGAAC TCTCAACATTATCAATTACAACCGACAGGGAGCCCGGTTTATCCCCGCTGGCGCGGGGAA CTCAGCGTGTTCGGCATCACCTTTGGCTTCGGCTGCGGTTTATCCCCGCTGGCGCGGGGA ACTCTGCGTGAGCGTATCGCCGCGCGTCTGCGAAAGCGGTTTATCCCCGCTGGCGCGGGG AACTCTCTAAAAGTATACATTTGTTCTTAAAGCATTTTTTCCCATAAAAACAACCCACCA ACCTTAATGTAACATTTCCTTATTATTAAAGATCAGCTAATTCTTTGTTTT 8
Выравнивание повторов Почему в названии CRISPR – Clustered Regularly Interspaced Short Palindromic Repeats есть слова “палиндромный повтор”? 9
Похожие повторы были найдены в геномах многих бактерий • • • (1993) Через 5 лет Groenen с соавторами нашел похожую последовательность в геноме палочки Коха Mycobacterium tuberculosis (1995) Mojica et al. нашел похожую последовательность в ДНК бактерий Haloferax volcanii и Haloferax mediterranei (1997) Goyal et al. использовали подобные последовательности для определения штамма бактерий. (2000) Mojica et al. нашли похожие последовательности в геномах многих бактерий и архей Разные авторы называли эти последовательности по разному: – – – TREPs SRSRs SPIDRs CRISPRs LCTRs 10
>AB 553331 Streptococcus dysgalactiae subsp. equisimilis DNA, CRISPR 2 gatgcaatccactcacccgcgaagggtgagacatccttgacgga catgccaaaatcagaacatttcaatccactcacccgcgaagggtgagac caagtaatcagttgagagcagtggattacaatatttcaatccact cacccgcgaagggtgagacagagataaagaattaacagaaaggcaggtt tataaaatttcaatccactcacccgcgaagggtgagacggtcgagaaag tagaatttgctaggttgcaatttcaatccactcacccgcgaaggg tgagacgaggaattgctccttgactttagcaagccacaagatatttcaa tccactcacccgcgaagggtgagactcttgactgtgatggagactatga gagagccagaatttcaatccactcacccgcgaagggtgagac 11
>DQ 072993 Streptococcus thermophilus strain JIM 8229 DNA, CRISPR repeat sequence. tagttaccgtataagatattcccaaacatctgatgaaaaacttttacagaaattt ttagaaagtaaggattgacaaggacagttattgtttttataatcactatgtgggt ataaaaacatcaaaatttcatttgaggtttttgtactctcaagatttaagtaact gtacaacgtacttcaaaggttctaactacataacacagtttttgtactctcaaga tttaagtaactgtacaactaaaaccagatggtggttcttctgatactagtttttg tactctcaagatttaagtaactgtacaaccattttcttcagtcaattcgttctca agcggtttttgtactctcaagatttaagtaactgtacaacaaaggacgggggcaa tgaacaaacgacaacgtttttgtactctcaagatttaagtaactgtacaactaat atcattgatagcttcatcaaaggctgtttttgtactctcaagatttaagtaactg tacaactaaattgttccttgactccgaactgccctgtttttgtactctcaagatt taagtaactgtacaacaatcgtttatcctcaaaggatggtttttgta ctctcaagatttaagtaactgtacaacataaaaaaacgcctcaaaaaccgagaca acgtttttgtactctcaagatttaagtaactgtacaacataaaaaaacgcctcaa aaaccgagacaacgtttttgtactctcaagatttaagtaactgtacagtttgatt caacttaaaaagccagttcaattgaacttggctttttaaaatacgcgatagacat aaggattgtcaggctgtccgacctctttaacttcagtcaaattgaggataggtag gctctgtttgagattttgatagta 12
>emblrelease|GU 192460 Dickeya sp. 409 CRISPR region genomic sequence. ccttcagcaccccttgttcctgcacttaatcaagatgagacgcagcgctgg cgccgccggccagccccagtaacagaatgagtgaaaaccgttttttcatga gagttccttgcaagcctgtcaggcaaaagcgccactgtagcatgccgtttc tgccgctgccggttttgacccttttcggcagctcataactaattgat ttttaatgacgaaaatattcgactttaaaaaagggttttccaggaaaaatc cagatttccctttaaaaatcagttaatagacgataaattgctacgtgttca ctgccgtgtaggcagcttagaaaaagacaggtaaagaaggtattatc tggcgttcactgccgtgtaggcagcttagaaaggcaaagccggtaagctcc gccgaacccgcaagttcactgccgtgtaggcagcttagaaaagattt ttgcgtccaagcgctgacgtcggttcactgccgcacaggcagagatt ggtttgctggcgttaaaaactacgctgaggtgggc 13
Сходство – одно из основных понятий биоинформатики Модильяни. Портреты Жанны Эбютернь. 1918 14
Открытие 2 • (2002) Jansen et al. обнаружили, что рядом с CRISPR на ДНК почти всегда закодированы похожие гены, названные cas. Современные данные о строении CRISPR кассеты. Схема ДНК. R - повтор S - участки между повторами L – участок между генами и CRISPR Остальные цилиндры - кодирующие последовательности 15
Высказывались разные гипотезы о функции CRISPR • CRISPR отвечают за – развитие бактерии (Thony-Meyer и Kaiser, 1993) – правильную дупликацию ДНК (репликацию) при делении бактерии (Mojica et al. , 1995) – исправление “ошибок” в ДНК (Makarova et al. , 2002). 16
Открытие 3 и Гипотеза • CRISPR содержат участки, очень похожие по последовательности на участки ДНК бактериофагов! (Bolotin et al. , 2005; Mojica et al. , 2005; Pourcel et al. , 2005) Все три группы исследователей предположили, что CRISPR служит для защиты от фагов • Makarova et al. , 2006, собрали все данные о CRISPR в геномах прокариот и обосновали эту гипотезу методами биоинформатики. 17
Доказательство гипотезы • Barrangou et al. (2007). Гипотеза доказана экспериментально: наличие в ДНК бактерии CRISP кассеты защищает бактерию от заражения бактериофагом (не любым, а тем, кусочек последовательности которого встроен в ДНК бактерии). • CRISPR/Cas система – активная прокариотическая иммунная система против бактериофагов и других видов чужеродной ДНК (He and Deem, 2010) 18
CRISPR открыты “на кончике пера” – с помощью анализа последовательностей ДНК и биоинформатики. Открытие (точнее, предсказание) подтверждено экспериментально. Сравните с открытием планеты Нептун математиками Леверье (Франции) и Адамсом (Англии), подтвержденное астрономами Галле и д’Аррестом 23 сентября 1846 года! 19
Современные представления о механизме действия CRISPR и Cas белков 20
“However, conservation of underlying principles of CRISPR immunity in different species was shown recently, by introduction of S. thermophilus CRISPR-3 into E. coli conferring heterologous protection against plasmid and phage” ( Sapranauskas, R. , Gasiunas, G. , Fremaux, C. , Barrangou, R. , Horvath, P. & Siksnys, V. (2011). The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic Acids Res) 21
Биоинформатика ≈ вычислительная молекулярная биология БИО – информатика • Цели и задачи – биологические • Результаты – биологические 1 био – ИНФОРМАТИКА 2 • Создание и использование • баз данных • алгоритмов и программ • математических методов анализа данных вычислительная МОЛЕКУЛЯРНАЯ 3 ВЫЧИСЛИТЕЛЬНАЯ молекулярная 4 биология • Объекты изучения – “биологические” молекулы и их “поведение”: • белки • ДНК • РНК • ……………. . биология • Типичный объект – результаты массовых экспериментов: • последовательности • данные экспрессии генов • пространственные структуры больших молекул 22 • …………. .
“Биологические” молекулы • • ДНК РНК Белок (другие…) 23
ДНК? РНК? Белок? 24
ДНК? РНК? Белок? 25
ДНК? РНК? Белок? 26
ДНК? РНК? Белок? 27
>AM 778197 t. RNA-Ala gene uagcuagucuaacccucgggagga cgguuaccacgggugugauucaug acuggggugaagucguaacaaggu agccguaggggaaccugcggcugg aucaccuccuuaaucgaagacauc accgucgccacaaguucccacacg aauugcuugauucauugcgaagac gauugggucuguagggcaguuggu ugga ДНК? РНК? Белок? 28
agcttttcattctgactgcaacgggcaatatgtctctgtgtggatta aaaaaagagtgtctgatagcagcttctgaactggttacctgccgtga gtaaattaaaattttattgacttaggtcactaaatactttaaccaat ataggcatagcgcacagataaaaattacagagtacacaacatc catgaaacgcattagcaccaccattaccaccaccattacca caggtaacggtgcgggctgacgcgtacaggaaacacagaaaaaagcc cgcacctgacagtgcgggctttttcgaccaaaggtaacgaggt aacaaccatgcgagtgttgaagttcggcggtacatcagtggcaaatg cagaacgttttctgcgtgttgccgatattctggaaagcaatgccaggggcaggtggccaccgtcctctctgcccccgccaaaatcaccaa ccacctggtggcgatgattgaaaaaaccattagcggccaggatgctt tacccaatatcagcgatgccgaacgtatttttgccgaacttttgacg ggactcgccgccgcccagccggggttcccgctggcgcaattgaaaac tttcgtcgatcaggaatttgcccaaataaaacatgtcctgcatggca ttagtttgttggggcagtgcccggatagcatcaacgctgatt tgccgtggcgagaaaatgtcgatcgccattatggccggcgtattaga agcgcgcggtcacaacgttactgttatcgatccggtcgaaaaactgc tggcagtggggcattacctcgaatctaccgtcgatattgctgagtcc acccgccgtattgcggcaagccgcattccggctgatcacatggtgct gatggcaggtttcaccgccggtaatgaaaaaggcgaactggtggtgc ttggacgcaacggttccgactactctgctgcggtgctgcctgt ttacgcgccgattgttgcgagatttggacgg ДНК? РНК? Белок? 29
ДНК? РНК? Белок? 30
ДНК? РНК? Белок? 31
ДНК? РНК? Белок? 32
>2 POR PORIN EVKLSGDARMGVMYNGDDWNFSSRSRV LFTMSGTTDSGLEFGASFKAHESVGAE TGEDGTVFLSGAFGKIEMGDALGASEA LFGDLYEVGYTDLDDRGGNDIPYLTGD ERLTAEDNPVLLYTYSAGAFSVAASMS DGKVGETSEDDAQEMAVAAAYTFGNYT VGLGYEKIDSPDTALMADMEQLELAAI AKFGATNVKAYYADGELDRDFARAVFD LTPVAAAATAVDHKAYGLSVDSTFGAT TVGGYVQVLDIDTIDDVTYYGLGASYD LGGGASIVGGIADNDLPNSDMVADLGV KFKF ДНК? РНК? Белок? 33
ДНК? РНК? Белок? 34
ДНК? РНК? Белок? 35
ДНК? РНК? Белок? 36
ДНК? РНК? Белок? 37
ДНК? РНК? Белок? 38
ДНК >AE 3172 DNA fragment gtacacaacatccatgaaacgca ttagcaccaccattaccaccacc atcaccattaccacaggtaacgg tgcgggctgacgcgtacaggaaa cacagaaaaaagcccgcacctga cagtgcgggcttt РНК >AM 778197 t. RNA-Ala uagcuagucuaacccucggga ggacgguuaccacggguguga uucaugacuggggugaagucg uaacaagguagccguagggga accugcggcuggaucaccucc uuaaucgaagacaucaccguc Белок >2 POR PORIN EVKLSGDARMGVMYNGDDW NFSSRSRVLFTMSGTTDSG LEFGASFKAHESVGAETGE DGTVFLSGAFGKIEMGDAL 39
Словарь • • • Ген Белок Экспрессия Геном Протеом 40
Следующее занятие начнется с контрольной на 5 минут Что нужно уметь для контрольной (будут подсказки, но за использование балл снижается): 1) 2) 3) 4) Дана короткая последовательности ДНК. Написать последовательность комплементарной цепочки. Последовательность какой из двух комплементарных цепочек ДНК записывают в банке данных? Оценить объём всех известных последовательностей белков Оценить объём оперативной памяти обычного персонального компьютера 41
Структура курса Семестр Информатика I Биоинформатика Компьютерная грамотность II Последовательности белков III Последовательности и структуры нуклеиновых кислот IV Программирование V Эволюция нуклеиновых кислот и белков Теория алгоритмов + программирование VI Алгоритмы биоинформатики VII Геномика Пространственные структуры белков 42
Курсовые работы • 4 курсовых — (II-IV, V-VI, VII-VIII, IX-X семестры) • Курсовая работа выполняется в одной из лабораторий ФББ или НИИФХБ (по договоренности студента с руководителем – тьютором) • Темы см. на сайте kodomo; новые будут объявлены в декабре • Куратор курсовых – Л. Зиновкина 43
• Учебный сайт по биоинформатике: http: //kodomo. fbb. msu. ru/wiki далее по ссылкам 44
Правила зачёта Темы Блок 2 Блок 3 Форма Отчета Linux (чуть) FAR Manager 2 Миниконтрольная Internet 2 Миниконтрольные HTML Блок 1 Число занятий 2 Отчет (на персональной страничке в интернет) Excel 3 Отчет в формате *. xls 5 1. Контрольное занятие по Ras. Mol 2. Отчет в формате HTML Ras. Mol Дата предъявления отчета 21 декабря — проставление зачета при наличии зачётов по трем блокам Ведётся сквозной рейтинг по биоинформатике. Он учитывается в рекомендациях, даваемых преподавателями студентам. 45
Не стесняйтесь спрашивать! 46
УДАЧИ! 47
Внимание! Придумайте себе пользовательское имя (например, «tanya_s» или «greatlion 89» ) и пароль. Требования к имени: только строчные латинские буквы, цифры, знак подчеркивания, точка и дефис. Первым символом должна быть буква. Требования к паролю: 1) без русских букв (иначе будут проблемы, связанные с кодировками!); 2) не короче 8 символов; 3) не должен содержать в себе пользовательское имя или его заметную часть; 4) не должен являться английским словом; 5) желательно включать хотя бы одну цифру и хотя бы одну 48 букву.
intro_AAl.ppt