46b570abc970eb8c60949ddcbf3d9e9d.ppt
- Количество слайдов: 31
Вводная лекция Курс «Биоинформатика» ф-т биоинженерии и биоинформатики МГУ А. Б. Рахманинова, 3/IX – 2007, использованы материалы лекции С. А. Спирина, 2006
Что такое биоинформатика? Не так давно. . . . "Эта область, недавно признанная научной дисциплиной, имела много названий: в Германии и США - парапсихология, во Франции мета-психика, в СССР - биоинформатика" /Годфруа Ж. Что такое психология? Т. 1, 1992/ ". . . современные целители-сенситивы в основном подразделяются на две категории: биоэнергетики и биоинформатики. Информатики, . . . , при диагностике не применяют энергию, не тратят ее. . . . " /Интернет. . . /
Что такое биоинформатика? Совсем не давно. . . . Биоинформатика. Биоинформационные и биоэнергоинформационные технологии ("БЭИТ-2001"): Докл. 4 -го Междунар. конгр. Т. 1, ч. 1. Барнаул: Изд-во Алт. ГТУ, 2001. Названия некоторых статей: "Способ и устройство для усиления интуиции" "Биолокационный портрет человека" Из рекламы книги издания 2005 г. : ". . . основные сведения в области современной биоинформатики науки, изучающей низкоинтенсивные полевые взаимодействия вещества (преимущественно электромагнитные) на взаимосвязанных иерархических уровнях - от субклеточного до организменного и межорганизменного. "
Что такое биоинформатика? • Исследование информационных процессов в биологических системах (клетках, организме, популяции) • Изучение и внедрение в компьютерную науку «биологических» методов анализа информации (нейросетей, генетических алгоритмов, нечеткой логики и др. ) • Применение компьютерных методов для решения биологических задач Биоинформатика = вычислительная молекулярная биология
Что такое биоинформатика? Почему так сузился смысл термина? В конце 1970 -х годов был открыт относительно быстрый и дешёвый метод расшифровки последовательности оснований в ДНК выделение Организм секвенирование ДНК «в пробирке» . . . CGCCATAAATCAC. . . Последовательность
gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct ctgcatctgaagccgctgaagttctactaagggtggataacatcatccgtgcaagaccaa gaaccgccaatagacaacatatgtaacatatttaggatatacctcgaaaataataaaccg ccacactgtcattattataattagaaacagaacgcaaaaattatccactatataattcaa agacgcgaaaaagaacaacgcgtcatagaacttttggcaattcgcgtcacaaataa attttggcaacttatgtttcctcttcgagcagtactcgagccctgtctcaagaatgtaat aatacccatcgtaggtatggttaaagatagcatctccacaacctcaaagctccttgccga gagtcgccctcctttgtcgagtaattttcacttttcatatgagaacttattttcttattc tttactctcacatcctgtagtgattgacactgcaacagccaccatcactagaagaacaga acaattacttaatagaaaaattatatcttcctcgaaacgatttcctgcttccaacatcta cgtatatcaagaagcattcacttaccatgacacagcttcagatttcattattgctgacag ctactatatcactactccatctagtagtggccacgccctatgaggcatatcctatcggaa aacaataccccccagtggcaagagtcaatgaatcgtttacatttcaaatttccaatgata cctataaatcgtctgtagacagctcaaataacatacaattgcttcgacttaccga gctggctttcgtttgactctagttctagaacgttctcaggtgaaccttcttctgacttac tatctgatgcgaacaccacgttgtatttcaatgtaatactcgagggtacggactctgccg acagcacgtctttgaacaataccaatttgttgttacaaaccgtccatctcgc tatcgtcagatttcaatctattggcgttgttaaaaaactatggttatactaacggcaaaa acgctctgaaactagatcctaatgaagtcttcaacgtgacttttgaccgttcaatgttca ctaacgaagaatccattgtgtcgtattacggacgttctcagttgtataatgcgccgttac ccaattggctgttcttcgattctggcgagttgaagtttactgggacggcaccggtgataa actcggcgattgctccagaaacaagctacagttttgtcatcatcgctacagacattgaag gattttctgccgttgaggtagaattcgaattagtcatcggggctcaccagttaactacct ctattcaaaatagtttgataatcaacgttactgacacaggtaacgtttcatatgacttac ctctaaactatgtttatctcgatgacgatcctatttcttctgataaattgggttctataa
Для хранения все возрастающей информации о последовательностях ДНК в 1982 году был основан Gen. Bank — хранилище последовательностей нуклеиновых кислот в виде компьютерных файлов. Объем Gen. Bank’а: 1982 – 680 338 букв в 606 последовательностях Август 2007 – 79 525 559 650 букв в 76 146 236 последовательностях, только файлы с последовательностями "весят" 299 Gb
Банки структурной биологической информации Gen. Bank, EMBL, DDBJ Архивные базы последовательностей нуклеиновых кислот Tr. EMBL Автоматическая база предсказаний последовательностей белков PDB Архивная база пространственных структур макромолекул Ref. Seq Автоматическая база различных последовательностей НК Swiss. Prot Курируемая база последовательностей белков Pfam, Pro. Site, Inter. Pro, . . . Банки семейств белков И многие другие. . .
Задачи биоинформатики ü Создание компьютерных программ для облегчения работы с биологическими данными. Разработка алгоритмов для анализа большого объема биологических данных. – Создание банка данных аминокислотных последовательностей – Алгоритм поиска генов в геноме
gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct ctgcatctgaagccgctgaagttctactaagggtggataacatcatccgtgcaagaccaa gaaccgccaatagacaacatatgtaacatatttaggatatacctcgaaaataataaaccg ccacactgtcattattataattagaaacagaacgcaaaaattatccactatataattcaa agacgcgaaaaagaacaacgcgtcatagaacttttggcaattcgcgtcacaaataa attttggcaacttatgtttcctcttcgagcagtactcgagccctgtctcaagaatgtaat aatacccatcgtaggtatggttaaagatagcatctccacaacctcaaagctccttgccga gagtcgccctcctttgtcgagtaattttcacttttcatatgagaacttattttcttattc tttactctcacatcctgtagtgattgacactgcaacagccaccatcactagaagaacaga acaattacttaatagaaaaattatatcttcctcgaaacgatttcctgcttccaacatcta cgtatatcaagaagcattcacttaccatgacacagcttcagatttcattattgctgacag ctactatatcactactccatctagtagtggccacgccctatgaggcatatcctatcggaa aacaataccccccagtggcaagagtcaatgaatcgtttacatttcaaatttccaatgata cctataaatcgtctgtagacagctcaaataacatacaattgcttcgacttaccga gctggctttcgtttgactctagttctagaacgttctcaggtgaaccttcttctgacttac tatctgatgcgaacaccacgttgtatttcaatgtaatactcgagggtacggactctgccg acagcacgtctttgaacaataccaatttgttgttacaaaccgtccatctcgc tatcgtcagatttcaatctattggcgttgttaaaaaactatggttatactaacggcaaaa acgctctgaaactagatcctaatgaagtcttcaacgtgacttttgaccgttcaatgttca ctaacgaagaatccattgtgtcgtattacggacgttctcagttgtataatgcgccgttac ccaattggctgttcttcgattctggcgagttgaagtttactgggacggcaccggtgataa actcggcgattgctccagaaacaagctacagttttgtcatcatcgctacagacattgaag gattttctgccgttgaggtagaattcgaattagtcatcggggctcaccagttaactacct ctattcaaaatagtttgataatcaacgttactgacacaggtaacgtttcatatgacttac ctctaaactatgtttatctcgatgacgatcctatttcttctgataaattgggttctataa
gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct ctgcatctgaagccgctgaagttctactaagggtggataacatcatccgtgcaagaccaa gaaccgccaatagacaacatatgtaacatatttaggatatacctcgaaaataataaaccg ccacactgtcattattataattagaaacagaacgcaaaaattatccactatataattcaa agacgcgaaaaagaacaacgcgtcatagaacttttggcaattcgcgtcacaaataa attttggcaacttatgtttcctcttcgagcagtactcgagccctgtctcaagaatgtaat aatacccatcgtaggtatggttaaagatagcatctccacaacctcaaagctccttgccga gagtcgccctcctttgtcgagtaattttcacttttcatatgagaacttattttcttattc tttactctcacatcctgtagtgattgacactgcaacagccaccatcactagaagaacaga acaattacttaatagaaaaattatatcttcctcgaaacgatttcctgcttccaacatcta cgtatatcaagaagcattcacttaccatgacacagcttcagatttcattattgctgacag ctactatatcactactccatctagtagtggccacgccctatgaggcatatcctatcggaa aacaataccccccagtggcaagagtcaatgaatcgtttacatttcaaatttccaatgata cctataaatcgtctgtagacagctcaaataacatacaattgcttcgacttaccga gctggctttcgtttgactctagttctagaacgttctcaggtgaaccttcttctgacttac tatctgatgcgaacaccacgttgtatttcaatgtaatactcgagggtacggactctgccg acagcacgtctttgaacaataccaatttgttgttacaaaccgtccatctcgc tatcgtcagatttcaatctattggcgttgttaaaaaactatggttatactaacggcaaaa acgctctgaaactagatcctaatgaagtcttcaacgtgacttttgaccgttcaatgttca ctaacgaagaatccattgtgtcgtattacggacgttctcagttgtataatgcgccgttac ccaattggctgttcttcgattctggcgagttgaagtttactgggacggcaccggtgataa actcggcgattgctccagaaacaagctacagttttgtcatcatcgctacagacattgaag gattttctgccgttgaggtagaattcgaattagtcatcggggctcaccagttaactacct ctattcaaaatagtttgataatcaacgttactgacacaggtaacgtttcatatgacttac ctctaaactatgtttatctcgatgacgatcctatttcttctgataaattgggttctataa
gatcctccatatacaacggtatctccacctcaggtttagatctcaacaacggaaccattg ccgacatgagacagttaggtatcgtcgagagttacaagctaaaacgagcagtagtcagct ctgcatctgaagccgctgaagttctactaagggtggataacatcatccgtgcaagaccaa gaaccgccaatagacaacatatgtaacatatttaggatatacctcgaaaataataaaccg ccacactgtcattattataattagaaacagaacgcaaaaattatccactatataattcaa agacgcgaaaaagaacaacgcgtcatagaacttttggcaattcgcgtcacaaataa attttggcaacttatgtttcctcttcgagcagtactcgagccctgtctcaagaatgtaat aatacccatcgtaggtatggttaaagatagcatctccacaacctcaaagctccttgccga gagtcgccctcctttgtcgagtaattttcacttttcatatgagaacttattttcttattc tttactctcacatcctgtagtgattgacactgcaacagccaccatcactagaagaacaga acaattacttaatagaaaaattatatcttcctcgaaacgatttcctgcttccaacatcta cgtatatcaagaagcattcacttaccatgacacagcttcagatttcattattgctgacag ctactatatcactactccatctagtagtggccacgccctatgaggcatatcctatcggaa aacaataccccccagtggcaagagtcaatgaatcgtttacatttcaaatttccaatgata cctataaatcgtctgtagacagctcaaataacatacaattgcttcgacttaccga gctggctttcgtttgactctagttctagaacgttctcaggtgaaccttcttctgacttac tatctgatgcgaacaccacgttgtatttcaatgtaatactcgagggtacggactctgccg acagcacgtctttgaacaataccaatttgttgttacaaaccgtccatctcgc tatcgtcagatttcaatctattggcgttgttaaaaaactatggttatactaacggcaaaa acgctctgaaactagatcctaatgaagtcttcaacgtgacttttgaccgttcaatgttca ctaacgaagaatccattgtgtcgtattacggacgttctcagttgtataatgcgccgttac ccaattggctgttcttcgattctggcgagttgaagtttactgggacggcaccggtgataa actcggcgattgctccagaaacaagctacagttttgtcatcatcgctacagacattgaag gattttctgccgttgaggtagaattcgaattagtcatcggggctcaccagttaactacct ctattcaaaatagtttgataatcaacgttactgacacaggtaacgtttcatatgacttac ctctaaactatgtttatctcgatgacgatcctatttcttctgataaattgggttctataa
Задачи биоинформатики ь ь Создание компьютерных программ для облегчения работы с большими объемами биологических данных. – Создание банка данных аминокислотных последовательностей Анализ и интерпретация данных о нуклеотидных и аминокислотных последовательностях. – Алгоритмы сравнения (выравнивания) последовательностей – Реконструкция филогенетических деревьев
Задачи биоинформатики ь ь ь Создание компьютерных программ для облегчения работы с большими объемами биологических данных. – Создание банка данных аминокислотных последовательностей Анализ и интерпретация данных о нуклеотидных и аминокислотных последовательностей. – Алгоритмы сравнения (выравнивания) последовательностей – Реконструкция филогенетических деревьев Анализ и интерпретация данных о структуре молекул белков, структуре комплексов молекул белков с другими молекулами. – Изучение структуры активного центра белка
Основные объекты современной биоинформатики • Последовательности нуклеиновых кислот • Последовательности белков • Пространственные структуры макромолекул (белков, ДНК и РНК) и их комплексов (друг с другом и с малыми молекулами)
Методы работы • Доступ к банкам через Интернет • Использование специальных программ on -line (через web-интерфейс) • Использование стандартных (e. g. Excel) и специальных программ на сервере института или на персональном компьютере • Создание собственных скриптов ( «сценариев» ) и программ
Биоинформатика и её связи с другими дисциплинами Информатика (в том числе теория алгоритмов) Теория вероятностей и математическая статистика Биоинформатика (компьютерная молекулярная биология) Молекулярная биология
Две составных части биоинформатики как учебного предмета: ь Практическая биоинформатика: что надо знать о компьютерных методах биологуэкспериментатору ь Профессиональная подготовка компьютерных биологов (последние могут быть как исследователями накопленного экспериментального материала, так и разработчиками алгоритмов)
Структура курса
Курсовые проекты ь 3 проекта — (II-III, IV-V, VI-VII семестры) ь Курсовой проект не обязательно биоинформатический ь Темы проектов будут объявлены в декабре ь Куратор проектов – А. В. Алексеевский Поговорите со студентами старших курсов, с теми, кто уже защищал свои проекты : )
Дополнительно ь учебный сайт: http: //kodomo. fbb. msu. ru/FBB ь есть научный семинар для студентов, следите за объявлениями. . .
Внимание! Вам необходимо к следующему занятию получить учётную запись для работы в домене компьютерного класса. Для этого придумайте себе пользовательское имя (например, «tanya_s» или «greatlion 89» ) и пароль. Требования к имени: только строчные латинские буквы, цифры, знак подчеркивания, точка и дефис. Первым символом должна быть буква. Требования к паролю: 1) без русских букв (иначе будут проблемы, связанные с кодировками!); 2) не короче 8 символов; 3) не должен содержать в себе пользовательское имя или его заметную часть; 4) не должен являться английским словом; 5) желательно включать хотя бы одну цифру и хотя бы одну букву.
Чем будем заниматься в этом семестре • Выравнивать уровень владения компьютером • Приобретать необходимый минимум навыков работы с наиболее употребительными программами (Far, MS-Excel, MS-Word) • Привыкать к биологическим объектам (последовательностям и 3 D-структурам белков), выполняя простейшие работы с ними • Приобретать необходимый минимум навыков работы в Интернете
Структура первого семестра Темы 1 Миниконтрольная на занятии № 3 17. 09 Internet 2 — 2 Отчет в формате HTML до 10. 10 Excel 4 Миниконтрольная Отчет в формате *. xls 29. 10 до 7. 11 Chem. Sketch Блок 3 Дата предъявления отчета HTML Блок 2 Форма отчета FAR Manager Блок 1 Число занятий 1 — 5 1. Контрольное занятие по Ras. Mol 2. Отчет в формате HTML Ras. Mol 3. 12 до 17. 12 24 декабря— получение зачета Официальный зачёт по итогам семестра проставляется «автоматом» при наличии зачётов по всем блокам. Ведётся рейтинг студентов (неофициальный, но кое-где будет учитываться. . . )
Внимание! Большую часть работы придётся выполнять самостоятельно! Тем не менее рекомендуется делать возможно больше на занятиях — чтобы иметь возможность спрашивать преподавателей в случае затруднений. Не стесняйтесь спрашивать! Мы здесь для того, чтобы вам помогать.
Из чего состоит персональный компьютер • • Системный блок Монитор Клавиатура Мышь
Главные функциональные детали компьютера • • Блок питания Материнская плата Процессор Оперативная память Жёсткий диск BIOS Адаптеры внешних устройств
C D HDD AGP (видеокарта) BIOS Super I/O South bridge North bridge (ROM, ПЗУ) CPU (процессор) Сетевая карта CMOS (ОЗУ) USB RAM (ОЗУ)
Работа компьютера состоит в выполнении (последовательном или одновременном) различных компьютерных программ (по-английски software, в отличие от hardware — «материальный состав» компьютера). На жаргоне компьютерщиков программы называются «софт» , а материальный состав — «железо» . Те программы, которые выполняют какую-то нужную для человека работу (то есть ту работу, для которой, собственно, и предназначен компьютер), называются обычно «приложения» Для успешной работы компьютера необходим ряд системных программ, в том числе операционная система.
Операционная система (ОС) — программа, управляющая запуском приложений и позволяющая человеку ( «пользователю» ) общаться с компьютером Мы будем иметь дело с двумя различными операционными системами: • Windows XP (семейство Microsoft Windows) • Linux (семейство UNIX) Первое время — в основном с Windows.
46b570abc970eb8c60949ddcbf3d9e9d.ppt