Таня Мараховская секвенирование.pptx
- Количество слайдов: 31
«Метод важнее открытия, ибо правильный метод приводит к новым, еще более ценным открытиям» Лев Давидович Ландау
• «Война и мир» Л. Н. Толстого составляет 2, 5 миллионов букв • У бактерии 2 – 5 миллионов букв информации • У человека в каждой клетке • 6 миллиардов букв
NGS (Next Generation Sequencing) - секвенирование следующего поколения
Геном был секвенирован: 1980 - Бактериофаг φ-X 174 1998 – нематода Caenorhabditis elegans 2000 – дрозофила 1981 – геном митохондрии человека 2002 – мышь 2003 – завершение проекта «Геном человека» 2004 – крыса 1995 – бактерия Haemophilus influenzae 2005 - шимпанзе 2010 – платяная вошь …. 1997 – дрожжи Saccharomyces cerevisiae
Производительность секвенирования стремительно и неуклонно растет. Здесь образовался свой «закон Мура» , который в легкую бьет родительский закон, согласно которому производительность компьютеров возрастает в два раза каждые два года. Стоимость секвенирования падает в три раза ежегодно!
Терминология NGS • геном - совокупность генов, локализованных в гаплоидном наборе хромосом данного организма • аннотация генома - описание функциональных и структурных характеристик генома; местонахождение кодирующих участков генов в геноме, регуляторных элементов, регулирующих транскрипцию и другие функции генома, особенностей функционирования генома, в частности тканеснецифичности экспрессии генов, так называемых профилей их экспрессии, взаимосвязей между генами и других функциональных свойств генома • референсный геном – секвенированный, собранный и проаннотированный геном организма того же вида, к которому относится анализируемый образец • ресеквенирование – секвенирование генома вида, для которого существует референсный геном • секвенирование de novo – секвенирование генома вида, для которого нет референсного генома
Терминология NGS • библиотека – совокупность фрагментов ДНК анализируемого образца, фланкированная техническими последовательностями (адаптерами), необходимыми для секвенирования. • чтение (рид) –— подстрока генома, полученная в результате секвенирования • покрытие (глубина секвенирования) – число чтений, содержащих тот или иной нуклеотид генома (или транскрипта) (принято 50 прочтений, возможно и 250) • сборка – восстановление непрерывной последовательности участка генома (или транскрипта) путем наложения перекрывающихся чтений • одиночные риды - фрагменты читают только с одного конца • парные риды - один и тот же фрагмент читают с двух сторон
Из презентации М. Логачевой, лаборатория эволюционной геномики ФББ МГУ https: //drive. google. com/file/d/0 B_x. Xd. HGFR 3 Tq. Mlpa. UF 9 l. R 3 p. UZWI 1 NFRs. Vj. Rz. Nlk 1 bl 9 YQ 0 Jr/view
Еще в 50 -е годы прошлого века были разработаны методы, позволяющие определять последовательность аминокислот в полипептидной цепи. А как же вырожденность генетического кода? Как узнать генетический состав интронов?
Фредерик Сэнгер (1918 – 2013) Дважды лауреат Нобелевской премии: в 1958 г. по химии за расшифровку первичной структуры инсулина — полипептида, состоящего всего лишь из 51 аминокислоты и за метод секвенирования ДНК (1980)
Секвенирование по Сэнгеру (метод обрыва цепи)
Секвенирование по Сэнгеру (метод обрыва цепи) Ф. Сэнгер
Секвенирование по Сэнгеру (метод обрыва цепи) • Таким способом удавалось прочесть 300, а впоследствии и до 1000 нуклеотидов с одного комплекта реакций. • Определение последовательности одного гена занимало от одного до нескольких человеко-месяцев.
Проект «Геном человека» • Сама идея прочитать геном человека родилась в 1986 г. • Проект начался в 1990 году, под руководством Джеймса Уотсона под эгидой Национальной организации здравоохранения США (NIH). • Стоимость проекта была оценена в 3 миллиарда долларов, а сам проект был рассчитан на 15 лет при участии в проекте целого ряда стран: Китай, Германия, Франция, Великобритания и Япония • Был использован геном 5 доноров: 2 мужчин и 3 женщин – афроамериканец, азиато-китаец, латиноамериканец-мексиканец, 2 европеоида.
Проект «Геном человека» • Использовали секвенирование по Сэнгеру. • Максимальная точность секвенирования, но дорого и долго. • Ученый Крейг Вентер и его компания Celera Genomics, основанная в 1998 г. , сыграли примерно такую же роль в истории геномики, как Советский Союз повлиял на полет американцев на луну. • В 2001 г. был опубликован предварительный вариант генома • В 2003 г. было объявлено об окончании проекта
Что стало известно? • Ожидалось, что обнаружится не меньше 100 тысяч генов, однако разные компьютерные программы насчитали в геноме человека от 21 000 до 39 000 генов (разница связана с тем, что можно было задавать критерии c разной степенью строгости). • Была получена исключительно интересная информация о вовлеченности генов в развитие и функционирование отдельных органов и тканей организма человека. Оказалось, что самое большое количество генов необходимо для формирования мозга и поддержания его активности (3 195 генов), а самое маленькое - для образования эритроцитов – всего 8. • 1, 5% ДНК – экзоны • 20 -25% - интроны • 99% - некодирующая ДНК ( «мусорная» ДНК) • Больш. Ая часть ДНК – разнообразные повторы
Полный индивидуальный геном Джеймс Уотсон Геном Уотсона содержал 3. 3 миллиона однобуквенных замен по сравнению с аннотированным геномом человека, из которых более 10 000 вели к изменениям в белках, которые кодируют его гены. Геном Уотсона обошелся в 1 миллион долларов Крейг Вентер Между одним и другим набором хромосом внутри одного человека существует около 3 миллионов однобуквенных нуклеотидных отличий, не считая огромного количества крупных варьирующих участков.
Секвенирование Illumina ОБРАТИМСЯ К ВИДЕО
Секвенирование Illumina: возможности Самая распространенная из технологий NGS (~ 80% всех данных) платформа Hi. Seq 2000 Hi. Seq 2500 Mi. Seq длина чтения 100+100 150+150 300+300 число чтений, М 2 500 600 15 -25 объем данных 600 Гб 120 15 Гб цена за запуск/цена за Мб (в $) 23 470/0. 04 6 145/0. 05 1600/0. 14 время работы 11 дней 40 часов 65 часов Hi. Seq 2000 и Hi. Seq 2500 – модификации одного и того же прибора. Mi. Seq существует также в варианте Mi. Seq. Dx – первый NGS-прибор, разрешенный для использования в диагностике. Из презентации М. Логачевой, лаборатория эволюционной геномики ФББ МГУ https: //drive. google. com/file/d/0 B_x. Xd. HGFR 3 Tq. Mlpa. UF 9 l. R 3 p. UZWI 1 NFRs. Vj. Rz. Nlk 1 bl 9 YQ 0 Jr/view
Illumina – преимущества и недостатки Преимущества: Недостатки • высокая точность (частота • высокая цена реагентов ошибок 0. 1 -0. 5%) • проблемы с секвенированием матриц • универсальность с низкой сложностью • доступность ПО для • большая длительность обработки и анализа прогона результатов • ошибки в GC-богатых • наименьшая цена участках получаемых данных (в расчете на нуклеотид) Из презентации М. Логачевой, лаборатория эволюционной геномики ФББ МГУ https: //drive. google. com/file/d/0 B_x. Xd. HGFR 3 Tq. Mlpa. UF 9 l. R 3 p. UZWI 1 NFRs. Vj. Rz. Nlk 1 bl 9 YQ 0 Jr/view
Области применения NGS What can next generation sequencing do for you? • секвенирование геномов и транскриптомов de novo отправная точка большинства молекулярно-биологических и генетических исследований на немодельных объектах, поиск крупных геномных перестроек • полногеномное ресеквенирование поиск мутаций, ассоциированных с болезнями, картирование генов • направленное ресеквенирование биомедицина: скрининг мутаций с известной ролью в развитии болезней и поиск новых мутаций • ДНК-белковые и ДНК-ДНКовые взаимодействия поиск сайтов связывания транскрипционных факторов • метагеномика анализ разнообразия микробных сообществ • анализ транскриптома сравнение уровней экспрессии, поиск новых генов и изоформ
Как секвенировать транскриптом? Некоторые особенности: • число транскриптов, как правило, больше числа генов • 90 -95% всех РНК клетки – рибосомные РНК (от них желательно избавиться!) тотальная РНК фрагментация (фрагменты длиной 100 -300) синтез 2 цепи к. ДНК отбор целевой фракции синтез 1 цепи комплементарная ДНК (к. ДНК) дальше так же, как с геномной ДНК Из презентации М. Логачевой, лаборатория эволюционной геномики ФББ МГУ https: //drive. google. com/file/d/0 B_x. Xd. HGFR 3 Tq. Mlpa. UF 9 l. R 3 p. UZWI 1 NFRs. Vj. Rz. Nlk 1 bl 9 YQ 0 Jr/view
Устойчивость к флуконазолу
Что биоинформатику нужно знать об эксперименте? • платформа • длина чтения • проводилась ли фильтрация данных (адаптеры, качество) • последовательности адаптеров и других технических последовательностей • метод фрагментации генома – ожидаемая длина, GC-состав • транскриптом – качество РНК, способ отбора целевых молекул (вычитание р. РНК) • для парных чтений – длина вставки (insert size) – длина нуклеотидной последовательности между двумя адаптерами (paired-end adaptors) • возможные источники контаминации
https: //www. youtube. com/watch? list=PL 4 FBZy 5 t. NTEm_s 2 Fow. Ow. Gbkd 6 p. KMqap 9 L&t=258 9&v=R 6 fe. Sy. UOYPU
Из презентации М. Логачевой, лаборатория эволюционной геномики ФББ МГУ https: //drive. google. com/file/d/0 B_x. Xd. HGFR 3 Tq. Mlpa. UF 9 l. R 3 p. UZWI 1 NFRs. Vj. Rz. Nlk 1 bl 9 YQ 0 Jr/view
Секвенирование путем синтеза с обратимым терминированием - Illumina 1. ДНК лигируют адаптеры фрагментируют и к фрагментам 3. Через ячейку пропускают реагенты для достраивания второй цепи ДНК Стадии 3 -4 повторяются 30 -35 раз 6. Каждый фрагмент оказывается окружен группой идентичных молекул ( «кластеры» ). 2. ДНК пропускают через каналы ячейки, покрытые праймерами, комплементарными концам адаптеров 4. Двуцепочечные денатурируют фрагменты
Секвенирование Illumina - принцип метода 7. Через ячейку пропускают реагенты (флуоресцентно меченые терминированные d. NTP и полимеразу) 10. Повторение 7 -9 нужное число раз (50 -300). Число циклов соответствует длине чтения. 9. Через ячейку пропускают реагенты, отщепляющие флуорофор и терминатор 8. На ячейку светят лазером и проводят съемку.
Таня Мараховская секвенирование.pptx