Скачать презентацию Вычисления с использованием ДНК Ростислав Чутков гр 244 Скачать презентацию Вычисления с использованием ДНК Ростислав Чутков гр 244

0d572dc6a4c2670fa7e9c9662e836e02.ppt

  • Количество слайдов: 46

Вычисления с использованием ДНК Ростислав Чутков, гр. 244 Александр Петров, гр. 244 Вычисления с использованием ДНК Ростислав Чутков, гр. 244 Александр Петров, гр. 244

План доклада n Введение Что такое DNA Computing? Ø Перспективы ДНК-вычислений Ø n n План доклада n Введение Что такое DNA Computing? Ø Перспективы ДНК-вычислений Ø n n Элементарные операции с ДНК Эксперименты с ДНК Модели и попытки формализации Текущие результаты 15. 10. 2006 2 of 52

Что такое DNA Computing? n Вычисления на ДНК – это раздел области молекулярных вычислений, Что такое DNA Computing? n Вычисления на ДНК – это раздел области молекулярных вычислений, на границе молекулярной биологии и компьютерных наук. n Основная идея ДНК-вычислений – построение новой парадигмы вычислений, новых моделей, новых алгоритмов на основе знаний о строении и функциях молекулы ДНК и операций, которые выполняются в живых клетках над молекулами ДНК при помощи различных ферментов. 15. 10. 2006 3 of 52

Перспективы ДНК-вычислений n Новая парадигма вычислений: новые алгоритмы Ø возможность исследования процессов массового параллелизма Перспективы ДНК-вычислений n Новая парадигма вычислений: новые алгоритмы Ø возможность исследования процессов массового параллелизма Ø n Новые методы синтеза веществ и объектов на молекулярном уровне. n Технологические преимущества; возможность создания «биологического нанокомпьютера» . 15. 10. 2006 4 of 52

 «Биологический нанокомпьютер» n Будет способен хранить терабайты информации при терабайты информации объеме в «Биологический нанокомпьютер» n Будет способен хранить терабайты информации при терабайты информации объеме в несколько микрометров 3. n Возможность внедрения в клетку живого организма. внедрения в клетку n Миллиарды операций в секунду при затратах энергии Миллиарды не более одной миллиардной доли ватта. n Низкая стоимость “материалов”, использующихся для Низкая стоимость создания и обслуживания компьютера. 15. 10. 2006 5 of 52

План доклада n n Введение Элементарные операции с ДНК Методы изменения цепи ДНК Ø План доклада n n Введение Элементарные операции с ДНК Методы изменения цепи ДНК Ø Полимеразная цепная реакция Ø Способы “считывания” информации Ø n n n Эксперименты с ДНК Модели и попытки формализации Текущие результаты 15. 10. 2006 6 of 52

Молекула ДНК n Молекула ДНК – двойная лента, составленная из четырех оснований: А (аденин), Молекула ДНК n Молекула ДНК – двойная лента, составленная из четырех оснований: А (аденин), Т (тимин), Г (гуанин), Ц (цитозин). n Диаметр двойной спирали ДНК – 2 нм n Расстояние между соседними парами оснований – 0. 34 нм n ДНК вирусов содержит ~1000 звеньев ДНК млекопитающих – до 1010 звеньев n 15. 10. 2006 Молекула ДНК под электронным микроскопом 7 of 52

15. 10. 2006 8 of 52 15. 10. 2006 8 of 52

Ренатурация, денатурация q Комплементарность оснований заключается в том, что образование водородных связей при соединении Ренатурация, денатурация q Комплементарность оснований заключается в том, что образование водородных связей при соединении одинарных цепочек ДНК в двойную цепочку возможно только между парами А - Т и Г - Ц. § Ренатурация – это соединение двух одинарных цепочек ДНК за счет связывания комплементарных оснований. § Денатурация – разъединение двойной цепочки и получение двух одинарных цепочек. 15. 10. 2006 9 of 52

Дополнение цепочки ДНК n Дополнение цепочки ДНК происходит при воздействии на исходную молекулу ферментов Дополнение цепочки ДНК n Дополнение цепочки ДНК происходит при воздействии на исходную молекулу ферментов – полимераз. Для работы полимеразы необходимо наличие: 1. Одноцепочечной матрицы, которая определяет добавляемую цепочку по принципу комплементарности 2. Праймера (двухцепочечный участок) 3. Свободных нуклеотидов в растворе 15. 10. 2006 10 of 52

Удлинение цепочки ДНК n Существуют полимеразы, которым не требуются матрицы для удлинения цепочки ДНК. Удлинение цепочки ДНК n Существуют полимеразы, которым не требуются матрицы для удлинения цепочки ДНК. Например, терминальная трансфераза добавляет одинарные цепочки ДНК к обоим концам двухцепочечной молекулы. Таким образом можно конструировать произвольную цепь ДНК → 15. 10. 2006 11 of 52

Укорочение молекул ДНК n За укорочение и разрезание молекул ДНК отвечают ферменты – нуклеазы. Укорочение молекул ДНК n За укорочение и разрезание молекул ДНК отвечают ферменты – нуклеазы. Различают эндонуклеазы и экзонуклеазы. Экзонуклеазы осуществляют укорочение молекулы ДНК с концов: Экзонуклеазы могут укорачивать одноцепочечные молекулы и двухцепочечные, с одного конца или с обоих. 15. 10. 2006 12 of 52

Разрезание молекулы ДНК n Сайт-специфичные эндонуклеазы – рестриктазы – разрезают молекулу ДНК в определенном Разрезание молекулы ДНК n Сайт-специфичные эндонуклеазы – рестриктазы – разрезают молекулу ДНК в определенном месте, которое закодировано последовательностью нуклеотидов – сайтом узнавания. Разрез может быть прямым, или несимметричным, как на рисунке. Разрез может проходить по сайту узнавания, или же вне его. Эндонуклеазы разрушают внутренние фосфодиэфирные связи в молекуле ДНК. 15. 10. 2006 13 of 52

Сшивка молекул ДНК n Сшивка - операция, обратная операции разрезания, происходит под воздействием ферментов Сшивка молекул ДНК n Сшивка - операция, обратная операции разрезания, происходит под воздействием ферментов – лигаз. “Липкие концы” соединяются вместе с образованием водородных связей. Фосфодиэфирные связи много прочнее, чем водородные 15. 10. 2006 Лигазы служат для того, чтобы закрыть насечки, т. е. способствовать образованию в нужных местах фосфодиэфирных связей. 14 of 52

15. 10. 2006 15 of 52 15. 10. 2006 15 of 52

Модификация n Модификация используется для того, чтобы рестриктазы не смогли “найти” определенный сайт и Модификация n Модификация используется для того, чтобы рестриктазы не смогли “найти” определенный сайт и не разрушили молекулу. Существует несколько типов модифицирующих ферментов – метилазы, фосфатазы и т. д. Метилаза имеет тот же сайт узнавания, что и соответствующая рестриктаза. При нахождении нужной молекулы, метилаза модифицирует участок с сайтом так, что рестриктаза уже не сможет идентифицировать эту молекулу. 15. 10. 2006 16 of 52

Полимеразная цепная реакция (а) Нагреваем до температуры кипения воды (б) Охлаждаем до 55 o Полимеразная цепная реакция (а) Нагреваем до температуры кипения воды (б) Охлаждаем до 55 o C ие (в) Снова нагреваем до 70 -72 o C Возможно применение ферментов, сдвигающих температурные границы. 15. 10. 2006 17 of 52

15. 10. 2006 18 of 52 15. 10. 2006 18 of 52

Секвенирование n Секвенирование – это определение последовательности нуклеотидов в ДНК. Для секвенирования цепочек различной Секвенирование n Секвенирование – это определение последовательности нуклеотидов в ДНК. Для секвенирования цепочек различной длины применяют различные методы. При помощи метода праймер-опосредованной прогулки удается на одном шаге секвенировать последовательность в 250 -350 нуклеотидов. n После открытия рестриктаз стало возможным секвенировать длинные последовательности по частям. 15. 10. 2006 19 of 52

Гель-электрофорез n Гель-электрофорез используется для разделения молекул ДНК по длине. Если молекулы поместить в Гель-электрофорез n Гель-электрофорез используется для разделения молекул ДНК по длине. Если молекулы поместить в гель и приложить постоянное электрическое поле, то они будут двигаться по направлению к аноду, причем молекулы меньшей длины будут двигаться быстрее. Ø Молекулы ДНК имеют отрицательный заряд Ø Иногда применяют маркировочные молекулы 15. 10. 2006 20 of 52

План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Эдлмана План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Эдлмана ― гамильтонов путь Ø Э. Шапиро ― конечный автомат Ø Э. Винфри ― ковер Серпинского Ø n n Модели и попытки формализации Текущие результаты 15. 10. 2006 21 of 52

Эксперимент Эдлмана n n Показал, что, пользуясь вычислениями на ДНК, можно эффективно решать задачи Эксперимент Эдлмана n n Показал, что, пользуясь вычислениями на ДНК, можно эффективно решать задачи переборного характера. Обозначил технику, которая, в дальнейшем послужила основой для создания модели параллельной фильтрации. Leonard Adleman >> Построив эффективную реализацию метода Эдлмана, мы научимся решать NP-полные задачи за полиномиальное время. 15. 10. 2006 22 of 52

Алгоритм Эдлмана n n n Вход. Ориентированный граф G с n вершинами, среди которых Алгоритм Эдлмана n n n Вход. Ориентированный граф G с n вершинами, среди которых выделены 2 вершины – vin и vout Шаг 1. Породить большое количество случайных путей в G Шаг 2. Отбросить все пути, которые не начинаются с vin или не заканчиваются на vout Шаг 3. Отбросить все пути, которые не содержат точно n вершин Шаг 4. Для каждой из n вершин v отбросить пути, которые не содержат v Выход. Да, если есть хоть один путь, нет – в противном случае. 15. 10. 2006 23 of 52

Кодирование объектов n n Каждая вершина графа кодируется последовательностью 20 нуклеотидов. Для ребер код Кодирование объектов n n Каждая вершина графа кодируется последовательностью 20 нуклеотидов. Для ребер код комплементарен конкатенации вторых 10 нуклеотидов вершины-источника и первых 10 нуклеотидов вершины-назначения. В реакционной среде молекулы, кодирующие ребра способны соединятся самостоятельно, если у них есть общая вершина. 15. 10. 2006 24 of 52

Эксперимент Шапиро n «Исходные данные» , и «программа» могут описываться молекулами ДНК. n Первый Эксперимент Шапиро n «Исходные данные» , и «программа» могут описываться молекулами ДНК. n Первый шаг на пути к созданию «биологического нанокомпьютера» . Ehud Shapiro >> Научившись создавать конечные автоматы на ДНК, мы перенесем все классические решения задач на новую молекулярно-электронную архитектуру 15. 10. 2006 25 of 52

Конечный автомат Шапиро n В опыте Э. Шапиро был реализован конечный автомат, который может Конечный автомат Шапиро n В опыте Э. Шапиро был реализован конечный автомат, который может находиться в двух состояниях – S 0 и S 1 и отвечает на вопрос – четное или нечетное количество символов а содержится во входной последовательности символов a и b. Ø S 0, a → S 1 Ø S 0, b → S 0 Ø S 1, a → S 0 Ø S 1, b → S 1 15. 10. 2006 26 of 52

Эксперимент Винфри n Локальные правила определяют глобальную структуру. Под вычислением здесь понимается создание этой Эксперимент Винфри n Локальные правила определяют глобальную структуру. Под вычислением здесь понимается создание этой структуры. n Возможно использовать локальные правила для синтеза различных поверхностей при помощи ДНК. 15. 10. 2006 32 of 52

Построение ковра Серпинского n В опыте используются 4 плитки, которые соответствуют правилам таблицы истинности Построение ковра Серпинского n В опыте используются 4 плитки, которые соответствуют правилам таблицы истинности для оператора XOR. n Начальный слой укладывается из плиток типа Т-00. Затем плитки укладываются по направлению снизу вверх. 15. 10. 2006 33 of 52

Кодирование плиток и результат Набор плиток в опыте по получению ковра Серпинского → ← Кодирование плиток и результат Набор плиток в опыте по получению ковра Серпинского → ← Соответствие двумерных плиток молекулам ДНК Результирующая структура под атомно-силовым микроскопом → 15. 10. 2006 34 of 52

План доклада n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели и План доклада n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели и попытки формализации Модель параллельной фильтрации Ø Плиточная модель Ø Операции в терминах теории формальных языков Ø n Текущие результаты 15. 10. 2006 35 of 52

Parallel Filtering Model n Соответствует прямому перебору в классической парадигме вычислений. n Реализуется в Parallel Filtering Model n Соответствует прямому перебору в классической парадигме вычислений. n Реализуется в три стадии: 1) 2) 3) 15. 10. 2006 Генерация всех вариантов. Параллельный отсев (в несколько стадий) всех араллельный отсев неудовлетворительных вариантов. Расшифровка решения. 36 of 52

Определения (1/3) n Пробирка – это мультимножество слов (конечных строк) над алфавитом {А, Ц, Определения (1/3) n Пробирка – это мультимножество слов (конечных строк) над алфавитом {А, Ц, Г, Т}. n Слить. Образовать объединение (в смысле мультимножеств) двух заданных пробирок. n Размножить. Изготовить две копии данной пробирки. n Обнаружить. Возвратить значение истина, если данная пробирка N содержит по крайней мере одну цепочку ДНК, иначе - ложь. 15. 10. 2006 37 of 52

Определения (2/3) n Разделить (или Извлечь). По данным пробирке N и слову w над Определения (2/3) n Разделить (или Извлечь). По данным пробирке N и слову w над алфавитом {А, Ц, Г, Т} изготовить две пробирки +(N, w) и –(N, w) такие, что +(N, w) состоит из всех цепочек в N, содержащих w в качестве (последовательной) подстроки, а –(N, w) состоит из всех цепочек в N, которые не содержат w в качестве подстроки. n Разделить по длине. По данным пробирке N и целому числу n, изготовить пробирку L (N, ≤n), состоящую из всех цепочек из N длины не больше n. 15. 10. 2006 38 of 52

Определения+ (3/3) n Разделить по префиксу (суффиксу). По данным пробирке N и слову w, Определения+ (3/3) n Разделить по префиксу (суффиксу). По данным пробирке N и слову w, изготовить пробирку B (N, w) (соответственно E (N, w)), состоящую из всех цепочек в N, начало (соответственно конец) которых совпадает со словом w. В приведенных терминах стадия фильтрации в опыте Эдлмана может быть описана “программой”, которая начинает свою работу после того, как произошло сшивание всех нужных молекул и в пробирке N образовалось множество всех возможных путей в графе G. Каждый из олигонуклеотидов si, 0 ≤ i ≤ 6, имеет длину 20. 15. 10. 2006 39 of 52

Алгоритм Эдлмана 1) 2) ввести (N) N ← B (N, s 0) // выделить Алгоритм Эдлмана 1) 2) ввести (N) N ← B (N, s 0) // выделить все цепочки, которые начинаются с вершины s 0 3) 4) N ← E (N, s 6) // выделить все цепочки, которые кончаются на s 6 N ← L (N, ≤ 140) // выделить все цепочки не длиннее 140 5) Для i от 1 до 5 выполнить N ← + (N, si) // для каждой из вершин от s 1 до s 5 выделить только те цепочки, которые содержат данную вершину 6) Result = обнаружить (N) // true если осталась хоть одна цепочка, false – в противном случае. 15. 10. 2006 40 of 52

Плиточная модель n n ДНК-вычислитель будет представлять собой клеточный автомат из клеток произвольной формы. Плиточная модель n n ДНК-вычислитель будет представлять собой клеточный автомат из клеток произвольной формы. Локальные правила взаимодействия клеток будут определяться их формой. Ø Автомат будет дискретным, и к нему применимо понятие шага. Ø Данный подход сразу же обеспечивает возможность описания параллельных процессов, которые изначально присущи ДНКвычислителю. 15. 10. 2006 41 of 52

Теоретический базис n Все работы, относящиеся к проблеме покрытия (Ванга, Бергера, Робинсона, Пенроуза). n Теоретический базис n Все работы, относящиеся к проблеме покрытия (Ванга, Бергера, Робинсона, Пенроуза). n Работы Э. Винфри, направленные на получение нужных структур на практике. n Работы по теории клеточных автоматов с «квадратными клетками» . 15. 10. 2006 42 of 52

План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели и попытки формализации Текущие результаты Решенные задачи Ø Ограничения в экспериментах Ø Программные средства Ø 15. 10. 2006 43 of 52

 Задачи, решенные теоретически Задача Год решения Поиск гамильтонова пути в графе 1994 Достижимость Задачи, решенные теоретически Задача Год решения Поиск гамильтонова пути в графе 1994 Достижимость пропозициональных формул 1994 3 -раска графа 1995 Quantified Boolean formulae 1995 Indendent Set 1996 Задача о рюкзаке 1996 Задача изоморфизма с подграфом 1996 Задача о клике 1996 MAX-CNF SAT 1996 Задача о выполнимости для схем 1996 (3 -2) System 1997 Shortest common superstring 1998 Bounded Post correspondence 2000 15. 10. 2006 44 of 52

[re] Эксперимент Эдлмана n В ДНК-компьютере Эдлмана оптимальный маршрут обхода отыскивался всего для 7 [re] Эксперимент Эдлмана n В ДНК-компьютере Эдлмана оптимальный маршрут обхода отыскивался всего для 7 вершин графа… … за одну неделю! n Нахождение обхода 200 вершин потребовало бы количество ДНК, большее… … веса всей нашей планеты! Поэтому, например, компания IBM сразу предпочла сфокусироваться на других идеях альтернативных компьютеров, таких как углеродные нанотрубки и квантовые компьютеры. 15. 10. 2006 45 of 52

[re] Эксперимент Шапиро n Автомат Шапиро не сравним по сложности с любым сколь угодно [re] Эксперимент Шапиро n Автомат Шапиро не сравним по сложности с любым сколь угодно полезным автоматом. n Автомат не может ответить более чем на 756 вопросов о четности количества символов a. n Модель автомата детерминирована, но ведет себя он как вероятностный (из-за естественных ошибок) => Необходимость создания дополнительных контролирующих схем / молекул. 15. 10. 2006 46 of 52

Программные средства: Namot n n n Nucleic Acid MOdeling Tool Графическое средство работы с Программные средства: Namot n n n Nucleic Acid MOdeling Tool Графическое средство работы с молекулярными структурами. Позволяет составлять структуры из атомов, задавать связи в трехмерном пространстве, строить последовательности молекулярных операций. 15. 10. 2006 47 of 52

Программные средства: Xgrow n Симулятор, позволяющий имитировать процесс синтеза различных структур, получая на входе Программные средства: Xgrow n Симулятор, позволяющий имитировать процесс синтеза различных структур, получая на входе набор плиток, а также вычисляющий возможные ошибки при создании структуры. Процесс моделирования синтеза структуры «ковер Серпинского» → 15. 10. 2006 48 of 52

Подведем итоги ü Вычисления на ДНК – новая развивающаяся область науки на границе молекулярной Подведем итоги ü Вычисления на ДНК – новая развивающаяся область науки на границе молекулярной биологии и Computer Science. ü Главные преимущества вычислений на ДНК – высочайшая скорость и неограниченный параллелизм. ü Поставлено несколько экспериментов, доказывающих оправданность теоретических предположений. ü Текущие практические результаты пока оставляют желать лучшего, теория все еще развита слабо. 15. 10. 2006 50 of 52

План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели План доклада n n n Введение Элементарные операции с ДНК Эксперименты с ДНК Модели и попытки формализации Текущие результаты Вопросы? 15. 10. 2006 51 of 52

Использованный материал n n Малинецкий Г. Г. , Науменко С. А. Вычисления на ДНК. Использованный материал n n Малинецкий Г. Г. , Науменко С. А. Вычисления на ДНК. Adleman L. M. , Molecular Computation of Solutions to Combinatorial Problems. Istvan Katsanyi. Molecular Computing Solutions of some Classical Problems. Robin Varghese. Implementing models of DNA computing. 15. 10. 2006 52 of 52