Скачать презентацию YOUR LOGO Курс лекций Введение в химическую информатику Скачать презентацию YOUR LOGO Курс лекций Введение в химическую информатику

Lecture_2_09_09_2014.pptx

  • Количество слайдов: 53

YOUR LOGO Курс лекций «Введение в химическую информатику» Лекция 2 Осенний семестр 2014 YOUR LOGO Курс лекций «Введение в химическую информатику» Лекция 2 Осенний семестр 2014

YOUR LOGO Определение химической информатики Взаимосвязь химической информатики и смежных дисциплин Основные возможности и YOUR LOGO Определение химической информатики Взаимосвязь химической информатики и смежных дисциплин Основные возможности и задачи химической информатики

План лекции YOUR LOGO § Внутреннее и внешнее представление химической информации. § Особенности представления План лекции YOUR LOGO § Внутреннее и внешнее представление химической информации. § Особенности представления молекул в химической информатике, требования. § Понятие об уровнях представления химических структур. § Линейные обозначения (имена, WLN, SMILES, SMARTS, SLN, In. Chi, In. Ch. IKey, RIn. Ch. I). § Базовые элементы теории графов. § Матричное представление, виды матриц. Табличное представление. § Трехмерные представления. Координаты атомов. § Поверхности. Виды поверхностей (ван-дер-ваальсова поверхность, поверхность Коннолли, доступная растворителю поверхность, поверхность исключенного растворителя, поверхность полости фермента, поверхность изоплотности). § Наиболее распространенные форматы файлов. Перекодировка форматов.

YOUR LOGO С 1960 года компьютеры использовались: § для работы с химическими структурами в YOUR LOGO С 1960 года компьютеры использовались: § для работы с химическими структурами в базах данных, § для использования химической структурной информации, § поиске по подобию, § представления химических реакций, § планирования синтеза, § разработки лекарственных препаратов, § прогнозирования разнообразных физико-химических свойств Что объединяет все эти задачи?

YOUR LOGO «Внутренний» и «внешний» типы представления химической информации «Внешнее» представление химического соединения Преобразование YOUR LOGO «Внутренний» и «внешний» типы представления химической информации «Внешнее» представление химического соединения Преобразование «Внутреннее» (машинное) представление § Внутреннее представление: § Молекулярные графы, дескрипторы § Файлы, организованные в соответствии с типами внешнего представления химической информации (непосредственное кодирование матрицы смежности молекулярного графа (MOL, SDF, RDF); § Наиболее популярные типы представления химических данных: § Линейные нотации в виде строки символов (SMILES, SMARTS, WLN, SLN, In. Chi, In. Ch. IKey, RIn. Ch. I); § Матричное представление § 3 D представление § Поверхности

YOUR LOGO Требования к представлению химических соединений Молекулярное представление должно быть: § Пригодным для YOUR LOGO Требования к представлению химических соединений Молекулярное представление должно быть: § Пригодным для обработки компьютером § Простым в обработке § Достаточно информативным для хранения информации § Уникальным § Однозначно интерпретируемым

Представление химического соединения. YOUR LOGO § Сколько информации Вы хотите включить? § Атомы § Представление химического соединения. YOUR LOGO § Сколько информации Вы хотите включить? § Атомы § Типы связей § Стереохимическая конфигурация § 3 D-координаты атомов

YOUR Иерархия представления химических соединений LOGO Название (S) - Tryptophan Линейное представление NC(CC 1=CNC YOUR Иерархия представления химических соединений LOGO Название (S) - Tryptophan Линейное представление NC(CC 1=CNC 2=C 1 C=CC=C 2)C(O)=O Двумерное представление Трехмерное представление Молекулярные поверхности

Линейное представление соединений. YOUR LOGO §Химические соединения представляются как буквенно-цифровые линейные последовательности (линейные нотации), Линейное представление соединений. YOUR LOGO §Химические соединения представляются как буквенно-цифровые линейные последовательности (линейные нотации), согласующиеся с номенклатурой IUPAC. §Линейные нотации могут быть чрезвычайно компактными, что является преимуществом при хранении информации о соединениях. §Линейные нотации позволяют свободно обмениваться информацией о химических соединениях без необходимости использования специального программного обеспечения, интерпретация поддерживается поисковыми системами. §Наиболее популярные типы линейных нотаций: § SMILES (Simplified Molecular Input Line Entry System); §SMARTS (расширение SMILES ) § In. Ch. I (IUPAC International Chemical Identifier) § WLN (линейные нотации Висвессера ) § SLN (Sybyl Line Notation ) §In. Chi §In. Ch. IKey §RIn. Ch. I

Линейное представление соединений. YOUR LOGO §Химические соединения представляются как буквенно-цифровые линейные последовательности (линейные нотации), Линейное представление соединений. YOUR LOGO §Химические соединения представляются как буквенно-цифровые линейные последовательности (линейные нотации), согласующиеся с номенклатурой IUPAC. §Линейные нотации могут быть чрезвычайно компактными, что является преимуществом при хранении информации о соединениях. §Линейные нотации позволяют свободно обмениваться информацией о химических соединениях без необходимости использования специального программного обеспечения, интерпретация поддерживается поисковыми системами. §Наиболее популярные типы линейных нотаций: § SMILES (Simplified Molecular Input Line Entry System); §SMARTS (расширение SMILES ) § In. Ch. I (IUPAC International Chemical Identifier) § WLN (линейные нотации Висвессера ) § SLN (Sybyl Line Notation ) §In. Chi §In. Ch. IKey §RIn. Ch. I

Линейные нотации Висвессера (WLN) Введены в 1946 году, в целях организации и систематического описания Линейные нотации Висвессера (WLN) Введены в 1946 году, в целях организации и систематического описания соединений в сжатой форме. Представление химической структуры в виде буквенно-цифровой последовательности Во многих случаях WLN использует стандартные символы для химических элементов. Функциональные группы, циклические системы, положение заместителей обозначаются отдельными буквами или сочетаниями символов. Простая WLN использует 40 символов из следующих наборов символов [12] : • заглавные буквы: A-Z используются для элементов, групп атомов , ветвей и положений цикла; • Номера: 0 -9 указывают длину алкильной цепи или число атомов в цикле; • Специальные символы " & ", "/ ", "- " и "" (пробел) обозначают циклы и положение заместителей. Преимущество: компактность. Недостаток: для совмещения компактности и однозначности представления необходим сложный набор правил, которые сделали этот тип записей затруднительным и потенциально порождающим ошибки в записи структур химических соединений. YOUR LOGO

SMILES (Simplified Molecular Input Line Entry System) LOGO YOUR Первоначальный вариант спецификации SMILES был SMILES (Simplified Molecular Input Line Entry System) LOGO YOUR Первоначальный вариант спецификации SMILES был разработан Дэвидом Вейнингером в конце 1980 -х. В дальнейшем стандарт был модифицирован и расширен; наиболее активное участие в этой работе приняла компания Daylight Chemical Information Systems, Inc. . C CCO C=O c 1 ccccc 1 http: //www. daylight. com/dayhtml/smiles C 1 CCCCC 1

SMILES (Simplified Molecular Input Line Entry System) LOGO YOUR Пять базовых правил: 1. Атомы SMILES (Simplified Molecular Input Line Entry System) LOGO YOUR Пять базовых правил: 1. Атомы представлены их атомными символами. 2. Атомы водорода опущены 3. Соседние атомы расположены рядом друг с другом. 4. Двойные и тройные связи характеризуются «=» и «#» , соответственно. 5. Разветвления молекулы представлены скобках. 6. Циклы описаны путем выделения цифры для двух "соединяющих" атомов в цикле. В терминах теории графов SMILES представляет собой строку, полученную путём вывода символов вершин молекулярного графа в порядке, соответствующем их обходу в глубину.

Синтаксис SMILES. Атомы. YOUR LOGO В общем случае, атомы отображаются символами химических элементов и Синтаксис SMILES. Атомы. YOUR LOGO В общем случае, атомы отображаются символами химических элементов и записываются в квадратных скобках, например: [As]. Без квадратных скобок можно отображать атомы "органических" элементов в "низших нормальных" валентных состояниях: B(III) C(IV) N(III, V*) O(II) F(I) P(III, V), S(II, IV, VI) Cl(I) Br(I) I(I) Водород при этих атомах, насыщающий свободные валентности, можно не указывать. Гидриды Объект метан CH 4 аммиак NH 3 вода H 2 O сероводород H 2 S хлороводород HCl арсин As. H 3 Строка SMILES C N O S Cl [As. H 3]

Синтаксис SMILES: ковалентная химическая связь и LOGO YOUR обозначение заместителей Соседние атомы записывают рядом. Синтаксис SMILES: ковалентная химическая связь и LOGO YOUR обозначение заместителей Соседние атомы записывают рядом. Ковалентная связь отображается: § одинарная никак (иногда -) § двойная = § тройная # этан CH 3 пропан CH 3 CH 2 CH 3 углекислый газ синильная кислота CC CCC O=C=O C#N Боковую цепь указывают в круглых скобках после символа того атома, к которому она присоединена.

Синтаксис SMILES: циклы YOUR LOGO Два атома цикла нумеруют одним и тем же числом Синтаксис SMILES: циклы YOUR LOGO Два атома цикла нумеруют одним и тем же числом и связь между этими атомами условно разрывают: Допускаются варианты выбора основной цепи: Химические символы атомов, образующих ароматические связи, записывают строчными буквами.

YOUR Синтаксис SMILES: пространственные изомеры LOGO Положение относительно двойных связей trans cis тетраэдрические стереоцентры YOUR Синтаксис SMILES: пространственные изомеры LOGO Положение относительно двойных связей trans cis тетраэдрические стереоцентры F/C=C/F или FC=CF FC=C/F или F/C=CF F/C=CC SMILES: N[C@](C)(F)C(=O)O @ - против часовой стрелки @@ - по часовой стрелке

YOUR SMILES (Simplified Molecular Input Line Entry System) LOGO Популярность этого формата представления химических YOUR SMILES (Simplified Molecular Input Line Entry System) LOGO Популярность этого формата представления химических соединений привела к возникновению различных модификаций: § XSMILES, § SMARTS, § SMIRKS, § STRAPS, § CHUCKLES, § CHORTLES, § CHARTS. Каждая из них была предназначена для представления специальных молекулярных структур или конкретных приложений (полимеры, смеси, реакции, или работа с базами данных).

Формат SMARTS YOUR LOGO § Более гибкое обозначение свойств атомов § [CX 3] carbon Формат SMARTS YOUR LOGO § Более гибкое обозначение свойств атомов § [CX 3] carbon with 3 connections § [Nr 5] nitrogen in a ring of size 5 § Свойства могут быть комбинированы с логическими операторами: § ! (NOT) § & (AND – high precedence) § , (OR) § ; (AND – low precedence) SMILES интерпретируется как молекула, в то время как SMARTS рассматривается как подструктура для поиска в химических базах данных Примеры: 1. Atomic primitives: [*] – any atom, [a] – any aromatic atom, etc 2. Bond primitives: ~ - any bond, @ - any ring bond, etc 3. Logical operations: [c, n; H 1] – (aromatic carbon OR aromatic nitrogen) AND connected with exactly 1 hydrogen atom 4. Recursive SMARTS: C[$(aa. O); $(aaa. N)] – C in position ortho to O AND meta to N 5. Component-level grouping: (C) - the query must match carbons in two different components 6. Reaction queries: C(=O)O. OCC>>C(=O)OCC. O – reaction of esterification http: //www. daylight. com/dayhtml/doc/theory. smarts. html

Линейные нотации в виде строки символов: In. Ch. IYOUR LOGO (IUPAC International Chemical Identifier) Линейные нотации в виде строки символов: In. Ch. IYOUR LOGO (IUPAC International Chemical Identifier) In. Ch. I – международный текстовый идентификатор компьютеризованный вариант систематического названия Пример: химического объекта; это §Цифровой эквивалент названию соединения по номенклатуре IUPAC §Пять уровней информации: связанность, таутомеризм, изотопы, стереохимия, заряд. §Алгоритм генерирует уникальное линейное представление химического соединения. Каждый слой в In. Ch. I содержит свой тип информации о химическом соединении. При разработке формата первоочередной задачей ставилась компактность, а не легкость интерпретации, тем не менее сохраняется возможность интерпретируемости пользователем. Официальный web сайт : http: //www. iupac. org/inchi/

YOUR Линейные нотации в виде строки символов: In. Ch. IKey. LOGO Конденсированный, 25 -символьный YOUR Линейные нотации в виде строки символов: In. Ch. IKey. LOGO Конденсированный, 25 -символьный In. Ch. IKey – хешированная версия In. Ch. I созданная для быстрого web-поиска химических соединений Первая часть ключа составляет 14 символов и соответствует молекулярному скелету. После дефиса, есть вторая строка 10 символов, первые восемь из которых кодируют стереохимию и изотопы. Блок из 10 символов заканчиваетсяобозначением S (стандартный In. Ch. IKey), «А» означает, что использовалась версия 1. Финальный символ, N, «нейтральный» .

Молекулярный граф YOUR LOGO • Молекулярный граф — связный неориентированный граф, находящийся во взаимно-однозначном Молекулярный граф YOUR LOGO • Молекулярный граф — связный неориентированный граф, находящийся во взаимно-однозначном соответствии со структурной формулой химического соединения таким образом, что вершинам графа соответствуют атомы молекулы, а рёбрам графа — химические связи между этими атомами. • Это абстрактная модель, отображающая топологию молекулы (как правило, без атомов водорода). • Вершины молекулярного графа могут быть непомеченными — в этом случае молекулярный граф будет отражать только структуру, но не состав молекулы. Точно так же рёбра молекулярного графа могут быть непомеченными — в таком случае не будет делаться различие между ординарными и кратными химическими связями. • В некоторых случаях может использоваться молекулярный граф, отражающий только углеродный скелет молекулы органического соединения. • Естественным расширением молекулярного графа является реакционный граф, рёбра которого соответствуют образованию, разрыву и изменению порядка связей между атомами.

Базовые определения § Степенью вершины называют количество инцидентных ей рёбер § Путь (или цепь) Базовые определения § Степенью вершины называют количество инцидентных ей рёбер § Путь (или цепь) в графе - конечная последовательность вершин, в которой каждая вершина (кроме последней) соединена со следующей в последовательности вершин ребром. § Цикл - путь, в котором первая и последняя вершины совпадают. Длина пути (или цикла) - число составляющих его рёбер. § Дерево – связный граф, не содержащий простых циклов § Подграф - граф, содержащий поднабор вершин и ребер другого графа YOUR LOGO

Матричная форма представления молекулярного графа Матрица смежности - матричная представления молекулярного графа YOUR LOGO Матричная форма представления молекулярного графа Матрица смежности - матричная представления молекулярного графа YOUR LOGO форма Атомы нумеруются произвольно. n атомов – матрица размерности n x n Элементы матрицы: aij = 1, если между атомами i и j имеется химическая связь, aij = 0 , если между атомами i и j нет химической связи. Chemoinformatics: A Textbook. Ed. J. Gasteiger, T. Engel. 2003

Избыточная – неизбыточная матрица YOUR LOGO Этапы упрощения матрицы: • удаление нулей, • устранение Избыточная – неизбыточная матрица YOUR LOGO Этапы упрощения матрицы: • удаление нулей, • устранение дублей, • удаление информации об атомах водорода Chemoinformatics: A Textbook. Ed. J. Gasteiger, T. Engel. 2003

Матрица расстояний (примеры иных типов матриц) YOUR LOGO а) геометрическое расстояние (ангстрем); б) топологическое Матрица расстояний (примеры иных типов матриц) YOUR LOGO а) геометрическое расстояние (ангстрем); б) топологическое расстояние (число связей по кратчайшему пути) Chemoinformatics: A Textbook. Ed. J. Gasteiger, T. Engel. 2003

Проблема разрастания объема базы данных. YOUR LOGO В матрице смежности: Число элементов матрицы = Проблема разрастания объема базы данных. YOUR LOGO В матрице смежности: Число элементов матрицы = f(n 2) Нерационально для больших молекул. Значительно лучше, если: Число элементов = f(n 1) Это достигается в форме таблицы соединений (сonnection table).

Таблица связности (Connectivity Table) YOUR LOGO Таблица связности – отображение состава вещества и связей Таблица связности (Connectivity Table) YOUR LOGO Таблица связности – отображение состава вещества и связей между атомами в табличной форме. Пример: этаналь. Chemoinformatics: A Textbook. Ed. J. Gasteiger, T. Engel. 2003

Таблица связности (Connectivity Table) YOUR LOGO Или… Пронумеровать атомы в производном порядке. Заполнить одну Таблица связности (Connectivity Table) YOUR LOGO Или… Пронумеровать атомы в производном порядке. Заполнить одну таблицу. Информативность избыточна, т. к. каждый атом упоминается дважды, сведения о водороде стандартны. Chemoinformatics: A Textbook. Ed. J. Gasteiger, T. Engel. 2003

Таблица связности (Connectivity Table) Если убрать повторы, сжать, получаем: YOUR LOGO Таблица связности (Connectivity Table) Если убрать повторы, сжать, получаем: YOUR LOGO

YOUR LOGO Лист атомов 1 C 2 C 3 O 4 N 5 C YOUR LOGO Лист атомов 1 C 2 C 3 O 4 N 5 C 6 C 7 C 8 C 9 O 10 C 11 C 1 st atom 1 2 2 4 5 6 7 8 8 10 5 2 nd atom 2 3 4 5 6 7 8 9 10 11 11 Bond order 1 2 1 1 4 4 4 1 - single bond 2 – double bond 3 – triple bond 4 - aromatic bond 9 8 7 10 6 11 5 3 4 2 1 N-(4 -hydroxyphenyl)acetamide На основании таблицы связности нарисовать молекулу

Структуры Маркуша YOUR LOGO Структура Маркуша – способ отображения серии соединений с помощью общего Структуры Маркуша YOUR LOGO Структура Маркуша – способ отображения серии соединений с помощью общего для них ядра и варьируемых частей. Варьируемые части записываются отдельно от графической формулы. Одна структура Маркуша может отображать собой множество соединений разных классов. R 1 = H, OH, COOH, R 2 = H, CH 3 X = H, (CH 2)n. CH 3

3 D представление соединений YOUR LOGO Наиболее общепринятым 3 D представлением является использование Декартовой 3 D представление соединений YOUR LOGO Наиболее общепринятым 3 D представлением является использование Декартовой системы координат, т. e. x, y, и z координаты каждого атома. В Mol файле, соединение может быть представлено в 3 D координатах, где информация о связях может быть опущена

YOUR LOGO 3 D представление соединений: внутренние координаты Другим 3 D представлением соединений является YOUR LOGO 3 D представление соединений: внутренние координаты Другим 3 D представлением соединений является Z матрица, такое представление также называют внутренними координатами. Каждый атом системы определяется через атомный номер, длину связи, валентный угол и двугранный угол. Под связью в данном случае подразумевается не химическая связь, а просто вектор, направленный от одного атома к другому, хотя они могут и совпадать. Z-матрицу записывают через длины и углы химических связей: такая запись позволяет описать не только относительное расположение атомов друг относительно друга, но и связи этих атомов. Z-матрица называется так потому, что второй атом всегда располагается вдоль оси аппликат. 1, 2 -дихлорэтан: Z-матрица Длина связи Угол между связями Двугранный угол

YOUR LOGO 3 D представление соединений: внутренние координаты 1, 2 -дихлорэтан: Z-матрица (продолжение) YOUR LOGO 3 D представление соединений: внутренние координаты 1, 2 -дихлорэтан: Z-матрица (продолжение)

Генерация 3 D структуры Теоретические методы: ab initio (e. g. Gaussian) полуэмпирические (e. g. Генерация 3 D структуры Теоретические методы: ab initio (e. g. Gaussian) полуэмпирические (e. g. Mopac) молекулярная механика (e. g. Mopac, Chem 3 D) Эмпирические методы (e. g. CONCORD, CORINA) : использование фрагментов с предопределенной геометрией использование определенного набора правил использование специальных баз данных использование простых оптимизаций YOUR LOGO

Генерация 3 D структуры Chemaxon’s Marvin YOUR LOGO Corina http: //www. mol-net. com/online_demos/corina_demo. html Генерация 3 D структуры Chemaxon’s Marvin YOUR LOGO Corina http: //www. mol-net. com/online_demos/corina_demo. html

YOUR Представление молекулярных поверхностей LOGO Начальным этапом образования любого комплекса (в частности, комплекса лекарственное YOUR Представление молекулярных поверхностей LOGO Начальным этапом образования любого комплекса (в частности, комплекса лекарственное вещество – рецептор), является акт распознавания. Рецептор должен распознать, обладает ли приближающаяся молекула свойствами, необходимыми для специфического и сильного связывания. Трехмерное электростатической поле , окружающее молекулу играет решающую роль в распознавании. Другие характеристики (гидрофобность) приобретают значение, когда расстояния уменьшаются. Молекулярная поверхность (концепция молекулярных поверхностей не более чем аналогия макроскопических объектов) может соответствовать различным свойствам, таким как заряд, электростатический потенциал, гидрофобность. Свойства могут быть определены экспериментально либо рассчитаны теоретически. В формальном представлении положения атомов представлены точками, а электронам соответствуют электронные облака сферической формы с центром в этих точках. Если у таких атомно-центрированных сфер радиусы равны ван-дер-Ваальсовым для данного элемента, то их совокупность называется Ван-дер-Ваальсовой поверхностью. Такие поверхности приблизительно соответствуют стерическим требованиям объема молекул. Другим часто используемым типом является поверхность, доступная молекулам растворителя (поверхность Конноли)- поверхность, описываемая центром пробной молекулы растворителя, представленной в виде сферы и перемещаемой по поверхности Ван-де Ваальса.

YOUR Представление молекулярных поверхностей LOGO Карта гидропатического поля нифедипина. Зеленым обозначены гидрофобные области, красным YOUR Представление молекулярных поверхностей LOGO Карта гидропатического поля нифедипина. Зеленым обозначены гидрофобные области, красным гидрофильные Гидрофобность может рассматриваться как эмпирическое свойство вещества, в котором скрыта термодинамическая информация о взаимодействии молекулы вещества с ее окружением. Влияет на взаимодействие лекарственных веществ с рецептором. Анализ гидропатического поля (гидрофобные взаимодействия в сочетании с электростатическими и ван-дерваальсовыми) может использоваться для создания пространственной карты активного центра рецептора с неизвестным пространственным строением. Если структура рецептора известна, то значения гидропатического поля могут использоваться для оптимизации структуры лигандов при поиске веществ с большей биологической активностью. Х. -Д. Хёлатье и др. Молекулярное моделирование. Теория и практика

YOUR LOGO Форматы файлов YOUR LOGO Форматы файлов

Форматы файлов химических данных YOUR LOGO § Было разработано большое количество форматов § Вместе Форматы файлов химических данных YOUR LOGO § Было разработано большое количество форматов § Вместе с тем, фактически широко используются лишь несколько стандартов § MOL и SDF файлы для «малых» молекул § PDB файлы в основном для белков (данные кристаллографии) § MOL 2 файлы для белков после моделирования (модифицированные PDB файлы)

Формат файла MDL (Molecular Design Limited) Molfile YOUR LOGO Число связей Обозначение атома Число Формат файла MDL (Molecular Design Limited) Molfile YOUR LOGO Число связей Обозначение атома Число атомов Информация по связи 1 2 3 4 ( http: //www. mdli. com/downloads/public/ctfile. jsp ) 5 6

YOUR LOGO Формат файла MDL Molfile : блок информации по атомам YOUR LOGO Формат файла MDL Molfile : блок информации по атомам

YOUR LOGO Формат файла MDL Molfile: блок информации по связям YOUR LOGO Формат файла MDL Molfile: блок информации по связям

YOUR LOGO Формат файла MDL Molfile: блок информации по связям YOUR LOGO Формат файла MDL Molfile: блок информации по связям

YOUR LOGO Формат файла MDL Molfile: блок информации по свойствам YOUR LOGO Формат файла MDL Molfile: блок информации по свойствам

YOUR LOGO Формат файла MDL Molfile: блок информации по свойствам 2 заряженных атома aтом YOUR LOGO Формат файла MDL Molfile: блок информации по свойствам 2 заряженных атома aтом 4: charge +1 aтом 6: charge -1

Формат файла MDL Sdfile (SDF) YOUR LOGO Представляет собой информацию, содержащуюся в формате Molfile Формат файла MDL Sdfile (SDF) YOUR LOGO Представляет собой информацию, содержащуюся в формате Molfile с ассоциированными элементами данных для одного или нескольких соединений Molfile 1 Ассоциированные данные $$$$ Molfile 2 Ассоциированные данные $$$$ …

Формат файла MDL Sdfile (SDF) Molfile 1 Associated data $$$$ Molfile 2 Associated data Формат файла MDL Sdfile (SDF) Molfile 1 Associated data $$$$ Molfile 2 Associated data $$$$ … Aссоциированные данные YOUR LOGO

YOUR LOGO Представление химических реакций в формате RXN Число реагентов Число продуктов Molfile первого YOUR LOGO Представление химических реакций в формате RXN Число реагентов Число продуктов Molfile первого реагента Molfile второго реагента Molfile первого продукта Molfile второго продукта

YOUR LOGO Представление химических реакций в формате RDF Несколько реакций в RXN формате в YOUR LOGO Представление химических реакций в формате RDF Несколько реакций в RXN формате в одном файле.

NAOMI или несколько слов о тривиальной задаче YOUR LOGO чтения химических соединений из разных NAOMI или несколько слов о тривиальной задаче YOUR LOGO чтения химических соединений из разных форматов файлов Successful conversion (in %) of MOL files and systematic identifiers to In. Ch. I(ca) Consistency of MOLs and systematic identifiers (in % agreement) within databases J. Chem. Inf. Model. 2011, 51, 3199– 3207

YOUR LOGO Вопросы? YOUR LOGO Вопросы?