Ученые разработали программу, которая высчитывает свойства молекул сложных химических соединений
Группа ученых из Московского физико-технического института (МФТИ), работавшая совместно с их коллегами из Исследовательского центра Inria, Гренобль, Франция, разработала пакет программного обеспечения под названием Knodle. Этот пакет путем анализа атомарного состава, конфигурации химических связей между атомами и функциональных атомарных групп может с большой точностью рассчитать химические свойства анализируемой молекулы. А использование такой программы значительно сократит время одного из этапов процесса разработки новых химических реагентов и лекарственных препаратов.
Предположите, что вам требуется создать новый лекарственный препарат. Благодаря определенным химическим и физическим свойствам ингредиентов этого препарата он после введения в тело человека должен воздействовать только на источник определенного заболевания. На молекулярном уровне эти источники являются белками определенных типов или определенными цепочками молекул ДНК. К примеру, в случае разработки противовирусных препаратов такими целями являются участки вирусной ДНК, которую вирусы встраивают в ДНК клеток человека. Препарат должен сделать невозможным внедрение в ДНК человека вирусной ДНК, и при его эффективном действии вирусная инфекция просто погибнет.
Для разработки лекарственных препаратов ученые обычно используют огромную базу данных свойств различных химических соединений и программное обеспечение, выискивающее "иголку в стоге сена". Помимо этого ученые используют некоторые химические, физические и квантово-механические принципы для вычисления мест в молекулах белков и ДНК, которые "привлекают" к себе источники различных заболеваний. Обычно в используемых учеными базах хранится информация о форме и некоторых химических свойствах молекул, но для более точного поиска соответствий требуется также знание атомарного состава и структуры химических связей. И тут в дело вступает программа Knodle, которая позволяет сузить области поисков в сотни и сотни тысяч раз. И вполне естественно, что это позволяет найти необходимые для нового лекарственного препарата ингредиенты гораздо быстрее.
Благодаря школьным урокам химии все привыкли рассматривать молекулы химических соединений как шарики, связанные тонкими проволочками. Но на самом деле в молекулах нет никаких проволок, атомы в молекулах связываются путем разделения электронов, которые повинуются уже не законам обычной физики, а законам квантовой механики. Глядя на структуру простой молекулы, опытный химик на глаз определяет структуру атомарных связей, но для того, чтобы вычислить химические свойства этой молекулы, ему потребуется несколько часов и информация из различных справочников. В некоторых случаях ученым-химикам требуется меньшее время из-за того, что им ранее уже доводилось иметь дело с сотнями подобных веществ и они на интуитивном уровне знают свойства данного химического соединения. Именно эту "интуицию" передали компьютерной программе Knodle ее разработчики, Мария Кадукова из МФТИ и Сергей Грудинин из центра Inria.
Научную "интуицию" программа обрела за счет использования технологии глубинного машинного изучения, которая является самым эффективным на сегодняшний день средством обучения компьютера простым вещам. Помимо этого программа Knodle использует алгоритм nonlinear support vector machines (SVM), который широко используется в системах распознания рукописного текста и изображений. Но на вход этих алгоритмов подаются не изображения, а информация об атомах молекулы, их относительном расположении и о химических связях, соединяющих это все в единое целое.
Процесс качественного обучения нуждается в достаточно большом количестве примеров, и ученые использовали для этого информацию об 7605 химических веществах, имеющих известную структуру и их свойствах. "Это является главным отличием и преимуществом программы Knodle перед другими подобными программами. Наша программа демонстрирует погрешность в расчетах на уровне 3.9 процентов, в то время, как ближайший конкурент обеспечивает погрешность на уровне 4.7 процента - рассказывает Мария Кадукова. - Кроме этого наш пакет программ может быть легко ориентирован на выполнение какой-либо конкретной задачи. И хочется надеяться, что наша работа будет способствовать нахождению методов лечения заболеваний, которые ранее считались неизлечимыми".