Алгоритм сравнения ДНК

0

Ученые из РФ научились быстро сравнивать ДНК разных «наборов» микробов

Биологи и программисты из России создали алгоритм, который позволяет быстро сравнивать между собой ДНК нескольких микробов, живущих в самых разных средах обитания, что поможет в разработке средств персонализированной медицины, говорится в статье, опубликованной в журнале Bioinformatics.

«При исследовании микрофлоры кишечника могут быть выявлены микробы, связанные с каким-либо заболеванием, например, с диабетом. А это уже предпосылки для применения персонализированной медицины и создания новых лекарств. Оперируя результатами работы программы, биологи могут сделать выводы о том, в каком направлении двигаться, поскольку алгоритм позволяет исследовать среды, о которых мы еще ничего не знаем», – объясняет Владимир Ульянцев из Университета ИТМО в Санкт-Петербурге, чьи слова приводит пресс-служба МФТИ.

Ульянцев и его коллеги из ИТМО, ФНКЦ физико-химической медицины и МФТИ сделали шаг к созданию персонализированной медицины, учитывающей не только особенности в работе организма человека, но и структуру его микрофлоры, изучая так называемый метагеном.

Как рассказывают ученые, у каждого человека есть геном – особая последовательность генов, в соответствии с которой развивается индивид. Однако любой живой организм содержит еще одну последовательность генов, которая называется метагеном и представляет собой совокупность ДНК самых различных микроорганизмов, обитающих в одной среде: бактерий, грибов, вирусов.

Метагеном часто является индикатором различных заболеваний и предрасположенности к ним. Поэтому изучение микробиоты, то есть совокупности микроорганизмов, населяющих различные отделы человеческого организма, занимает особое место в метагеномных исследованиях. Российские биоинформатики создали средство, которое позволяет не только быстро изучать метагеномы, но и сравнивать их между собой.

«Разработанный подход позволяет сделать сразу две вещи: найти все возможные генетические последовательности, даже если о них не было известно до этого – программа собирает их из кусочков геномных прочтений, и одновременно выделить метагеномные закономерности, которые отделяют одних пациентов от других. Например, больных и здоровых людей», – добавил Дмитрий Алексеев из Московского Физтеха в Долгопрудном.

Отличительная особенность российской системы — ее открытость. Код MetaFast был выложен на опенсорс-платформе GitHub, где его может скачать и использовать для своих целей любой желающий. Программа, по словам ученых, работает и на системах на платформе Windows, и на открытых операционых системах GNU/Linux. В отличие от «конкурентов», для ее работы не требуется обширная база эталонных геномов или астрономические объемы оперативной памяти и суперкомпьютерный центр — к пример, анализ метагенома жителей Китая занял всего 34 часа и потребовал 90 гигабайт памяти и ресурсов 20 процессоров.

Получив данные о таких различиях, ученые смогут изучить их на практике, используя другие методики анализа генома, работающие непосредственно с геномом микробов и их клетками. По словам авторов статьи, программа потенциально способна сократить сроки создания новых лекарств в несколько раз.
Как отмечает Алексеев, созданная его командой система может анализировать не только бактерий, но и вирусы и неизвестные последовательности ДНК, присутствующие в метагеномном «супе» в единственном экземпляре.

Помимо персонализированной медицины, данную систему можно применять и для других исследований – для поиска редких микробов в пока не тронутых человеком уголках природы, а также для раскрытия вреда, который антибиотики и другие лекарства могли нанести микрофлоре за последний век.

Ознакомиться с работами ученых:

MetaFast: fast reference-free graph-based comparison of shotgun metagenomic data.Vladimir I. Ulyantsev,Sergey V. Kazakov, Veronika B. Dubinkina,

Alexander V. Tyakht and Dmitry G. Alexeev.

Availability: Source code and binaries are freely available for download at https://github.com/ctlab/metafast. The code is written in Java and is platform independent (tested on Linux and Windows x86_64).