Чат-бот ChatGPT, способный выполнять широкий спектр задач, может создавать новые белки и генетические последовательности, согласно новому исследованию, опубликованному в журнале Science. Эта модель искусственного интеллекта, известная как Evo, обучена на миллиардах генетических последовательностей и может помочь в изучении эволюции, разработке лекарств и других областях биомедицины.
Исследователи создали Evo под руководством Брайана Хи из Стэнфордского университета, который увеличил длину контекста и разрешение модели для лучшего анализа ДНК. Evo обучен на 300 миллиардах нуклеотидов, включая 80 000 геномов микробов и миллионы последовательностей вирусов и плазмид. Чтобы избежать создания биологического оружия, исследователи исключили вирусы, нацеленные на людей или другие эукариоты.
Evo успешно предсказал влияние мутаций на белки, что важно для разработки лекарств и понимания болезней. Он также разработал новые версии редактора генома CRISPR и синтезировал белки Cas, которые работали так же эффективно, как и коммерческие версии. Однако модель иногда давала ошибочные результаты, но в целом работала лучше, чем случайные догадки.
Evo также сгенерировал имитационные геномы для бактерий, которые, хотя и не были полностью функциональны, могут стать шагом к синтетическим геномам, созданным с помощью ИИ.
Базовые модели, подобные Evo, важны для изучения генома, и это исследование, по мнению некоторых экспертов, является значительным шагом вперед. Evo особенно выделяется экспериментальным подтверждением прогнозов модели и большим объемом данных для обучения.
Исследователи опубликовали Evo для других ученых и не планируют его коммерциализировать.