Начало Технологии Иновации Запознайте се с Evo: Модел от следващо поколение предсказва ефектите от генните...

Запознайте се с Evo: Модел от следващо поколение предсказва ефектите от генните мутации с почти пълна точност

Снимка: Image by rawpixel.com on Freepik

Наречете го следващата граница в машинното обучение: учените са разработили голям езиков модел, Evo, за интерпретиране на данни за биологични последователности или генетичен код.

За да насочат изкуствения интелект в посока на биологията, учените от института Arc създават версия 1.0 на „геномен основополагащ модел“, като геномът е последователност, кодирана с ДНК, РНК и протеини, обучен с милиони микроби вместо думи.

С това солидно количество биологични данни моделът работи подобно на моделите за изучаване на езици (LLM), като Google Gemini, според Live Science, или GPT в ChatGPT.

Наред с възможностите си той може да се учи и да прогнозира как малки промени в последователността ще се отразят на целия организъм, което превръща този потенциално революционен изкуствен интелект в мощен инструмент в ръцете на медицинските изследователи.

Въпреки че е само в начален стадий и все още не може да обработва човешки данни, Evo би могъл да помогне на учените да разберат функциите на повече ДНК и РНК последователности и дори да „ускори способността ни да конструираме живот“, според неговите пионери инженери.

„Evo представлява значителен напредък в способността ни да разбираме и проектираме биологията в множество модалности и мащаби на сложност.“

Машинното обучение навлезе в областта на биологията с Evo

Учени от Института Arc са създали бърз мултимодален модел на изкуствен интелект с висока резолюция, който е анализирал 2,7 млн. генома на прокариоти и фаги, за да може да прави прогнози и дори да генерира последователности от кодове.

Както се посочва в изследователската статия, публикувана в Science, дори най-простите микробни геноми са „невероятно сложни“, което представлява огромно предизвикателство при прилагането на изкуствен интелект в биологията.

Въпреки това, според авторите на изследването, „Evo е разработил цялостно разбиране на сложния генетичен код на живота – от ДНК базите до целите геноми“, използвайки микробите като отправна точка.

„Това позволява на модела да прогнозира как малки промени в ДНК влияят върху физическата годност на организма, да генерира реалистични последователности с дължина на генома и да проектира нови биологични системи, включително лабораторно валидиране на синтетични системи CRISPR и транспозони IS200/IS605.“

Всяка базова двойка, или основата на ДНК, от предоставените геноми действа като дума, според Live Science. Логично, Evo оценява тези последователности въз основа на обучението си, за да предвиди резултата и дори да напише код или „последователности“.

Инженерите са създали Evo, за да уловят два фундаментални и изключително сложни аспекта на биологията: мултимодалността на централната догма, „която интегрира ДНК, РНК и протеини с единен код и предсказуем информационен поток“, и „многомащабната природа на еволюцията“.

Това се отнася до „изключително различните мащаби на дължина на биологичните функции, представени от молекули, пътища, клетки и организми“. Претоварване с информация.

Интелигентната биология е пред нас

Постигнатите от тях резултати изглеждат обещаващи, но това е само дебютът на Evo, версия 1.0. Той все още не е достигнал нивото на човешката генетика, но може да се научи, и то бързо, след като Институтът Arc е отворил нов път за машинно обучение, което би било новаторска посока за ИИ.

Изследователската статия е току-що публикувана в Science.

Източник: InterestingEngineering