Миналата година DeepMind пусна база данни с отворен код за 3D структурите на стотици хиляди протеини, включително всичките 20 000 известни протеини в човешкото тяло. Сега тази база данни е разширена до 200 милиона, включително почти всички протеини, известни на науката.
Протеините са “работните коне” на живите клетки, извършващи неизброим брой биологични процеси, жизненоважни за живота. Но остава трудно да се изчисли точната им структура въз основа на аминокиселините, които ги съставят. Изясняването на това обикновено изисква огромно количество изчислителна мощност и работни часове. Напредъкът се случваше изключително бавно през десетилетията.
Така беше, докато Alphabet не настрои мощния си DeepMind AI, насочен към разрешаването на проблема. Първоначално обучен върху 100 000 известни протеинови структури, системата разви способността да предсказва структурите на много милиони други протеини, като всеки от тях отнема само минути или секунди, вместо месеци или години, за да се установи. През юли 2021 г. първата AlphaFold Protein Structure Database беше пусната на обществеността, за да могат учените да я изследват. Първоначално съдържаше над 350 000 протеинови структури и по-късно беше разширен до около милион протеинови структури. През изминалата година над 500 000 учени от цял свят са получили достъп до базата данни, за да подпомогнат своите изследвания.
Сега DeepMind пусна огромна нова актуализация на базата данни, която вече включва около 214 милиона структури от милион вида. Това обхваща почти всеки протеин, известен в момента на науката, предлагайки огромна полза за изследванията на лечение на болести, ваксини, устойчивост, антибиотична резистентност и дори пластмасово замърсяване.
Източник: New Atlas

































