Прогнозирование атомарной структуры белка на эволюционном масштабе с помощью языковой модели
Evolutionary-scale prediction of atomic-level protein structure with a language model
Аннотация
Недавние достижения в машинном обучении позволили использовать эволюционную информацию из множественных выравниваний последовательностей для предсказания структуры белка. Мы показали возможность прямого вывода полной атомарной структуры белка из первичной последовательности с помощью крупной языковой модели. По мере увеличения масштаба языковых моделей белковых последовательностей до 15 млрд параметров в обученных представлениях возникает атомарно-разрешённое изображение структуры белка. Это обеспечивает ускорение высокоточного предсказания структуры на порядок и позволяет проводить масштабную структурную характеристику метагеномных белков. Мы применили эту возможность для создания ESM Metagenomic Atlas, предсказав структуры для более чем 617 млн метагеномных белковых последовательностей, включая более 225 млн, для которых прогноз выполнен с высокой уверенностью, что позволяет увидеть огромный размах и разнообразие природных белков.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.