Научная статья

Оптимизация таксономической классификации ампликонных последовательностей маркерных генов с помощью плагина q2-feature-classifier для QIIME 2

Optimizing taxonomic classification of marker-gene amplicon sequences with QIIME 2's q2-feature-classifier plugin

Microbiome
10.1186/s40168-018-0470-z
Полный текст Открыть в журнале PubMed PMC
FWCI: 129FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Процитировано: 5089 · Ссылки: 39 · Лицензия: CC-BY
Цитирование по годам: 2026: 332 · 2025: 1058 · 2024: 1234 · 2023: 1057 · 2022: 883

Аннотация

Введение: Таксономическая классификация последовательностей маркерных генов — важный этап анализа микробиома. Результаты: Мы представляем q2-feature-classifier (https://github.com/qiime2/q2-feature-classifier) — плагин для QIIME 2, содержащий несколько новых методов машинного обучения и методов на основе выравнивания для таксономической классификации. Мы оценили и оптимизировали несколько широко используемых методов классификации, реализованных в QIIME 1 (RDP, BLAST, UCLUST и SortMeRNA), а также несколько новых методов, реализованных в QIIME 2 (классификатор на основе наивного байесовского алгоритма машинного обучения scikit-learn и методы консенсуса таксономии на основе выравнивания, основанные на VSEARCH и BLAST+), для классификации ампликонных последовательностей бактериальной 16S рРНК и грибковых маркерных последовательностей ITS. Классификаторы на основе наивного байесовского алгоритма, BLAST+ и VSEARCH, реализованные в QIIME 2, обеспечивают точность на уровне вида, не уступающую или превосходящую точность других широко используемых методов, предназначенных для классификации последовательностей маркерных генов, которые были оценены в этой работе. Эти оценки, основанные на 19 модельных сообществах и симуляциях без ошибок, включая классификацию смоделированных «новых» последовательностей маркерных генов, доступны в нашей расширяемой системе бенчмаркинга tax-credit (https://github.com/caporaso-lab/tax-credit-data). Выводы: Наши результаты показывают, насколько важно подбирать параметры для оптимизации работы классификатора, и мы даем рекомендации по выбору параметров для этих классификаторов в ряде стандартных условий. q2-feature-classifier и tax-credit — бесплатные проекты с открытым исходным кодом под лицензией BSD, доступные на GitHub.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.