Научная статья

TPM, FPKM или нормализованные счета? Сравнительное исследование методов количественной оценки при анализе RNA-seq-данных из репозитория моделей, полученных от пациентов, NCI

TPM, FPKM, or Normalized Counts? A Comparative Study of Quantification Measures for the Analysis of RNA-seq Data from the NCI Patient-Derived Models Repository

Journal of Translational Medicine
10.1186/s12967-021-02936-w
Полный текст Открыть в журнале PubMed PMC
FWCI: 30.4FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Процитировано: 417 · Ссылки: 45 · Лицензия: CC-BY
Цитирование по годам: 2026: 32 · 2025: 135 · 2024: 190 · 2023: 75 · 2022: 63

Аннотация

Введение: Для корректной интерпретации фенотипической информации из данных секвенирования РНК (RNA-seq) решающее значение имеет тщательный выбор метода количественной оценки, особенно при межвыборочном сравнении и последующих анализах, таких как дифференциальная экспрессия генов между двумя или более состояниями. Был предложен и продолжает использоваться ряд методов. Однако консенсуса относительно наилучшего метода количественной оценки экспрессии генов для анализа RNA-seq-данных до сих пор нет.

Методы: В настоящем исследовании использовали парные образцы из каждой из 20 моделей ксенотрансплантатов, полученных от пациентов (PDX), охватывающих 15 типов опухолей; всего было проанализировано 61 образец ксенотрансплантатов опухолей человека, доступный через репозиторий моделей, полученных от пациентов, NCI (PDMR). Воспроизводимость между парными образцами сравнивали на основе TPM (transcripts per million), FPKM (fragments per kilobase of transcript per million fragments mapped) и нормализованных счетов с использованием коэффициента вариации, внутриклассового коэффициента корреляции и кластерного анализа.

Результаты: Иерархическая кластеризация на данных нормализованных счетов чаще точнее объединяла парные образцы из одной и той же модели PDX, чем данные TPM и FPKM. Кроме того, для данных нормализованных счетов была отмечена самая низкая медиана коэффициента вариации (CV) и самые высокие значения внутриклассовой корреляции (ICC) как между парными образцами одной модели, так и для одного и того же гена во всех моделях PDX по сравнению с данными TPM и FPKM.

Выводы: Мы представили убедительные доказательства в пользу предпочтительного метода количественной оценки для последующего анализа RNA-seq-данных PDX. Насколько нам известно, это первое сравнительное исследование методов количественной оценки RNA-seq-данных на моделях PDX, которые, как известно, изначально более вариабельны, чем клеточные линии. Наши результаты согласуются с данными, полученными другими авторами для опухолей человека и клеточных линий, и дополнительно подтверждают, что нормализованные счета являются наилучшим выбором для анализа RNA-seq-данных между образцами.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.