Анализ данных в клинических больших данных: наиболее часто используемые базы данных, этапы и методологические модели
Data mining in clinical big data: the frequently used databases, steps, and methodological models
Аннотация
Из публичных баз данных, таких как Surveillance, Epidemiology, and End Results (SEER), National Health and Nutrition Examination Survey (NHANES), The Cancer Genome Atlas (TCGA) и Medical Information Mart for Intensive Care (MIMIC), получено много высококачественных исследований; однако для этих данных характерны высокая размерная неоднородность, разновременность, дефицитность, нерегулярность и другие особенности, из-за чего их потенциал используется не полностью. Технологии анализа данных стали передовым направлением медицинских исследований, поскольку они хорошо подходят для оценки риска у пациентов и поддержки клинических решений при построении моделей прогноза заболеваний. Поэтому анализ данных имеет уникальные преимущества в исследованиях клинических больших данных, особенно в крупных медицинских публичных базах данных. В статье в простой форме представлены основные медицинские публичные базы данных, а также описаны этапы, задачи и модели анализа данных. Кроме того, приведены методы анализа данных и их практическое применение. Цель работы — помочь клиническим исследователям получить ясное и наглядное представление о применении технологий анализа данных к клиническим большим данным, чтобы способствовать получению результатов исследований, полезных для врачей и пациентов.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.