Обзор

Смещение данных в медицинском машинном обучении: последствия и возможные способы коррекции

Data drift in medical machine learning: implications and potential remedies

The British Journal of Radiology
10.1259/bjr.20220878
Полный текст Открыть в журнале PubMed PMC
FWCI: 31.1FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Процитировано: 187 · Ссылки: 75 · Лицензия: Закрытая
Цитирование по годам: 2026: 43 · 2025: 89 · 2024: 43 · 2023: 10

Аннотация

Смещение данных означает различия между данными, на которых обучали модель машинного обучения, и данными, с которыми она работает в реальной клинической практике. Медицинские системы машинного обучения могут сталкиваться с различными видами смещения данных, включая различия между выборкой для обучения и данными клинического применения, различия в медицинской практике или контексте использования между этапом обучения и клиническим применением, а также временные изменения популяции пациентов, структуры заболеваний и способов получения данных.

В статье сначала рассматриваются термины, используемые в литературе по машинному обучению для обозначения смещения данных, определяются его различные типы и подробно обсуждаются возможные причины в контексте медицинских приложений с акцентом на медицинскую визуализацию. Затем анализируется недавняя литература о влиянии смещения данных на медицинские системы машинного обучения, которая убедительно показывает, что смещение данных может быть одной из основных причин ухудшения качества работы. Далее обсуждаются методы мониторинга смещения данных и снижения его последствий с акцентом на подходы до и после внедрения системы. Рассматриваются некоторые возможные методы выявления смещения и вопросы, связанные с дообучением модели при обнаружении смещения. По результатам обзора авторы приходят к выводу, что смещение данных представляет собой серьезную проблему при внедрении медицинского машинного обучения, и для того чтобы модели машинного обучения могли рано выявлять смещение, использовать эффективные стратегии его коррекции и противостоять снижению качества работы, необходимы дальнейшие исследования.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.