Научная статья

Нехватка прозрачности и потенциальная предвзятость в наборах данных и алгоритмах искусственного интеллекта: обзор области

Lack of Transparency and Potential Bias in Artificial Intelligence Data Sets and Algorithms: A Scoping Review

JAMA Dermatology
10.1001/jamadermatol.2021.3129
Полный текст Открыть в журнале PubMed PMC
FWCI: 16.4FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Процитировано: 345 · Ссылки: 97 · Лицензия: Неизвестна
Цитирование по годам: 2026: 39 · 2025: 132 · 2024: 90 · 2023: 64 · 2022: 23

Аннотация

Важность: Клинические алгоритмы искусственного интеллекта могут улучшить оказание медицинской помощи, но справедливые и обобщаемые алгоритмы зависят от клинических данных, на которых их обучают и тестируют.

Цель: Оценить, достаточно ли подробно описаны наборы данных, используемые для обучения диагностических алгоритмов искусственного интеллекта, посвящённых заболеваниям кожи, и выявить потенциальные источники предвзятости в этих наборах данных.

Источники данных: В этом обзоре области для поиска рецензируемых научных статей, опубликованных с 1 января 2015 г. по 1 ноября 2020 г., использовали PubMed со следующими парными поисковыми запросами: deep learning и dermatology, artificial intelligence и dermatology, deep learning и dermatologist, artificial intelligence и dermatologist.

Отбор исследований: Отбирали исследования, в которых разрабатывали или тестировали существующий алгоритм глубокого обучения для сортировки, диагностики или мониторинга на основе клинических или дерматоскопических изображений заболеваний кожи; статьи независимо оценивали 2 исследователя, чтобы подтвердить соответствие критериям отбора.

Процесс согласования: Критерии аудита наборов данных были определены по согласованию всех авторов после анализа имеющейся литературы для выявления прозрачности наборов данных и источников предвзятости.

Результаты: Включено 70 уникальных исследований. В этих исследованиях для разработки или тестирования алгоритмов искусственного интеллекта использовали 1 065 291 изображение, из которых только 257 372 (24,2%) были общедоступными. Лишь 14 исследований (20,0%) содержали описание этнической принадлежности или расы пациентов хотя бы в одном используемом наборе данных. Только 7 исследований (10,0%) включали какую-либо информацию о тоне кожи хотя бы в одном наборе данных. Тридцать шесть из 56 исследований, в которых разрабатывали новые алгоритмы искусственного интеллекта для злокачественных новообразований кожи (64,3%), соответствовали критериям золотого стандарта для маркировки заболевания. Общедоступные наборы данных цитировали чаще, чем частные, что указывает на их больший вклад в новое развитие и сравнительные эталоны.

Выводы и значимость: Этот обзор области выявил 3 проблемы в наборах данных, которые используют для разработки и тестирования клинических алгоритмов искусственного интеллекта при заболеваниях кожи и которые необходимо решить до внедрения в клиническую практику: (1) скудное описание наборов данных и недостаток прозрачности, (2) нестандартные и непроверенные метки заболеваний и (3) невозможность в полной мере оценить разнообразие пациентов, использованных для разработки и тестирования алгоритмов.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры и база международных клинреков по дерматологии.