Нехватка прозрачности и потенциальная предвзятость в наборах данных и алгоритмах искусственного интеллекта: обзор области
Lack of Transparency and Potential Bias in Artificial Intelligence Data Sets and Algorithms: A Scoping Review
Аннотация
Важность: Клинические алгоритмы искусственного интеллекта могут улучшить оказание медицинской помощи, но справедливые и обобщаемые алгоритмы зависят от клинических данных, на которых их обучают и тестируют.
Цель: Оценить, достаточно ли подробно описаны наборы данных, используемые для обучения диагностических алгоритмов искусственного интеллекта, посвящённых заболеваниям кожи, и выявить потенциальные источники предвзятости в этих наборах данных.
Источники данных: В этом обзоре области для поиска рецензируемых научных статей, опубликованных с 1 января 2015 г. по 1 ноября 2020 г., использовали PubMed со следующими парными поисковыми запросами: deep learning и dermatology, artificial intelligence и dermatology, deep learning и dermatologist, artificial intelligence и dermatologist.
Отбор исследований: Отбирали исследования, в которых разрабатывали или тестировали существующий алгоритм глубокого обучения для сортировки, диагностики или мониторинга на основе клинических или дерматоскопических изображений заболеваний кожи; статьи независимо оценивали 2 исследователя, чтобы подтвердить соответствие критериям отбора.
Процесс согласования: Критерии аудита наборов данных были определены по согласованию всех авторов после анализа имеющейся литературы для выявления прозрачности наборов данных и источников предвзятости.
Результаты: Включено 70 уникальных исследований. В этих исследованиях для разработки или тестирования алгоритмов искусственного интеллекта использовали 1 065 291 изображение, из которых только 257 372 (24,2%) были общедоступными. Лишь 14 исследований (20,0%) содержали описание этнической принадлежности или расы пациентов хотя бы в одном используемом наборе данных. Только 7 исследований (10,0%) включали какую-либо информацию о тоне кожи хотя бы в одном наборе данных. Тридцать шесть из 56 исследований, в которых разрабатывали новые алгоритмы искусственного интеллекта для злокачественных новообразований кожи (64,3%), соответствовали критериям золотого стандарта для маркировки заболевания. Общедоступные наборы данных цитировали чаще, чем частные, что указывает на их больший вклад в новое развитие и сравнительные эталоны.
Выводы и значимость: Этот обзор области выявил 3 проблемы в наборах данных, которые используют для разработки и тестирования клинических алгоритмов искусственного интеллекта при заболеваниях кожи и которые необходимо решить до внедрения в клиническую практику: (1) скудное описание наборов данных и недостаток прозрачности, (2) нестандартные и непроверенные метки заболеваний и (3) невозможность в полной мере оценить разнообразие пациентов, использованных для разработки и тестирования алгоритмов.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры и база международных клинреков по дерматологии.