Диагностическая точность искусственного интеллекта по сравнению с 263 педиатрами при детских экзантемах
Diagnostic accuracy of artificial intelligence versus 263 pediatric clinicians for childhood exanthems
Аннотация
Педиатрические экзантематозные заболевания представляют диагностические трудности из-за перекрывающихся клинических проявлений. Целью исследования было определить, достигают ли современные модели искусственного интеллекта диагностической точности, сопоставимой с показателями педиатрических ординаторов и специалистов или превосходящей их, при частых заболеваниях, сопровождающихся сыпью. Участников и модели искусственного интеллекта сопоставляли с окончательными диагнозами, подтвержденными клиническими признаками, лабораторными данными и консенсусом двух детских инфекционистов. Добровольную выборку составили 263 педиатра: 107 ординаторов (1–4-й годы обучения) и 156 специалистов. Каждый врач заполнял слепую анкету с множественным выбором по каждому случаю, где были представлены клиническая фотография и сопутствующие клинические данные. Те же случаи были предложены трем моделям искусственного интеллекта: ChatGPT, Gemini и Copilot. Среди 263 врачей (107 ординаторов, 156 специалистов) специалисты набрали больше баллов, чем ординаторы (медиана 46 [межквартильный размах 42–50] против 41 [36–46]; P < 0,001; r = 0,32). ChatGPT правильно поставил диагноз в 53 из 61 случая (86,9%), Gemini — в 50 (82,0%), Copilot — в 44 (72,1%). И ChatGPT, и Gemini превысили верхнюю границу 95% ДИ медианы в группе специалистов (47,17). Все три модели искусственного интеллекта превысили верхнюю границу 95% ДИ у ординаторов (42,76). Точность на уровне отдельных заболеваний варьировала от 0% (укусы насекомых, все модели) до 100% (9 состояний, все модели). Ординаторы 4-го года обучения набирали больше баллов, чем ординаторы 1-го и 2-го года (P = 0,001; ε = 0,13). Выводы: модели искусственного интеллекта, которым предоставляли клинические данные вместе с изображениями, достигали уровня специалистов или превосходили его при детских экзантемах. Точность различалась в зависимости от заболевания; ошибки чаще возникали при состояниях, требующих контекстного анализа. Там, где точность искусственного интеллекта минимальна, необходим врачебный контроль.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры и база международных клинреков по педиатрии.