Сравнительное исследование

Диагностическая точность искусственного интеллекта по сравнению с 263 педиатрами при детских экзантемах

Diagnostic accuracy of artificial intelligence versus 263 pediatric clinicians for childhood exanthems

European Journal of Pediatrics
10.1007/s00431-026-07044-9
Полный текст Открыть в журнале PubMed PMC
FWCI: 0.00FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Ссылки: 16 · Лицензия: CC-BY

Аннотация

Педиатрические экзантематозные заболевания представляют диагностические трудности из-за перекрывающихся клинических проявлений. Целью исследования было определить, достигают ли современные модели искусственного интеллекта диагностической точности, сопоставимой с показателями педиатрических ординаторов и специалистов или превосходящей их, при частых заболеваниях, сопровождающихся сыпью. Участников и модели искусственного интеллекта сопоставляли с окончательными диагнозами, подтвержденными клиническими признаками, лабораторными данными и консенсусом двух детских инфекционистов. Добровольную выборку составили 263 педиатра: 107 ординаторов (1–4-й годы обучения) и 156 специалистов. Каждый врач заполнял слепую анкету с множественным выбором по каждому случаю, где были представлены клиническая фотография и сопутствующие клинические данные. Те же случаи были предложены трем моделям искусственного интеллекта: ChatGPT, Gemini и Copilot. Среди 263 врачей (107 ординаторов, 156 специалистов) специалисты набрали больше баллов, чем ординаторы (медиана 46 [межквартильный размах 42–50] против 41 [36–46]; P < 0,001; r = 0,32). ChatGPT правильно поставил диагноз в 53 из 61 случая (86,9%), Gemini — в 50 (82,0%), Copilot — в 44 (72,1%). И ChatGPT, и Gemini превысили верхнюю границу 95% ДИ медианы в группе специалистов (47,17). Все три модели искусственного интеллекта превысили верхнюю границу 95% ДИ у ординаторов (42,76). Точность на уровне отдельных заболеваний варьировала от 0% (укусы насекомых, все модели) до 100% (9 состояний, все модели). Ординаторы 4-го года обучения набирали больше баллов, чем ординаторы 1-го и 2-го года (P = 0,001; ε = 0,13). Выводы: модели искусственного интеллекта, которым предоставляли клинические данные вместе с изображениями, достигали уровня специалистов или превосходили его при детских экзантемах. Точность различалась в зависимости от заболевания; ошибки чаще возникали при состояниях, требующих контекстного анализа. Там, где точность искусственного интеллекта минимальна, необходим врачебный контроль.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры и база международных клинреков по педиатрии.