Клиническое применение мультимодального искусственного интеллекта в оториноларингологии: современный обзор
Clinical Applications of Multimodal Artificial Intelligence in Otolaryngology: A State-of-the-Art Review
Аннотация
Цель: Искусственный интеллект (ИИ) достиг уровня, при котором способен одновременно обрабатывать визуальные, аудиальные и текстовые данные, формируя «мультимодальный» ИИ. С учётом потенциала интеграции этих инструментов в клиническую практику оториноларингологам необходимо быть в курсе их возможностей. В данном исследовании проведён обзор современной литературы по применению мультимодального ИИ в оториноларингологии.
Источники данных: базы данных MEDLINE, EMBASE, SCOPUS, Cochrane Library, Web of Science и CINAHL.
Методы обзора: Поиск в базах данных проводили с момента их создания по 4 марта 2025 г. в соответствии с расширением руководства Preferred Reporting Items for Systematic Reviews and Meta-analyses для обзоров с целью картирования литературы (PRISMA-ScR). Включали исследования любого применения мультимодального ИИ в оториноларингологии.
Выводы: В обзор включили 44 исследования; 55% (24/44) были опубликованы в 2024 г. и 18% (8/44) — в 2025 г. Наиболее часто сочетались изображения и текст (80%, 35/44), тогда как к новым комбинациям относились видео с векторными данными (2%, 1/44), а также омиксные данные с текстом и/или изображениями (14%, 6/44). Чаще всего исследования были посвящены раку головы и шеи (75%, 33/44), затем общим проблемам уха, горла и носа (11%, 5/44). Во всех исследованиях модели применяли для медицинского обучения (9%, 4/44) или поддержки принятия клинических решений (91%, 40/44), оценивая их эффективность в таких областях, как выполнение экзаменационных заданий (точность 37–86%) или классификация и прогнозирование заболеваний (площадь под ROC-кривой [AUC] 0,65–0,96). Однако большинство исследований были ограничены небольшими выборками из одного центра и не имели проспективной валидации. Ошибки моделей, смещение данных и языковые ограничения подчёркивают необходимость дальнейшего совершенствования.
Значение для практики: Применение мультимодальных больших языковых моделей в оториноларингологии быстро расширяется. Клиническим врачам необходимо понимать как возможности, так и ограничения этих систем. Для их безопасного, справедливого и эффективного внедрения в оториноларингологическую помощь потребуются строгая валидация и этический контроль.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.