Научная статья

Клиническое применение мультимодального искусственного интеллекта в оториноларингологии: современный обзор

Clinical Applications of Multimodal Artificial Intelligence in Otolaryngology: A State-of-the-Art Review

Otolaryngology--Head and Neck Surgery : Official Journal of American Academy of Otolaryngology-Head and Neck Surgery
10.1002/ohn.70285
Полный текст Открыть в журнале PubMed
FWCI: 0.00FWCI — Field-Weighted Citation Impact (индекс цитируемости с поправкой на область науки). 1.0 = среднее, > 1 = выше среднего · Ссылки: 79 · Лицензия: CC-BY

Аннотация

Цель: Искусственный интеллект (ИИ) достиг уровня, при котором способен одновременно обрабатывать визуальные, аудиальные и текстовые данные, формируя «мультимодальный» ИИ. С учётом потенциала интеграции этих инструментов в клиническую практику оториноларингологам необходимо быть в курсе их возможностей. В данном исследовании проведён обзор современной литературы по применению мультимодального ИИ в оториноларингологии.

Источники данных: базы данных MEDLINE, EMBASE, SCOPUS, Cochrane Library, Web of Science и CINAHL.

Методы обзора: Поиск в базах данных проводили с момента их создания по 4 марта 2025 г. в соответствии с расширением руководства Preferred Reporting Items for Systematic Reviews and Meta-analyses для обзоров с целью картирования литературы (PRISMA-ScR). Включали исследования любого применения мультимодального ИИ в оториноларингологии.

Выводы: В обзор включили 44 исследования; 55% (24/44) были опубликованы в 2024 г. и 18% (8/44) — в 2025 г. Наиболее часто сочетались изображения и текст (80%, 35/44), тогда как к новым комбинациям относились видео с векторными данными (2%, 1/44), а также омиксные данные с текстом и/или изображениями (14%, 6/44). Чаще всего исследования были посвящены раку головы и шеи (75%, 33/44), затем общим проблемам уха, горла и носа (11%, 5/44). Во всех исследованиях модели применяли для медицинского обучения (9%, 4/44) или поддержки принятия клинических решений (91%, 40/44), оценивая их эффективность в таких областях, как выполнение экзаменационных заданий (точность 37–86%) или классификация и прогнозирование заболеваний (площадь под ROC-кривой [AUC] 0,65–0,96). Однако большинство исследований были ограничены небольшими выборками из одного центра и не имели проспективной валидации. Ошибки моделей, смещение данных и языковые ограничения подчёркивают необходимость дальнейшего совершенствования.

Значение для практики: Применение мультимодальных больших языковых моделей в оториноларингологии быстро расширяется. Клиническим врачам необходимо понимать как возможности, так и ограничения этих систем. Для их безопасного, справедливого и эффективного внедрения в оториноларингологическую помощь потребуются строгая валидация и этический контроль.

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем краткий конспект, красивую инфографику и завернем в PDF.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.