Научная статья

Клиническое применение мультимодального искусственного интеллекта в оториноларингологии: современный обзор

Clinical Applications of Multimodal Artificial Intelligence in Otolaryngology: A State-of-the-Art Review

Otolaryngology--Head and Neck Surgery : Official Journal of American Academy of Otolaryngology-Head and Neck Surgery

12 мая 2026 Li Y.J., Su F., Banyi N. и др. Открытый доступ

FWCI: 0.00 · Ссылки: 79 · Лицензия: CC-BY

Цель: Искусственный интеллект (ИИ) достиг уровня, при котором способен одновременно обрабатывать визуальные, аудиальные и текстовые данные, формируя «мультимодальный» ИИ. С учётом потенциала интеграции этих инструментов в клиническую практику оториноларингологам необходимо быть в курсе их возможностей. В данном исследовании проведён обзор современной литературы по применению мультимодального ИИ в оториноларингологии.

Источники данных: базы данных MEDLINE, EMBASE, SCOPUS, Cochrane Library, Web of Science и CINAHL.

Методы обзора: Поиск в базах данных проводили с момента их создания по 4 марта 2025 г. в соответствии с расширением руководства Preferred Reporting Items for Systematic Reviews and Meta-analyses для обзоров с целью картирования литературы (PRISMA-ScR). Включали исследования любого применения мультимодального ИИ в оториноларингологии.

Выводы: В обзор включили 44 исследования; 55% (24/44) были опубликованы в 2024 г. и 18% (8/44) — в 2025 г. Наиболее часто сочетались изображения и текст (80%, 35/44), тогда как к новым комбинациям относились видео с векторными данными (2%, 1/44), а также омиксные данные с текстом и/или изображениями (14%, 6/44). Чаще всего исследования были посвящены раку головы и шеи (75%, 33/44), затем общим проблемам уха, горла и носа (11%, 5/44). Во всех исследованиях модели применяли для медицинского обучения (9%, 4/44) или поддержки принятия клинических решений (91%, 40/44), оценивая их эффективность в таких областях, как выполнение экзаменационных заданий (точность 37–86%) или классификация и прогнозирование заболеваний (площадь под ROC-кривой [AUC] 0,65–0,96). Однако большинство исследований были ограничены небольшими выборками из одного центра и не имели проспективной валидации. Ошибки моделей, смещение данных и языковые ограничения подчёркивают необходимость дальнейшего совершенствования.

Значение для практики: Применение мультимодальных больших языковых моделей в оториноларингологии быстро расширяется. Клиническим врачам необходимо понимать как возможности, так и ограничения этих систем. Для их безопасного, справедливого и эффективного внедрения в оториноларингологическую помощь потребуются строгая валидация и этический контроль.

мультимодальный искусственный интеллектоториноларингологиябольшие языковые моделиподдержка клинических решенийрак головы и шеивалидация моделейобзор литературы

Переведем эту статью за 1 час

Загрузите PDF, а мы сделаем полный перевод, краткий конспект и красивую инфографику.

Попробовать бесплатно →

Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.

Клиническое применение мультимодального искусственного интеллекта в оториноларингологии: современный обзор

Аннотация

Переведем эту статью за 1 час

Похожие статьи

Недавнее из этого журнала