Модели машинного обучения для прогнозирования миомы матки
Machine learning models for the prediction of uterine fibroids
Аннотация
В этом поперечном исследовании разработали и валидировали прогностическую модель риска миомы матки на основе рутинных показателей физикального обследования и 5 алгоритмов машинного обучения: логистической регрессии, случайного леса, k ближайших соседей, категориального бустинга (CatBoost) и машины градиентного бустинга с малым шагом (LightGBM). Основной набор данных включал результаты медицинских осмотров в Beijing MJ Health Screening Center (Пекин, Китай) за 2013–2023 годы; независимый внешний набор данных за 2024 год использовали для оценки обобщаемости.
Регрессия LASSO выявила 13 значимых предикторов, включая возраст, индекс массы тела, общий холестерин, диастолическое артериальное давление и семейное положение. Среди моделей CatBoost показал наилучшие результаты, достигнув площади под ROC-кривой 0,808 во внутренней валидационной выборке и 0,821 во внешней валидационной выборке, что указывает на высокую прогностическую способность и устойчивость. Анализ SHapley Additive exPlanations показал, что наиболее важными предикторами были возраст и индекс массы тела, а общий холестерин являлся ключевым прогностическим признаком; его значение для метаболизма липидов дополнительно обсуждается в основной части статьи. Несмотря на высокие значения площади под ROC-кривой, специфичности и чувствительности, модель демонстрировала ограничения по точности (0,475) и умеренной общей точности (0,742), что указывает на трудности контроля числа ложноположительных результатов. Полученные данные свидетельствуют, что модель может быть эффективным скрининговым инструментом для выявления лиц высокого риска, которым может потребоваться дальнейшее диагностическое обследование. Хотя исследование подтверждает возможность использования данных рутинного медицинского осмотра в сочетании с алгоритмом CatBoost для ранней оценки риска миомы матки, оно также указывает на необходимость осторожной интерпретации прогнозов модели в клинической практике. В будущем необходимы многоцентровые исследования с большим числом наблюдений, чтобы повысить обобщаемость модели и включить дополнительные прогностические факторы для оптимизации ее эффективности.
Переведем эту статью за 1 час
Загрузите PDF, а мы сделаем полный перевод, краткий конспект и красивую инфографику.
Попробовать бесплатно →Также в Подтеме: еженедельные литобзоры, база международных клинреков и конспекты свежих мед. статей и подкастов каждый день.