Новое исследование Йоркского университета определило ключевые стратегии для смягчения последствий смещения данных и обеспечения надежной работы медицинских ИИ-систем. Исследователи разработали и протестировали систему раннего предупреждения для прогнозирования риска смертности пациентов в семи крупных больницах Торонто. Анализ, основанный на крупнейшей в Канаде сети обмена больничными данными GEMINI, охватил более 143 000 случаев. Было обнаружено, что смещения в данных, касающихся демографии, типа больницы и времени поступления, могут существенно влиять на точность прогнозов ИИ, что подчеркивает необходимость постоянного контроля и адаптации моделей. Как отмечают авторы исследования, по мере роста использования ИИ в больницах для прогнозирования различных исходов, от смертности до сепсиса, возрастает и потребность в гарантиях их корректной работы. Данные для обучения клинических ИИ-моделей должны точно отражать разнообразие пациентов, заболеваний и медицинских практик. В противном случае модель может генерировать нерелевантные или даже вредоносные прогнозы, включая неточные диагнозы, что создает риски для пациентов. Для решения этой проблемы ученые предложили использовать стратегии проактивного, непрерывного и трансферного обучения. Трансферное обучение позволяет модели применять знания, полученные в одной области, к другой, а непрерывное обучение обновляет модель на основе постоянного потока новых данных. Эти подходы помогают предотвратить вредоносные сдвиги в данных, например, вызванные пандемией COVID-19, и со временем повышают производительность и справедливость клинических ИИ-систем.