Исследование. Большие языковые модели часто и легко путаются в медицинских задачах

Большие языковые модели (LLM) — это мощные инструменты, которые уже применяются в медицинских задачах. От поиска диагнозов до помощи в анализе медицинских текстов. Но новое исследование, опубликованное в JAMA Network Open, показывает, что ИИ ещё далёк от уровня клинического мышления врача. 🧪 Как проверяли ИИ Учёные устроили языковым моделям небольшой «экзамен с подвохом». Идея проста - если модель действительно понимает вопрос, она должна уметь отказаться от всех вариантов и выбрать «нет правильного ответа». 📊 Результаты: точность резко упала Вот что получилось: Даже модели, которые специально обучались на рассуждениях, не справились идеально: Результаты говорят о том, что модели не всегда анализируют задачу по сути, а часто угадывают ответ по знакомым шаблонам. Тут и вскрываются главные отличия ИИ и человека. Человек-врач: ИИ-модель: ИИ иногда напоминает студента, который списывает у соседа, даже если тот сам написал неправильно. Использование ИИ в медицине обещает ускорить диагностику и снизить нагрузку на врачей, но результаты этого эксперимента показывают риски: 🏁 Вывод Медицинские LLM — мощный инструмент, но не замена врачу. Маленькая надежда - если модели научатся говорить «Я не знаю» и просить уточнения, уровень их пользы для медицины станет гораздо выше.