Революция в памяти. Как ИИ научили не терять нить разговора

Представьте разговор, в котором ваш собеседник внезапно забывает, о чём вы говорили пять минут назад. Именно так ведут себя современные ИИ-ассистенты, когда диалог становится слишком длинным. Эта проблема называется контекстным угасанием (context rot) — явление, при котором модель буквально теряет память о прошлых этапах беседы, даже если они критически важны для решения задачи. Китайские исследователи нашли элегантное решение. Они создали систему GAM (General Agentic Memory) — архитектуру памяти, которая работает как человеческий мозг, который не пытается запомнить всё подряд, а сохраняет контекст умно и достаёт нужное ровно в тот момент, когда это действительно требуется. Почему ИИ забывает. Анатомия цифровой амнезии Все дело в контекстном окне — ограничении объёма информации, которую модель может удерживать в голове одновременно. Даже самые мощные модели вроде Claude Sonnet 4 с миллионом токенов рано или поздно начинают терять детали. Происходит это из-за архитектурных особенностей. Современные нейросети используют механизм внимания (attention), который статистически смещён к началу и концу текста, игнорируя середину. Это как если бы вы читали книгу, но запоминали только первую и последнюю главы, пропуская всю кульминацию. Результат. После 10-15 обменов сообщениями ИИ начинает: Для журналистов, ведущих расследования, или разработчиков, строящих многошаговые проекты, это становится критичной проблемой. Приходится постоянно копировать контекст вручную или начинать диалог заново. GAM. Память как живой организм Представьте себе двух специалистов, работающих в паре. Первый — это Архивариус (Memorizer). Он молча присутствует на всех ваших разговорах с ИИ, делает краткие пометки (сводки), но главное — сохраняет полную версию каждого диалога в специальное хранилище, называемое Page Store. Это не простая свалка текста. Здесь каждый фрагмент беседы разбивается на логические страницы с метками, как главы в энциклопедии. Второй специалист — это Исследователь (Researcher). Он появляется только тогда, когда вы задаёте сложный вопрос, требующий поиска информации из прошлого. Вместо того чтобы тупо искать по ключевым словам, Researcher действует как настоящий детектив: Это напоминает компиляцию just-in-time в программировании, когда код не оптимизируется заранее потому что это долго, а адаптируется ровно в момент выполнения — быстро и точно. Как GAM память унизила конкурентов Исследователи сравнили GAM с лучшими существующими решениями: GAM победила во всех тестах, особенно там, где информацию нужно было связывать через десятки шагов диалога. Самый показательный эксперимент — бенчмарк RULER. Это тест, где ИИ должен отследить изменения переменных (например, имён или чисел) в очень длинной последовательности текста. GAM показала точность более 90%, в то время как RAG-системы систематически проваливались, теряя связь между далёкими фрагментами. Итог GAM решает проблему, с которой сталкиваются все современные ИИ-ассистенты. А именно - неспособность вести по-настоящему долгий, связный разговор. Это касается не только чат-ботов, но и автономных агентов, которые должны выполнять сложные многошаговые задачи — от написания кода до ведения расследований. Новая архитектура открывает дорогу для ИИ, который не просто отвечает на вопросы, а ведёт диалог, помня всё, что было сказано — даже спустя сотни обменов репликами. Это шаг к настоящему цифровому партнёру, а не просто умному калькулятору.