Сегодня искусственный интеллект помогает врачам ставить диагнозы, учёным делать открытия, а школьникам — решать задачи. Но есть большая проблема - мы не понимаем, почему нейросеть даёт тот или иной ответ. Она как чёрный ящик — работает, но что внутри происходит, никто толком не знает. Казалось бы, можно просто спросить у модели: Объясни, как ты думала. Но такие объяснения часто получаются слишком запутанными или поверхностными и в них мало толку. Почему все так сложно OpenAI объясняет, что когда нейросеть уже обучена, её мозг — это огромная путаница из миллиардов связей. Каждое решение размазано по миллионам параметров, как краска по холсту. Разобрать эту паутину почти невозможно. Что придумали в OpenAI Вместо того чтобы пытаться распутать уже готовую сложную сеть, они решили сразу строить простые и понятные модели. Такие сети называются разреженными. Представьте обычную нейросеть как густой лес, где все деревья переплетены ветками. В разреженной сети исследователи оставили только главные дорожки, а всё лишнее убрали. Теперь в модели каждый нейрон связан не с тысячами других, а всего с несколькими. Так намного проще увидеть, как именно работает сеть. Что это даёт Теперь для любой задачи можно найти маленькую цепочку внутри модели — её называют circuit (контур). Это как найти конкретную деталь в машине, которая отвечает за определённую функцию. Например, исследователи показали, как нейросеть правильно закрывает кавычки. Если строка началась с одинарной кавычки, она закроется такой же. Оказалось, что за это отвечает всего несколько связей внутри модели — всё очень конкретно и понятно. Если даже такая простая задача имеет свою маленькую схему, представьте, что можно найти в сложных вычислениях — например, когда сеть решает задачи по математике или пишет код. Интересная закономерность Чем больше и реже модель (то есть чем меньше связей между нейронами), тем проще и понятнее получаются эти схемы. Звучит логично! Есть ли минусы Да. Пока что никто не будет делать огромные нейросети специально разреженными — это дорого, долго и неэффективно. Такие модели работают намного медленнее обычных. Но если в будущем учёные научатся находить такие простые цепочки в уже готовых больших моделях (вроде GPT-4 или GPT-5), это изменит всю индустрию. Мы наконец сможем не просто пользоваться ИИ, но и понимать его.