Компания Google Research представила любопытную разработку — агента под названием PASTA. Это не просто модель для генерации картинок по тексту (как MidJourney или Stable Diffusion), а настоящий собеседник-художник, который создаёт изображения постепенно, уточняя детали у пользователя. 🍝 Почему PASTA? Название звучит аппетитно, но это аббревиатура - Preference Adaptive and Sequential Text-to-image Agent. Переводя на простой язык - агент для пошаговой генерации картинок, подстраивающийся под предпочтения пользователя. 🖌️ Как это работает? Обычная проблема при работе с нейросетями для картинок — нужно долго и мучительно подбирать промпты. Пишешь одно — получается не то, корректируешь, снова не то, и так по кругу. PASTA решает эту головную боль: Проще говоря, не вы подстраиваетесь под капризы ИИ, а он подстраивается под вас. 📚 На чём его учили? Обычно такие модели обучают на паре «запрос + готовая картинка». Но PASTA пошёл дальше. Его тренировали на целых сессиях пользователей. То есть видно, как человек менял запросы, какие изображения отбраковывал, а какие — выбирал. Эти данные собрали в отдельный датасет. Чтобы доработать обучение, учёные подключили ещё два вспомогательных инструмента: С их помощью сгенерировали ещё около 30 тысяч сессий, которые пошли в обучение финальной версии PASTA. 🎮 Немного про обучение Модель обучали методом RL (reinforcement learning — обучение с подкреплением). Если объяснять просто - ИИ пробует разные варианты и получает награду, если человек доволен результатом. Использовали конкретный подход — IQL (Implicit Q-learning). Его особенность в том, что агент учится не ради одного красивого кадра, а чтобы пользователь остался доволен всей цепочкой итераций. То есть важно не только последнее фото, а весь процесс совместного творчества. 😕 Можно ли попробовать? Увы, пока нет. PASTA — чисто исследовательский проект. Google показала демо, но открытого доступа пока что не дала. Возможно, в будущем идеи этой разработки перекочуют в продукты для широкой публики. ✨ Итог PASTA — это шаг от генераторов картинок к полноценным ИИ-художникам-напарникам. Он не заменяет воображение человека, а работает вместе с ним, постепенно уточняя и улучшая результат.