Лондонская лаборатория ИИ Odyssey представила модель, способную в реальном времени преобразовывать видео в интерактивные миры. Лондонская лаборатория искусственного интеллекта Odyssey запустила исследовательскую версию модели, которая превращает обычное видео в интерактивные миры. Интерактивное видео, созданное моделью Odyssey, реагирует на вводы пользователя в реальном времени. Взаимодействовать с ним можно с помощью клавиатуры, телефона или контроллера, создавая иллюзию реального влияния на цифровой мир. Команда проекта описывает этот опыт как «исследование глючного сна — сырого, нестабильного, но, несомненно, нового». В основе технологии лежит так называемая «мировая модель». В отличие от традиционных видеомоделей, которые генерируют целые клипы за один раз, мировые модели работают покадрово, предсказывая, что должно произойти дальше, на основе текущего состояния и действий пользователя. Этот процесс похож на то, как языковые модели предсказывают следующее слово, но является бесконечно более сложным, поскольку речь идет о видеокадрах высокого разрешения. Одной из главных проблем при создании такого видео является сохранение стабильности изображения со временем, так как ошибки могут быстро накапливаться. Для решения этой проблемы Odyssey использует модель, предварительно обученную на общих видеоданных, а затем доработанную на ограниченном наборе сред. Хотя текущая версия является скорее демонстрацией концепции, она открывает перспективы для создания нового формата развлечений, образования и рекламы.