Исследователи из Университета Цинхуа представили новую модель Droplet3D, которая способна создавать трёхмерные объекты и сцены с высокой реалистичностью. Главное отличие от конкурентов — обучение на видео, а не на статичных изображениях. 🎥 Почему обучение на видео это — прорыв Обычные генеративные модели 3D-объектов чаще всего учатся на наборе отдельных картинок, что делает их слеповатыми к реальной структуре объектов. Droplet3D использует видеоданные и извлекает: В результате получаются: 📦 Датасет Droplet3D-4M — фундамент модели Для обучения создали крупнейший на сегодня набор данных Droplet3D-4M: Кроме того, на этих же данных обучили дополнительную модель DropletVideo, которая помогает системе лучше понимать движение и динамику в сценах. 🔧 Что умеет Droplet3D Droplet3D может генерировать: Эта гибкость делает систему полезной для: 🌍 Почему это важно Создание 3D-контента традиционно требует времени и ручной работы, но такие модели, как Droplet3D, способны ускорить процесс в разы. Если раньше 3D-художнику нужно было неделями лепить модель, теперь у него будет время и на кофе, и на вдохновение. 🏁 Итог Droplet3D — это шаг к новой эре генеративного 3D-контента: Похоже, в будущем мы сможем описать словами любую сцену — и получить её в виде готового 3D-проекта.