Nvidia выпустила Nemotron 3 Nano Omni. Что известно о новой модели

Nvidia снова смещает акцент с железа на сам ИИ-слой. Компания представила Nemotron 3 Nano Omni - открытую мультимодальную модель, которая в одной архитектуре умеет работать с текстом, изображениями, аудио и видео. Для бизнеса это важный сдвиг, потому что вместо связки из нескольких отдельных сервисов теперь можно использовать одну модель для зрения, речи и текста. Модель выглядит компактной только на бумаге. У неё 30 миллиардов параметров, но во время конкретного запроса активируется лишь около 3 миллиардов, а маршрутизация идёт через механизм mixture-of-experts, где каждый токен направляется к шести из 128 "экспертов". Именно это позволяет запускать систему на одном GPU и сохранять высокую скорость без огромных дата-центров. Что умеет Nemotron 3 Nano Omni Nvidia позиционирует модель как единый мультимодальный слой для enterprise-задач. Она работает с документами, видео, аудио, OCR, GUI и транскрипцией, то есть закрывает сценарии, которые раньше требовали нескольких разных моделей. В релизных материалах подчёркивается, что Omnи-версия особенно полезна для агентов, которым нужно одновременно видеть экран, слышать речь и понимать текст. По данным Nvidia, модель лидирует сразу в шести бенчмарках, связанных с документами, видео и аудио, а её текстовая база обучена на 25 триллионах токенов. Контекстное окно достигает 256 тысяч токенов, что делает её удобной для длинных документов и сложных рабочих сценариев. Почему это важно для компаний Практическая ценность здесь в том, что бизнес может заменить несколько разрозненных инструментов одной моделью и одним API-вызовом. Это упрощает архитектуру, снижает число интеграций и делает развёртывание агентных систем заметно быстрее. Nvidia отдельно делает ставку на то, что модель запускается не только в облаке, но и на аппаратуре, показанной на GTC 2026, включая DGX Spark и DGX Station. Иными словами, компания подталкивает рынок к сценарию, где мультимодальный ИИ работает ближе к пользователю, а не только в тяжёлой серверной инфраструктуре. Коммерческая доступность и экосистема Nemotron 3 Nano Omni доступна на Hugging Face под лицензией Nvidia Open Model Agreement, что разрешает коммерческое использование. Кроме того, модель можно запускать через vLLM, Ollama, llama.cpp, TensorRT-LLM, Amazon SageMaker JumpStart и OpenRouter. Это делает её не просто исследовательской демонстрацией, а рабочим инструментом для реального внедрения. Nvidia уже показывает, что это не нишевый эксперимент, а реальны продукт. Среди пользователей и тестирующих компаний называются Foxconn, Palantir, H Company, Dell, DocuSign, Oracle и Infosys. Такой список говорит о том, что модель рассматривают как платформу для бизнес сценариев, а не как лабораторную новинку. Что меняет этот релиз Семейство Nemotron за год скачали больше 50 миллионов раз, и теперь Nvidia делает следующий шаг - пытается стать стандартом не только в инфраструктуре, но и на уровне самих моделей. Это стратегически важный ход. Если компания продаёт GPU, стек и одновременно собственные open-модели, её влияние на рынок становится глубже. На фоне этого конкуренты выглядят менее универсально. Google Gemini Nano закрыт, а Llama от Meta не объединяет аудио в единую архитектуру так, как это делает Nemotron 3 Nano Omni. Поэтому Nvidia выходит не просто в сегмент открытых моделей, а в нишу, где мультимодальность, скорость и коммерческая свобода собраны в одном пакете.