Google сделала рывок в робототехнике. Компания научила роботов читать приборы и самим проверять свою работу

Google подняла планку автономности роботов, выпустив новую модель Gemini Robotics‑ER 1.6 - искусственный интеллект, который превращает роботов из слепых исполнителей в системы, способные видеть, рассуждать и перепроверять свою работу. Теперь робот не просто выполняет команду в духе - «иди туда и возьми то‑то», а анализирует картинку с камеры, строит план действий в реальном пространстве и сам решает, выполнена ли задача или что‑то пошло не так. Ключевая концепция нового подхода - так называемое воплощённое рассуждение (embodied reasoning). Робот перестаёт быть просто набором моторов и датчиков. Он начинает понимать контекст среды, реагировать на препятствия, учитывать нечёткость данных и принимать решения, когда полная информация отсутствует. Это особенно важно в реальных условиях - на заводах, в складах, в лабиринтах труб и оборудования, где пространство загромождено, а обстановка постоянно меняется. Главная новинка Gemini Robotics‑ER 1.6 - умение самостоятельно считывать физические приборы. Роботы теперь могут распознавать датчики давления и уровня, читать аналоговые шкалы со стрелками, считывать цифровые дисплеи и анализировать смотровые стёкла. Такой функционал разрабатывался совместно с Boston Dynamics для их робота Spot, который патрулирует промышленные объекты. Раньше человеку приходилось вручную проверять показания; теперь же робот может заходить в зону, сам считывать приборы и сразу реагировать на отклонения, почти без участия оператора. Точность распознавания выросла с по‑настоящему со слабых 23% до 93%, что делает технологию пригодной для реальной эксплуатации, а не только для демонстраций. Достигается это за счёт так называемого агентного зрения. Это когда модель сама приближает нужный участок изображения, находит стрелку или цифровой индикатор и вычисляет значение, сравнивая его с нормой. Это размыкает цепочку «сними фото - человек посчитает - а потом внесем в систему» и превращает робота в автономного инспектора, который живёт в том же пространстве, что и оборудование. Новая модель также стала лучше работать с несколькими камерами одновременно - например, с верхней камерой на корпусе и с той, что установлена на запястье робота или на манипуляторе. Это помогает не терять объект из виду, даже если часть обзора перекрыта трубами, стеллажами или персоналом. Для робота, который шныряет по заводскому цеху или лазает по лестницам, такая многокамерная осведомлённость - разница между тем, чтобы аккуратно пройти между препятствий, и столкнуться с ними. Google называет Gemini Robotics‑ER 1.6 своей самой безопасной моделью для робототехники на сегодняшний день. Модель лучше распознаёт потенциально опасные ситуации - движение людей, открытые люки, нестандартные объекты, аномальные показания приборов - и учитывает физические ограничения робота, не пытаясь выполнить положение или движение, которое может его сломать или повредить окружение. Для роботов, работающих в энергетике, на трубопроводах, в опасных зонах, это повышает тот самый уровень доверия и позволяет ставить на автоматизацию задач, которые раньше считались слишком рискованными. Модель уже доступна разработчикам через Gemini API и Google AI Studio, что открывает дорогу для сторонних решений: автономных платформ мониторинга, роботизированных систем патрулирования, интеллектуальных инспекторов для промышленных объектов. Разработчики могут подключать Gemini Robotics‑ER 1.6 к своим роботам и создавать системы, которые не только идут по маршруту, но и сами читают приборы, анализируют состояние оборудования и отчётно реагируют на отклонения, не требуя постоянного контроля человека. Для бизнеса и промышленности это означает переход от ручного обхода и слепых роботизированных машин к интеллектуальным агентам, которые живут в реальном пространстве, понимают его и участвуют в принятии решений. Google фактически показывает новую модель взаимодействия с роботами - когда вы формулируете задачу на высоком уровне, а робот сам решает, какую информацию нужно прочитать, как пройти, и как убедиться, что всё сделано правильно. На фоне роста требований к безопасности, эффективности и дефицита кадров такой подход выглядит не как футуристический проект, а как ближайшее будущее робототехники.