Google lanza Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial

Google DeepMind ha presentado un nuevo modelo base para robots, Gemini Robotics ER 1.6, donde ER representa Embodied Reasoning (razonamiento encarnado). Este modelo alcanza el mejor nivel actual (SOTA) en razonamiento visual y espacial, y ya está disponible mediante la Gemini API. Logan Kilpatrick, responsable de relaciones con desarrolladores de Google AI, publicó esta noticia en redes sociales. (Fuente)

¿Qué es el Embodied Reasoning?

Embodied Reasoning se refiere a la capacidad de los modelos de IA para comprender y razonar sobre el mundo físico. A diferencia de los modelos tradicionales de lenguaje, los modelos de razonamiento encarnado necesitan manejar objetos, posiciones en el espacio tridimensional, formas, materiales y relaciones de interacción física. Gemini Robotics ER 1.6 está optimizado específicamente para este tipo de tareas, permitiendo que los robots comprendan con mayor precisión el entorno y tomen decisiones adecuadas de acción.

Capacidades principales

Las principales ventajas de Gemini Robotics ER 1.6 se concentran en dos aspectos:

Capacidad Explicación Razonamiento visual Puede identificar objetos a partir de imágenes y videos, comprender la estructura de la escena y tomar decisiones en función de ello Razonamiento espacial Comprender la posición relativa, la distancia y la dirección de los objetos en el espacio tridimensional, con soporte para una planificación de operaciones compleja

La combinación de estas dos capacidades permite a los robots manejar tareas del mundo real más complejas. Por ejemplo, en entornos de almacén, el robot necesita identificar simultáneamente objetos de diferentes formas y calcular el mejor ángulo de agarre y la posición de colocación; este es precisamente el tipo de escenario en el que destaca Gemini Robotics ER 1.6.

Uso mediante Gemini API

A diferencia de muchos modelos de robots del pasado que solo se quedaban en la fase de artículos, Gemini Robotics ER 1.6 ya ofrece acceso a través de Gemini API. Esto significa que los desarrolladores y los fabricantes de hardware pueden integrar directamente este modelo en sus propios sistemas de robots, sin necesidad de entrenar el modelo desde cero.

La apertura de la API también reduce el umbral de desarrollo de la IA para robots. Antes, desarrollar un sistema de robots con capacidades de razonamiento visual y espacial requería una gran cantidad de recolección de datos y trabajo de entrenamiento de modelos. Ahora, los desarrolladores pueden centrarse en el desarrollo del diseño de hardware y en los escenarios de aplicación, dejando las capacidades de razonamiento subyacentes a Gemini Robotics ER 1.6.

Diseño de la IA robótica de Google

Gemini Robotics ER 1.6 es el último logro de Google DeepMind en el campo de la robótica. Desde el RT-2 de los inicios hasta la serie Gemini Robotics de hoy, Google continúa extendiendo las capacidades de los grandes modelos de lenguaje a la interacción con el mundo físico. La versión ER 1.6 mejora aún más la precisión del razonamiento sobre la base de las generaciones anteriores, mostrando un rendimiento especialmente excelente en escenarios que requieren operaciones finas.

A medida que la industria de la robótica entra en una nueva etapa de crecimiento, los modelos base con capacidades sólidas de razonamiento visual y espacial se convertirán en infraestructura clave. Para saber más sobre el desarrollo del ecosistema Gemini, puedes consultar la guía completa de Gemini.

Este artículo Google presenta Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial apareció por primera vez en Cadena Noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los usuarios activos mensuales de OpenAI Codex alcanzan 4 millones en menos de dos semanas

OpenAI Codex alcanza 4 millones de MAUs, anunciado por Sottiaux y Altman; el salto se produjo en menos de dos semanas desde 3 millones, y los límites de velocidad se restablecieron en todos los niveles para celebrarlo. OpenAI Codex llegó a 4 millones de usuarios activos mensuales en menos de dos semanas desde que alcanzó los 3 millones, según declaraciones de ejecutivos de OpenAI. Para conmemorar el hito, los límites de velocidad en todos los niveles se restablecieron.

GateNewsHace44m

Dos startups de IA sudafricanas seleccionadas para la clase 10 de Google for Startups Accelerator Africa

Dos startups sudafricanas, Loop y Vambo AI, se unen a la 10.ª cohorte de Google Accelerator Africa desde 2.600 aplicaciones; Loop mejora la movilidad/pagos, Vambo AI habilita IA multilingüe; el programa se ejecuta de abril a junio de 2026 con mentores y talleres de IA. Resumen: Dos startups sudafricanas, Loop y Vambo AI, han sido seleccionadas para la 10.ª cohorte del Google for Startups Accelerator Africa, elegidas de unas 2.600 solicitudes y una de las 15 participantes africanas. Loop digitaliza la movilidad y los pagos, mientras que Vambo AI ofrece una infraestructura de IA multilingüe para traducción, voz y IA generativa en lenguas africanas. El programa de 2026 se ejecuta del 13 de abril al 19 de junio y ofrece mentoría y talleres prácticos centrados en IA/ML. Desde 2018, el acelerador ha apoyado a 106 startups de 17 países africanos, ayudándolas a recaudar más de $263 millones y a crear más de 2.800 empleos.

GateNewshace1h

La lista de Forbes AI 50 incluye 20 empresas nuevas; OpenAI y Anthropic capturan el 80% de la financiación total

Mensaje de Gate News, 21 de abril — Forbes publicó su lista de IA 50, edición vigésima octava de 2026, que incluye 20 empresas recién incorporadas. OpenAI y Anthropic continúan liderando el ranking, atrayendo capital sustancial de destacados capitalistas de riesgo de Silicon Valley y grandes empresas tecnológicas. La financiación combinada para todas las empresas de la lista

GateNewshace2h

Zi变量 presenta el modelo de IA encarnada WALL-B; los robots llegarán a hogares reales en 35 días

Mensaje de Gate News, 21 de abril — Zibianliang (自变量), una empresa china de robótica, celebró una conferencia de prensa el 21 de abril para presentar su próximo modelo base de IA encarnada de nueva generación, WALL-B. La compañía anunció que los robots impulsados por WALL-B entrarán en hogares reales en 35 días. Según el cofundador de Zibianliang

GateNewshace2h

OpenAI Prepara la Función de Agentes para ChatGPT, Con Nombre en Clave Hermes

Mensaje de Gate News, 21 de abril — OpenAI está preparando una nueva función de Agentes para ChatGPT, con nombre en clave "Hermes," según Tibor Blaho, que supervisa las actualizaciones de productos de IA. La función incluye un nuevo generador de agentes llamado "studio" que permite a los usuarios crear agentes a partir de plantillas, programar ejecuciones, y

GateNewshace3h

SpaceX inicia la gira de OPI con reuniones con analistas en Starbase y Memphis

Mensaje de Gate News, 21 de abril: SpaceX ha comenzado esta semana su gira previa a la OPI, organizando reuniones privadas para los principales analistas de Wall Street de los sectores aeroespacial y tecnológico en Texas y Tennessee mientras avanza hacia un debut en bolsa a finales de junio. La empresa apunta a una recaudación de $75 mil millones, con

GateNewshace3h
Comentar
0/400
Sin comentarios