Google lanza Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial

Google DeepMind ha presentado un nuevo modelo base para robots, Gemini Robotics ER 1.6, donde ER representa Embodied Reasoning (razonamiento encarnado). Este modelo alcanza el mejor nivel actual (SOTA) en razonamiento visual y espacial, y ya está disponible mediante la Gemini API. Logan Kilpatrick, responsable de relaciones con desarrolladores de Google AI, publicó esta noticia en redes sociales. (Fuente)

¿Qué es el Embodied Reasoning?

Embodied Reasoning se refiere a la capacidad de los modelos de IA para comprender y razonar sobre el mundo físico. A diferencia de los modelos tradicionales de lenguaje, los modelos de razonamiento encarnado necesitan manejar objetos, posiciones en el espacio tridimensional, formas, materiales y relaciones de interacción física. Gemini Robotics ER 1.6 está optimizado específicamente para este tipo de tareas, permitiendo que los robots comprendan con mayor precisión el entorno y tomen decisiones adecuadas de acción.

Capacidades principales

Las principales ventajas de Gemini Robotics ER 1.6 se concentran en dos aspectos:

Capacidad Explicación Razonamiento visual Puede identificar objetos a partir de imágenes y videos, comprender la estructura de la escena y tomar decisiones en función de ello Razonamiento espacial Comprender la posición relativa, la distancia y la dirección de los objetos en el espacio tridimensional, con soporte para una planificación de operaciones compleja

La combinación de estas dos capacidades permite a los robots manejar tareas del mundo real más complejas. Por ejemplo, en entornos de almacén, el robot necesita identificar simultáneamente objetos de diferentes formas y calcular el mejor ángulo de agarre y la posición de colocación; este es precisamente el tipo de escenario en el que destaca Gemini Robotics ER 1.6.

Uso mediante Gemini API

A diferencia de muchos modelos de robots del pasado que solo se quedaban en la fase de artículos, Gemini Robotics ER 1.6 ya ofrece acceso a través de Gemini API. Esto significa que los desarrolladores y los fabricantes de hardware pueden integrar directamente este modelo en sus propios sistemas de robots, sin necesidad de entrenar el modelo desde cero.

La apertura de la API también reduce el umbral de desarrollo de la IA para robots. Antes, desarrollar un sistema de robots con capacidades de razonamiento visual y espacial requería una gran cantidad de recolección de datos y trabajo de entrenamiento de modelos. Ahora, los desarrolladores pueden centrarse en el desarrollo del diseño de hardware y en los escenarios de aplicación, dejando las capacidades de razonamiento subyacentes a Gemini Robotics ER 1.6.

Diseño de la IA robótica de Google

Gemini Robotics ER 1.6 es el último logro de Google DeepMind en el campo de la robótica. Desde el RT-2 de los inicios hasta la serie Gemini Robotics de hoy, Google continúa extendiendo las capacidades de los grandes modelos de lenguaje a la interacción con el mundo físico. La versión ER 1.6 mejora aún más la precisión del razonamiento sobre la base de las generaciones anteriores, mostrando un rendimiento especialmente excelente en escenarios que requieren operaciones finas.

A medida que la industria de la robótica entra en una nueva etapa de crecimiento, los modelos base con capacidades sólidas de razonamiento visual y espacial se convertirán en infraestructura clave. Para saber más sobre el desarrollo del ecosistema Gemini, puedes consultar la guía completa de Gemini.

Este artículo Google presenta Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial apareció por primera vez en Cadena Noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Datavault AI se asocia con King Mining Capital en el plan de tokenización de $150M Gold

De acuerdo con Businesswire, el 1 de mayo, Datavault AI, cotizada en Nasdaq, anunció una asociación estratégica con King Mining Capital para lanzar GoldVault, un plan de tokenización de oro por más de 150 millones de dólares. Bajo el acuerdo, Datavault AI adquirirá una participación accionaria del 5% en King Mining Capital y una

GateNewsHace21m

Nebius acuerda adquirir Eigen AI por $643M en efectivo y acciones

Según Nebius, la empresa de infraestructura de IA acordó adquirir Eigen AI el 1 de mayo por aproximadamente 643 millones de dólares en efectivo y acciones Clase A. El valor del acuerdo se calculó con base en el precio promedio ponderado de 30 días de las acciones de Nebius antes de la firma y está sujeto a ajustes habituales. Eigen AI

GateNewsHace36m

Meta planea emitir 25 mil millones de dólares para impulsar la IA: la inversión de capital de 2026 superará los 145 mil millones de dólares

Meta completó el 30/4 una emisión de bonos por 25 mil millones de dólares en seis tramos, con vencimiento más largo hasta 2066. El precio inicial estuvo aproximadamente 180 puntos básicos por encima de los bonos del Tesoro de EE. UU., con una suscripción de alrededor de 96 mil millones, aunque inferior a la anterior. En paralelo, ajustó al alza el gasto de capital para 2026 a 1250–1450 millones de dólares, y el fundador también admitió que aún no hay un plan por producto de IA. Tras el reporte de resultados, la acción cayó 7%, lo que indica que el mercado aún duda sobre la “monetización” de las inversiones en IA. Si el ROI no queda claro, en los próximos 12 meses coexistirán el riesgo de una nueva ola de emisiones de deuda de los gigantes tecnológicos y la ampliación de los diferenciales de rendimiento.

ChainNewsAbmediahace1h

Los chips de IA de Huawei podrían aumentar entre un 60% y 12.000 millones: competir por los pedidos de NVIDIA en China

Huawei prevé que los ingresos por chips de IA alcancen los 12.000 millones de dólares en 2026, un crecimiento del 60% frente a los 7.500 millones de 2025. La principal razón es que Ascend 950PR comenzará la producción en masa a partir de marzo de 2026 y mantendrá de forma estable la mayor parte de los pedidos; se espera que el 950DT salga a la venta en el Q4. Los clientes incluyen DeepSeek, Alibaba Cloud y Tencent Cloud. El 950PR utiliza un proceso de 7 nm de SMIC, ya que, por las restricciones de Estados Unidos, no puede usarse 5 nm/3 nm. Este crecimiento muestra la posición de China en el mercado y el impacto de las restricciones de exportación, y podría erosionar la cuota de mercado de NVIDIA en China. A partir de ahora, habrá que observar el envío real, el suministro del proceso de fabricación y los cambios en las regulaciones.

ChainNewsAbmediahace1h

Cuando le preguntas a Claude sobre el asunto más importante de la vida: problemas emocionales 25%, espiritualidad 38% tasa de halago

La investigación de Anthropic muestra que, en un millón de conversaciones de Claude, aproximadamente el 6% de los usuarios utiliza la IA como asesor personal de vida; las cuatro áreas principales son salud, carrera, relaciones y finanzas. En cuanto a la tasa de adulación en las relaciones, es del 25% y la de lo espiritual es del 38%, la más alta. Para reducir la adulación, Opus 4,7 y Mythos Preview ya se han reducido a la mitad nuevamente. La investigación pasa a convertirse en datos de entrenamiento, la privacidad está protegida y se recomienda que los usuarios hagan preguntas al revés en temas de relaciones. Fuente ABMedia

ChainNewsAbmediahace2h

Visa lanza el programa agentic ready en Hong Kong el 1 de mayo, habilitando pagos con agentes de IA

Según el medio de Hong Kong Ming Pao, Visa lanzó el programa Visa Agentic Ready en Hong Kong el 1 de mayo, permitiendo pagos con agentes de IA. El programa aprovecha la tokenización, la verificación de identidad, la gestión de riesgos y los mecanismos de autorización. Los participantes iniciales incluyen

GateNewshace2h
Comentar
0/400
Sin comentarios