Gate News informa, el 17 de marzo, Mistral AI anunció hoy el lanzamiento de Leanstral, el primer agente de código abierto diseñado específicamente para la herramienta de verificación formal Lean 4. La innovación principal de este modelo radica en que, además de generar código, puede producir pruebas formales verificables automáticamente por Lean 4, lo que evita el cuello de botella de la revisión manual en la generación de código por IA.
Leanstral utiliza una arquitectura sparse MoE, con un total de 120 mil millones de parámetros y 6 mil millones de parámetros activos, y se ha abierto bajo la licencia Apache 2.0. Además, ha sido optimizado para entrenamiento específico en lean-lsp-mcp. Los usuarios pueden iniciarlo sin configuración previa en Mistral Vibe mediante el comando /leanstall, o acceder a través del endpoint API gratuito labs-leanstral-2603, y también es posible descargar los pesos para desplegarlo por cuenta propia.
Mistral también lanzó simultáneamente un nuevo estándar de evaluación, FLTEval, que utiliza el proyecto de formalización del teorema de Fermat en la comunidad de Lean 4 como escenario de prueba. Los resultados comparativos muestran que: Leanstral pass@2 con un costo de 36 dólares obtiene una puntuación de 26.3, superando a Claude Sonnet 4.6, que cuesta 549 dólares y obtiene 23.7; en la prueba pass@16, con un costo de 290 dólares, alcanza 31.9 puntos, 8 puntos por encima de Sonnet; mientras que Claude Opus 4.6, que cuesta 1,650 dólares, logra 39.6. Entre los modelos de código abierto, Qwen3.5-397B-A17B necesita ejecutarse 4 veces para alcanzar 25.4, aún por debajo del rendimiento de Leanstral en pass@2.