Gate News notícias, em 17 de março, a Mistral AI lançou hoje o Leanstral, o primeiro agente de código aberto projetado especificamente para a ferramenta de verificação formal Lean 4. A inovação central deste modelo reside na capacidade de gerar código AI juntamente com provas formais que podem ser verificadas automaticamente pelo Lean 4, contornando assim o gargalo tradicional de revisão manual na geração de código por IA.
O Leanstral utiliza uma arquitetura esparsa MoE, com um total de 120 bilhões de parâmetros e 6 bilhões de parâmetros ativos, sendo de código aberto sob a licença Apache 2.0, e foi otimizado para treinamento específico no lean-lsp-mcp. Os usuários podem iniciar o Leanstral no Mistral Vibe com o comando /leanstall, sem necessidade de configuração, ou acessá-lo via endpoint API gratuito labs-leanstral-2603, além de poderem fazer o download dos pesos para implantação própria.
A Mistral também lançou simultaneamente uma nova métrica de avaliação, o FLTEval, usando o projeto de formalização do Último Teorema de Fermat na comunidade Lean 4 como cenário de teste. Os resultados de desempenho mostram que: o Leanstral pass@2 alcança uma pontuação de 26,3 com um custo de 36 dólares, superando o Claude Sonnet 4.6, que custa 549 dólares e pontua 23,7; o pass@16 atinge 31,9 pontos com um custo de 290 dólares, 8 pontos acima do Sonnet 8, enquanto o Claude Opus 4.6, que custa 1.650 dólares, consegue atingir 39,6 pontos. Entre os modelos de código aberto, o Qwen3.5-397B-A17B precisa de 4 execuções para alcançar 25,4 pontos, ainda abaixo do desempenho do Leanstral pass@2.