Gate News повідомляє, що 17 березня Mistral AI випустила Leanstral — перший відкритий агент з відкритим кодом, спеціально розроблений для інструменту формальної верифікації Lean 4. Основна інновація цієї моделі полягає в тому, що вона може одночасно генерувати код і виводити формальні доведення, які автоматично перевіряються Lean 4, обходячи традиційний людський контроль у процесі генерації коду AI.
Leanstral використовує розподілену архітектуру MoE з розрідженими шарами, має 120 мільярдів параметрів і 6 мільярдів активних параметрів, відкритий за ліцензією Apache 2.0, і пройшов спеціальне навчання для lean-lsp-mcp. Користувачі можуть запускати його без налаштувань через команду /leanstall у Mistral Vibe або викликати через безкоштовний API-ендпойнт labs-leanstral-2603, а також мають можливість завантажити ваги для самостійного розгортання.
Mistral одночасно випустила новий бенчмарк FLTEval для оцінки, який базується на формальному проекті доведення теореми Ферма у спільноті Lean 4. Порівняльні результати показують: Leanstral pass@2 коштує 36 доларів і має оцінку 26.3, що перевищує Claude Sonnet 4.6 з вартістю 549 доларів і оцінкою 23.7; pass@16 коштує 290 доларів і має оцінку 31.9, що на 8 балів вище за Sonnet, тоді як Claude Opus 4.6 за 1650 доларів досягає 39.6 балів. У відкритих моделях Qwen3.5-397B-A17B потрібно 4 запуску для досягнення 25.4 балів, що все ще нижче за показники Leanstral pass@2.