Mistral AI が Leanstral を発表:Lean 4 の最初のオープンソースコードエージェントで、自動的に形式化証明を出力

Gate Newsの報道によると、3月17日、Mistral AIは本日、Leanstralをリリースしました。これは、形式的検証ツールのLean 4専用に設計された、最初のオープンソースコードエージェントです。このモデルの核心的な革新は、AIがコードを生成する際に、Lean 4による自動検証が可能な形式的証明も同時に出力できる点にあり、従来のAIによるコード生成における人間による審査のボトルネックを回避しています。

Leanstralは疎なMoE(Mixture of Experts)アーキテクチャを採用し、総パラメータは1200億、活性化パラメータは60億です。Apache 2.0ライセンスのもとオープンソース化されており、lean-lsp-mcp向けに特化した訓練と最適化も行われています。ユーザーはMistral Vibe内でコマンド /leanstall を使って設定不要で起動できるほか、無料APIエンドポイントlabs-leanstral-2603を通じて呼び出すことも可能です。また、重みをダウンロードして自己展開することもサポートしています。

Mistralは新たな評価基準FLTEvalも同時に公開し、Lean 4コミュニティのフェルマーの大定理の形式化プロジェクトをテストシナリオとしています。性能比較の結果、Leanstralのpass@2は36ドルのコストで26.3点を獲得し、コスト549ドルのClaude Sonnet 4.6(23.7点)を上回っています。pass@16は290ドルのコストで31.9点を獲得し、Sonnet 8を4点リードしています。一方、Claude Opus 4.6は1,650ドルのコストで39.6点に到達します。オープンソースモデルのQwen3.5-397B-A17Bは4回の実行で25.4点に達し、Leanstralのpass@2のパフォーマンスを下回っています。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし